https://frosthead.com

Google'i uus AI võib võita inimeste meistrid mänguhetkel

Peaaegu täpselt 20 aastat tagasi edestas IBM-i arvuti Deep Blue malemaailmameistrit Garry Kasparovit omal käel. See oli pöördeline hetk tehisintellekti ajaloos - esimene kord, kui arvuti oli inimese malemeistri alistanud.

Kuid kõigile, kes nägid seda märgina, et AI-revolutsioon on käimas, ütlesid kriitikud, et “mitte nii kiiresti”. Nad ütlesid, et malet on suhteliselt lihtne murda. AI tõeline test oleks arvuti, mis suudaks Go meistrivõistlustel inimmeistri üle lüüa - keerukas iidne Hiina strateegiamäng hõlmas intuitsiooni ja arusaamist esteetikast. Ja see päev oli varsti ebatõenäoline.

'' Võib kuluda sada aastat, enne kui arvuti peksab inimesi Go juures - võib-olla isegi kauem, '' rääkis astrofüüsik ja Go fänn Piet Hut 1997. aastal New York Timesile . '' Kui mõistlikult intelligentne inimene õppis Go mängima, paar kuud suutis ta lüüa kõik olemasolevad arvutiprogrammid. Sa ei pea olema Kasparov. ''

Kui arvuti lüüa Go meister, Times otsustas, oleks see "märk sellest, et tehisintellekt on tõesti hakanud muutuma sama heaks kui päris asi."

Noh, inimesed, see hetk on kätte jõudnud, umbes sada aastat enne tähtaega. Google'i DeepMind tehisintellekti meeskonna välja töötatud programm AlphaGo on alistanud Euroopa Go meister Fan Hui viigiks 0.

Tulemustest teatati täna ajakirjas Nature .

Go algab lihtsalt 19-ruudulise ruudustiku ja kahe värvi tükkidega (nn kividega), ühe mängija jaoks must, teise jaoks valge. Mängijad kordamööda panevad kivid tühjadele ristmikele - kahe võrejoone ristumispunkti. Aeglaselt proovib iga mängija ümbritseda teise mängija kive, mille järel nad kinni võetakse ja teisaldatakse laualt. Laual võib igal ajal olla mitu ümbrist ja sageli on keeruline öelda, kes kavatseb keda tabada.

“Go-mängu on juba ammu peetud tehisintellekti jaoks klassikalistest mängudest kõige keerukamaks, kuna sellel on tohutu otsinguruum ning raskused laudade positsioonide ja käikude hindamisel, ” kirjutavad paberi autorid.

AlphaGo “õpib” läbi nii inimekspertide koolituse kui ka harjutamise kaudu iseendaga mängides. Kuna Go-l on liiga palju võimalikke käike, et arvuti järgmise otsuse langetamisel lihtsalt andmeid krõbistada - see on peamine kleepumispunkt varasematele Go-playing AI-püüdlustele - kasutab AlphaGo selle asemel kahte erinevat “sügavat närvivõrku”. Ühte võrku nimetatakse „Poliitikavõrk” - see annab arvutile käputäis paljutõotavaid samme, mida varasemate mängude põhjal kaaluda, nii et see ei pea igal võimalikul liigutamisel läbi lööma. Väärtusvõrk vähendab otsingu sügavust - see tähendab, et selle asemel, et otsida mängu lõpuni sadade käikude kaugusel, võib programm oma valikute tegemiseks vaadata vaid käputäis käike.

See on suur asi: lisaks AI võimete proovile panemisele on Go-playing programmi loomine, mis suudab peksma inimmeistreid, olnud ka võidurelvastumise võistlus. Aastaid on erinevad programmeerijad ja ettevõtted kutsunud üles looma Deep Blue Go versiooni. Mõni on lähedale jõudnud. Prantsuse programm nimega Crazy Stone peksis 2013. aastal viiekordse Jaapani Go meister Yoshio Ishida, ehkki Crazy Stone sai händikäpi (AlphaGo polnud) ja Ishidat ei peetud mitmekümne aasta jooksul tipptegijaks. Siiani on AlphaGo teisi Go-programme peksnud 99, 8 protsenti ajast.

Mõni tund enne seda, kui Google nende uudised ametlikult avaldas, loobus Facebook, keda kahtlemata peksmisele peksis, teade, et nende AI on "lähestikku jõudmas" inimeste Go tšempionide peksmisele.

Miks peetakse Go-d nii võimsaks AI-testiks? Liiga taandav oleks öelda, et Go on lihtsam kui male.

"Mäng kajastab mängijate oskusi rünnaku ja kaitse tasakaalustamisel, kivide efektiivsel tööl hoidmisel, muutlikele olukordadele reageerimisel paindlikkuse säilitamisel, ajastamisel, vastase tugevate ja nõrkade külgede täpsel analüüsimisel ja selgitamisel, " selgitab British Go Association oma veebisait, Go keeruka kaebuse arvestamine.

Kui males on keskmiselt 35 seaduslikku käiku pöörde kohta, siis Go-l on keskmiselt 200. Ja kuigi neid on umbes 10⁴³ malelaua võimalikud konfiguratsioonid, Go-tahvlil on vähemalt 2, 08 X 10¹⁷⁰ - rohkem konfiguratsioone kui universumis on aatomeid. Erinevalt malest, kus laual olevate tükkide arv on väga hea näitaja selle kohta, kes võidab, on väga raske teada, kes Go-s ees on.

"Pole head heuristilisi järeldusi, kas positsioon on mängija jaoks hea või halb, " selgitab Briti Go Assotsiatsiooni president Jon Diamond. „See on osaliselt analüüs ja osaliselt mustrituvastus. Hindate tahvlit mingil keerulisel viisil, me ei ole arvutites replikatsiooni välja töötanud. ”

Diamond ütleb, et ta oli AlphaGo õnnestumisest kuuldes üsna üllatunud. "Ma arvan, et ma ei oodanud seda umbes viis kuni kümme aastat ausalt, " ütleb ta. "Nad on teinud head tööd."

AlphaGo edu võib tähendada, et oleme palju lähedasemad, kui seni arvati, et meil on AI-sid, mis suudavad esineda inimtasandil ka muudes valdkondades. AlphaGo võib olla "hüppelaud" muud tüüpi AI-dele, ütlevad selle arendajad. AI, mis suudab Go võitmiseks teha keerukaid, intuitiivselt näivaid otsuseid, võiks arendajate sõnul näiteks diagnoosida haige patsiendi ja määrata individuaalse ravikuuri.

Märtsis proovib AlphaGo oma visadust uuesti proovida, kui minnakse peaga Korea koondise Lee Sedoliga, keda peetakse maailma parimaks Go-mängijaks.

"Sõltumata tulemusest saab see tähendusliku sündmuse baduk (Go) ajaloos, " ütleb Lee pressiteates. "Ma kuulsin, et Google DeepMindi AI on üllatavalt tugev ja tugevnev, kuid olen kindel, et suudan vähemalt seekord võita."

Google'i uus AI võib võita inimeste meistrid mänguhetkel