https://frosthead.com

Arvutid õpivad, kuidas üksteisele uusi oskusi õpetada

Me ütleme alati, et me ei hakka enam robotite apokalüpsist rääkima, sest see on omamoodi rumal tropp, mida kindlasti kunagi varem ei juhtu. Ja siis lähevad arvutiteadlased ja teevad midagi sellist ...

John Timmeri sõnul Ars Technicale õpetasid arvutiteadlased mitte ainult arvutit, kuidas teeselda snaiprite jahipidamist, vaid õpetasid seda, kuidas õpetada ennast paremini oma ülesande täitmiseks. JA. Nad õpetasid oma uuele ekspert-jahile-snaiprile-botile, kuidas õpetada teisi arvuteid selle oskuse kiiremaks arendamiseks.

Kombineerige see teise käimasoleva projektiga, et õpetada robotitele, kuidas üksteisega suhelda ja me ehitame põhimõtteliselt gete või neid asju maatriksist või mida iganes.

StarCraft jaoks oli mäng üles seatud nii, et katet kasutades ja kaugelt tulistades võis inimene Zergi enne tapmist välja viia. Et inimene pelgalt varjamise eest ei püsiks, langes mängija skoor aja jooksul - mida kauem mängu kulus, seda halvem oli skoor. Algoritm hindas enne järgmiste toimingute valimist kokku kuut tegurit, nagu vahemaa ja suhteline tervis.

Iseõppides hakkaksid arvutid Zergi vältima. Lõpuks teevad nad omamoodi pöördvõrdelise Zergi-kiirustamise, tapavad end kiiresti enne, kui kogu tulemus on haihtunud. Lõpuks, pärast umbes 200 koolitust, hakkasid arvutid nuusutamise idee pähe ja hakkasid Zergi edukalt tapma, ehkki jõudlus oli ikka üsna ebakindel.

Kui arvutid pidid välja mõtlema, kuidas seda StarCraft'i modifitseeritud versiooni ise mängida, nägid nad läbi mitmeid ebaõnnestunud strateegiaid. Kui arvuti, kes (kes?) Oli juba nuputamisstrateegiad välja mõelnud, paaritati uustulnukaga, lõigati õppimiskõver drastiliselt maha.

Pärast teadlastega rääkimist ütleb Timmer, et see pole roboti apokalüpsise algus. Kuid tõesti, kes peab ütlema, et ta pole silinder.

Arvutid õpivad, kuidas üksteisele uusi oskusi õpetada