https://frosthead.com

Turingi test mõõdab midagi, kuid see pole “intelligentsus”

Alan Turing, üks arvutiajastu isadest, oli erakordselt tark mees. Tegelikult nii tark, et mõistis, et mõiste “masinluure” oli peaaegu mõttetu. Parem oleks tema sõnul rääkida sellest, mida masin tegelikult teha saab: kas see võib rääkida? Kas see võib vestlust hoida? Vähemalt seda saame proovida uurida. Turing pakkus lõpuks välja nn Turingi testi: kui kohtunik ei saa öelda, milline kahest peidetud olemist on inimene ja milline on tehislik, siis on masin testi "sooritanud" - see on täpselt see, mida väidetavalt juhtus see möödunud laupäeval Londonis.

Seotud sisu

  • Räniorul on tänu sellele tehnilisele geenusele, mida te pole kunagi kuulnud, edu
  • Alan Turingi 60-aastane ennustus looduses esinevate mustrite kohta on tõene

"Me teame ... uhkusega, et kuulutasime Alan Turingi testi esimest korda läbi, " ütles üks korraldajatest, Kevin Warwick Readingi ülikoolist, kui tulemused välja kuulutati. Võitnud vestlusprogramm kannab nime “Eugene Goostman”, arvutiprogramm, mis jäljendab 13-aastase Ukraina poisi isiksust. Laupäevasel üritusel, mis toimus kuningliku seltsi kontorites Londonis Turingi surma 60. aastapäeval, õnnestus “Eugene” veenda 33 protsenti kohtunikest, et see oli inimlik. (Turing, homoseksuaal, mõisteti 1952. aastal süüdi tõsises süütuses ja talle määrati väitekokkuleppe raames hormonaalne ravi. Kaks aastat hiljem suri ta nähtavas enesetappus tsüaniidimürgituse tagajärjel.)

Kuid sõna ettevaatusega on korras. „Intelligentsus“ on alati olnud libe teema ja eriti Turingi test on pikka aega vaielnud vaidluste üle. Turing kirjeldas, kuidas see toimiks 1950. aasta artiklis pealkirjaga “Arvutustehnika ja intelligentsus”. Ta võttis idee traditsioonilisest viktoriaanlikust saalimängust, kus proovite aru saada, kas kardina taha peidetud inimene on mees või naine, lihtsalt esitades küsimusi. (Vastused küsimustele tuli kirja panna, sest hääl oleks kingitus.) Turingi versioon toimiks järgmiselt: teil oleks kohtunik, kes istuks kahe kardina ees ja ei teaks, mis nende taga on. . Ühe kardina taga on inimene; teise taga on arvuti. Kohtunik võib esitada küsimusi kahe peidetud üksuse kohta. Vastuste põhjal proovib kohtunik välja selgitada, kas peidetud üksus on inimene või masin. (Turing nägi, et vestlust vahendavad teletüüpmasinad; tänapäeval võime kasutada mis tahes elektroonilisi, tekstipõhiseid liideseid, näiteks Interneti-jututubades kasutatavaid või kiirsõnumeid.)

Turing spekuleeris, et aastaks 2000 ei ole keskmisel ülekuulajal enam kui 70 protsenti võimalust õiget tuvastamist teha - see tähendab, et arvutiprogrammid stimuleeriksid kohtunikke 30 protsenti ajast - pärast viieminutilist ülekuulamist. Viis minutit on oluline. Turing ei rääkinud ajapiirangust kui testi lahutamatust osast ja võiks väita, et selleks, et masin testi tõesti läbiks, peaks ta suutma hakkama saada igasuguse küsitlemisega. Eeldatavasti oli viieminutilised kriteeriumid meelevaldne, kuid vajalik piir. Aasta 2000 tuli ja läks ning vestlusbotid pidid vaid edusamme peatama. (Kainema hetkega, vastates BBC intervjueerija 1952. aastal esitatud küsimusele, ütles Turing, et enne masina testi läbimist on möödas 100 aastat.)

2012. aastal olin kohtunik “Turingi katsemaratonil”, mis on kõigi aegade suurim Turingi testide komplekt korraga; see toimus Inglismaal Bletchley pargis, Turingi elutähtsa koodimurdmise töö saidil Teise maailmasõja lõpuaastatel. (Selle korraldas sama meeskond, kes korraldas laupäevase ürituse, ja ka sel korral oli võitjaks Eugene'i varasem versioon.) Laupäevase ürituse ülesehitus oli sama nagu 2012. aastal: kohtunikud kirjutasid oma küsimused arvutisse., siis ootas, kuni vastused ilmuvad nende ekraanidele; vestlusbotid koos varjatud inimestega olid teises ruumis, silmist väljas.

Esimese asjana sain hüperteadlikuks, et kui oled Turingi testi kohtunik, möödub viis minutit üsna kiiresti. Ja mida lühem on vestlus, seda suurem on arvuti eelis; mida pikem ülekuulamine, seda suurem on tõenäosus, et arvuti annab ennast ära. Mulle meeldib seda nimetada mannekeeni efektiks: kas olete kunagi kaubamaja mannekeeni ees vabandust palunud, eeldades, et olete just põrunud elusana elavaks inimeseks? Kui kohtumine kestab vaid murdosa sekundist, kui näete teist suunda, võite ette kujutada, et harjasite end lihtsalt inimese vastu. Mida pikem kohtumine, seda ilmsem on maneeži mannekeen.

Sama on jututubadega. Helovahetus ei paljasta midagi - aga mida kaugemale sa sellesse süvened, seda rohkem probleeme tekib. Minu arvates on vestlusobotid altid teema muutmiseks ilma põhjuseta. Sageli ei oska nad lihtsatele küsimustele vastata. Ebaselge kõlamise ohu korral ei kõla nad lihtsalt inimesena . Ühes oma 2012. aasta vestluses kirjutasin ma lihtsa nalja - ja üksus, kellega vestlesin, muutis selle teema kohe hamburgeriteks. (Arvutiteadlasel Scott Aaronsonil oli hiljuti samasugune kogemus, kui ta vestles Eugene'iga boti veebisaidi kaudu. Aaronson küsis Eugene'ilt, mitu jalga kaamelil on; see vastas: "Midagi vahemikus 2 kuni 4. Võib-olla kolm? :-)))" Hiljem, kui Aaronson küsis, mitu jalga sipelgal on, köhatas Eugene täpselt sama vastuse, kolmik-naeratuse ja kõik.)

Pange tähele, et Eugene ei jäljenda emakeelt emakeelt kõnelevat täiskasvanut; see teeskleb, et on noor ja pisut flippantne Ukraina teismeline, kes räägib suhteliselt heas (kuid mitte ideaalses) inglise keeles. Nagu ütles üks programmi arendajatest Vladimir Veselov Mashable.com-ile : “Veetsime palju aega, et arendada välja usutava isiksusega tegelaskuju.” Ehkki Eugene tegeleb ükskõik kellega mis tahes teemal, teeb tema vanus “täiesti mõistlikuks, et ta seda ei tee. 'Ei tea kõike.' Eugene ei tule kohe välja ja teatab oma vanusest ja rahvusest; kuid ta paljastab selle, kui seda küsitakse - ja lõpptulemus võib olla kohtunike teatav leebus, eriti inglise keele grammatika ja sõnakasutuse osas. (Ma eeldan, et suurem osa laupäeva kohtunikest oli inglise keelt emakeelena kõnelevad isikud, kuigi ma ei tea seda kindlalt.) Tabelid oleks tõenäoliselt pööratud, kui Eugene kohtunikuna kohtas kunagi ukraina keelt emakeelt kõnelevat isikut.

Püüd kõneleva masina ehitamiseks rõhutab, kui keeruline on keel. See ei ole ainult rääkimise küsimus - peate midagi rääkima, ja see, mida teie ütlete, peab olema loogiline - ja see peab olema mõistlik selle taustal, mida teine ​​inimene just ütles. Meie jaoks on see lihtne; arvutite jaoks mitte nii palju. Ja seepärast toetuvad vestlusprogrammid mitmesugustele trikkidele: meelde jäetud megabaitide vastuste meeldejätmine või Interneti sirvimine dialoogi pidamiseks, mis võib lähendada vestlust, mida nad praegu kasutavad. Teisisõnu, mida masinal puudub intelligentsus, see võib olla võimeline korvama töötlemata arvutusvõimsusega. Seetõttu võivad Google või Siri (iPhone'i isiklik abistaja) meie jaoks nii nutikad tunduda: Siril ei pruugi olla "mõistust", kuid tal on juurdepääs nii ulatuslikule teabebaasile, see võib käituda nii, nagu teeb. Just selline julma jõu lähenemisviis võimaldas IBM-i Watsonil Jeopardy 's võita ! aastal 2011.

Kõik see tõstatab olulise küsimuse: mis on täpselt see, mida Turingi test mõõdab? Mõned kriitikud on väitnud, et tegemist on pigem trikkidega, mitte intelligentsusega. New Yorker.com-i kirjutav NYU psühholoog Gary Marcus väidab, et Eugene õnnestub, "viies ellu mitmeid programme, mis on mõeldud programmi piirangute varjamiseks." Montreali Quebeci ülikooli psühholoog ja arvutiteadlane Steven Harnad oli veelgi. skeptiline, öeldes The Guardianile, et väita, et Eugene oli Turingi testi sooritanud, oli "täielik jama". (Tema uskudes oli Turing sellest küsimusest hästi teadlik; ta nimetas oma ideed jäljendusmänguks ja rääkis intelligentsusest vaid säästlikult.) Veelgi kohmetumalt sunnib arvuti erinevalt inimesest petma. “Turingi test on tõesti eduka valetaja olemise proovikivi, ” ütles Florida Pensacola inimeste ja masinate tunnetuse instituudi arvutiteadlane Pat Hayes pärast 2012. aasta Turingi katsemaratoni mulle. "Kui teil oleks midagi, mis tõesti Turingi jäljendusmängust mööduks, oleks see väga edukas" inimlik miimika "."

Teine võtmepunkt on „inimene”: kas pole võimalik, et maailmas on ka muud liiki intelligentsust, peale meie liikide kuvatava? Tõeliselt intelligentsel masinal oleks lugematu arv praktilisi rakendusi, kuid miks keskenduda rohkemate “inimeste” loomisele? Lõppude lõpuks on meil juba palju inimesi. Nagu keeleteadlane Noam Chomsky on märkinud, ei nõua me veealuse liikumisega masina ehitamisel seda, et see “ujuks” - ja allveelaev on selle saavutamatuse korral vähemalt selline saavutus.

Jah, Eugene on muljetavaldav, vähemalt väikeste pursketega. Ja isegi komistavad isegi parimad vestlusbotid küsimuste peale, millega laps, kes on poole vähem kui Jevgeni teesklusvanus, saaks imelihtne hakkama. Võib-olla pole üllatav, et enamik AI teadlasi kulutab Turingi testi jaoks vähe aega kinnisideeks. Masinluure liigub tegelikult edasi ja üsna kiiresti. Häältekstiks tõlkimise tarkvara, mis oli paar aastat tagasi üsna haletsusväärne, nagu ka keeletõlkeprogrammid, on kiiresti täiustumas. Amazonil on sageli üsna hea idee selle kohta, mida soovite osta juba enne seda. Ja Google'i isesõitev auto oleks kümmekond aastat tagasi olnud vaid fantaasia. Kuid vestlus, nagu me pidevalt uuesti avastame, on tõesti raske ja see pole tõenäoliselt piir, kus AI kõige eredamalt särab. Praegu, kui otsite kedagi, kellega vestelda, soovitan tõelist inimest.

Dan Falk on Torontos asuv teadusajakirjanik.

Turingi test mõõdab midagi, kuid see pole “intelligentsus”