https://frosthead.com

Kas AI saab kunagi targemaks kui nelja-aastane?

Kõik on kuulnud tehisintellekti ja eriti masinõppe uutest edusammudest. Olete kuulnud ka utoopilisi või apokalüptilisi ennustusi selle kohta, mida need edusammud tähendavad. Neid on võetud kas surematuse või maailmalõpu eeldamiseks ja mõlemast võimalusest on kirjutatud palju. Kuid kõige keerukamad AI-d on veel kaugel sellest, et suudaksid lahendada probleeme, mida inimese nelja-aastased lapsed kerge vaevaga lahendavad. Vaatamata muljetavaldavale nimele koosneb tehisintellekt suures koguses statistiliste mustrite tuvastamise tehnikatest. Inimeste õppimises on palju muud.

Kuidas me saame nii palju teada ümbritsevast maailmast? Me õpime tohutult palju isegi siis, kui oleme väikesed lapsed; nelja-aastased teavad juba taimedest, loomadest ja masinatest; soovid, uskumused ja emotsioonid; isegi dinosaurused ja kosmoselaevad.

Teadus on laiendanud meie teadmisi maailma kohta kujuteldamatult suureks ja lõpmata väikseks, universumi servani ja aja alguseni. Ja me kasutame neid teadmisi uute klassifikatsioonide ja ennustuste tegemiseks, uute võimaluste kujutlemiseks ja uute asjade maailmas juhtumiseks. Kuid kõik, mis meieni ükskõik kellelt maailmast jõuab, on footonite voog, mis lööb meie võrkkestadesse ja õhupuudus meie kuulmekiledesse. Kuidas me saame maailma kohta nii palju teada, kui tõendid on meil nii piiratud? Ja kuidas me seda kõike teeme paari naela halli googa, mis meie silme all istub?

Parim vastus seni on see, et meie ajud teevad arvutusi konkreetsete, eriti meie meeltesse sattuvate räpakate andmete kohta ja need arvutused annavad täpse ülevaate maailmast. Esindused näivad olevat struktureeritud, abstraktsed ja hierarhilised; need hõlmavad kolmemõõtmeliste objektide tajumist, keele aluseks olevaid grammatikaid ja vaimseid võimeid nagu “meeleteooria”, mis võimaldab meil mõista, mida teised inimesed arvavad. Need esitused võimaldavad meil teha mitmesuguseid uusi ennustusi ja ette kujutada paljusid uusi võimalusi omapäraselt loomingulisel viisil.

Selline õppimine pole ainus intelligentsus, kuid see on eriti oluline inimeste jaoks. Ja just selline intelligentsus on väikelaste eripära. Kuigi lastel on dramaatiliselt halb planeerimine ja otsuste tegemine, on nad universumi parimad õppijad. Suur osa andmete teooriateks muutmise protsessist toimub enne, kui oleme viis.

Alates Aristotelesest ja Platonist on olnud kaks peamist viisi probleemiga tegelemiseks, kuidas me teame, mida me teame, ja need on endiselt masinõppe peamised lähenemisviisid. Aristoteles lähenes probleemile alt üles: alustage meeltega - footonite ja õhuvibratsiooni vooga (või digitaalse pildi või salvestise pikslitega või heliproovidega) - ja vaadake, kas saate neist mustreid kaevandada. Seda lähenemisviisi kasutasid edasi sellised klassikalised assotsiatsionistid nagu filosoofid David Hume ja JS Mill ning hiljem käitumispsühholoogid, nagu Pavlov ja BF Skinner. Selles vaates on representatsioonide abstraktsus ja hierarhiline ülesehitus midagi illusiooni või vähemalt epifenomeni. Kogu töö saab ära teha seostamise ja mustrituvastuse abil - eriti kui andmeid on piisavalt.

Preview thumbnail for video 'Possible Minds: 25 Ways of Looking at AI

Võimalikud mõtted: 25 viisi AI-le vaatamiseks

Teadusmaailma valguskunstnik John Brockman koondab 25 olulisimat teaduslikku meelt - inimesi, kes on suurema osa oma karjäärist mõelnud tehisintellekti valdkonnast - enneolematuks ümarlauaeksamiks mõistuse, mõtlemise, intelligentsuse ja selle kohta, mida see tähendab ole inimene.

Osta

Aja jooksul on õppimise müsteeriumile suunatud alt üles suunatud lähenemisviisi ja Platoni alternatiivse ülalt alla lähenemise vahel olnud visioon. Võib-olla saame abstraktseid teadmisi konkreetsetest andmetest, kuna teame juba palju ja eriti seetõttu, et tänu evolutsioonile on meil juba hulgaliselt abstraktseid põhikontseptsioone. Nagu teadlased, saame ka neid mõisteid kasutada hüpoteeside kujundamiseks maailma kohta. Siis võime selle asemel, et proovida toormaterjalidest mustreid ekstraheerida, teha prognoose selle kohta, millised peaksid andmed välja nägema, kui need hüpoteesid on õiged. Koos Platoniga kasutasid seda lähenemisviisi sellised ratsionalistlikud filosoofid ja psühholoogid nagu Descartes ja Noam Chomsky.

Siin on igapäevane näide, mis illustreerib kahe meetodi erinevust: rämpsposti katku lahendamine. Andmed koosnevad postkastis olevast pikast sortimata sõnumiloendist. Reaalsus on see, et mõned neist sõnumitest on ehtsad ja mõned rämpspost. Kuidas saate andmeid nende vahel vahet teha?

Mõelge kõigepealt alt üles meetodile. Panite tähele, et rämpsposti teadetel on tavaliselt eripära: pikk nimekiri adressaatidest, pärit Nigeeriast, viited miljoni dollari suurustele auhindadele või Viagra. Probleem on selles, et ka täiesti kasulikel teadetel võivad olla need funktsioonid. Kui vaatasite piisavalt rämpsposti ja rämpspostiga seotud e-kirjade näiteid, võite näha mitte ainult seda, et rämpsposti e-posti aadressidel on tavaliselt need funktsioonid, vaid et need funktsioonid kipuvad koos käima (Nigeeria ja miljon dollarit tähendavad õigekirjaprobleemid). Tegelikult võib esineda mõningaid peent kõrgema astme korrelatsioone, mis eristavad rämpspostisõnumeid kasulikest - ütleme näiteks õigekirjavea ja IP-aadresside konkreetne muster. Kui tuvastate need mustrid, saate rämpsposti välja filtreerida.

Altpoolt üles suunatud masinõppe tehnikad teevad just seda. Õppija saab miljoneid näiteid, igaühel on mõned funktsioonid ja igaüks on märgistatud rämpspostiks (või mõneks muuks kategooriaks) või mitte. Arvuti saab eraldada nende omaduste mustri, mis neid kahte eristab, isegi kui see on üsna peen.

Kuidas oleks ülalt-alla lähenemisega? Saan meili Journal of Clinical Biology toimetajalt. See viitab ühele mu paberile ja ütleb, et nad tahaksid avaldada minu artikli. Ei Nigeeriat, ei Viagrat ega miljonit dollarit; meilil pole ühtegi rämpsposti funktsiooni. Kuid kasutades seda, mida ma juba tean, ja mõeldes abstraktselt rämpsposti tekitavale protsessile, saan aru, et see e-kiri on kahtlane:

1. Ma tean, et rämpspostitajad püüavad inimestelt raha aurata, pöördudes inimeste ahnuse poole.

2. Samuti tean, et õigustatud avatud juurdepääsuga ajakirjad on hakanud katma oma kulusid, tasudes autoritelt tellijate asemel ja et ma ei praktiseeri midagi sellist nagu kliiniline bioloogia.

Pange see kõik kokku ja saan koostada uue hea hüpoteesi selle kohta, kust see e-kiri tuli. See on mõeldud akadeemikute imemiseks maksma võltspäevikus artikli avaldamise eest. E-kiri oli sama kahtlase protsessi tulemus nagu teiste rämpspostiga, kuigi see ei paistnud nende moodi olevat. Saan selle järelduse teha vaid ühe näite põhjal ja saan jätkata oma hüpoteesi kontrollimist, ületades e-kirja enda sisu, googeldades “toimetajat”.

Arvuti osas alustasin ma generatiivse mudeliga, mis sisaldab abstraktseid mõisteid nagu ahnus ja petmine ning kirjeldab e-posti pettuste tekitamise protsessi. See võimaldab mul ära tunda klassikalise Nigeeria e-posti rämpsposti, kuid võimaldab mul ette kujutada ka palju erinevaid võimalikke rämpspostitusi. Kui saan ajakirja e-kirja, võin ma tagasi töötada: "See näib olevat just selline e-kiri, mis tuleks välja rämpsposti genereerimise protsessist."

Uus põnevus AI-st tuleneb sellest, et AI-teadlased on hiljuti koostanud mõlema õppemeetodi võimsad ja tõhusad versioonid. Kuid meetodites endas pole midagi sügavalt uut.

Altpoolt ülesõppimine

1980ndatel töötasid arvutiteadlased välja geniaalse viisi arvutite leidmiseks andmete mustrite tuvastamiseks: konsolatsionistlik või närvivõrgu arhitektuur (neuraalne osa oli ja on endiselt metafooriline). Lähenemisviis langes 1990ndatel ränkadesse probleemidesse, kuid hiljuti on seda taaselustatud võimsate sügavõppimismeetoditega, nagu Google'i DeepMind.

Näiteks võite anda süvaõppeprogrammile hunniku Interneti-pilte sildiga “kass”, teisi märgisega “maja” jne. Programm suudab tuvastada mustrid, mis eristavad kahte pildikomplekti, ja kasutada seda teavet uute piltide korrektseks märgistamiseks. Mõni tüüpi masinõpe, mida nimetatakse juhendamata õppeks, suudab tuvastada andmetes mustreid, millel pole silte; nad otsivad lihtsalt tunnuste rühmi - mida teadlased nimetavad faktorianalüüsiks. Süvaõppemasinates korratakse neid protsesse erinevatel tasanditel. Mõni programm suudab pikslite või helide lähteandmetest isegi asjakohaseid funktsioone leida; võib arvuti kõigepealt tuvastada töötlemata pildi mustrid, mis vastavad servadele ja joontele, ja seejärel leida mustrid neis mustrites, mis vastavad nägudele jne.

Teine pika ajalooga alt-üles tehnika on tugevdusõpe. 1950-ndatel programmeeris BF Skinner John Watsoni loomingule tuginedes tuvid kuulsalt keerukate toimingute tegemiseks - isegi suunates õhku lastud raketid nende sihtmärkide juurde (hiljutise AI häiriv kaja), määrates neile konkreetse premeerimiste ja karistuste ajakava . Põhiline mõte oli, et autasustatud toiminguid korratakse ja karistatud toiminguid ei tehta enne, kui soovitud käitumine on saavutatud. Isegi Skinneri päevil võib see lihtne ja korduv protsess viia keeruka käitumiseni. Arvutid on loodud lihtsate toimingute tegemiseks ikka ja jälle mõõtkavas, mis hävitab inimese kujutlusvõime, ja arvutisüsteemid saavad sel viisil õppida märkimisväärselt keerukaid oskusi.

Näiteks kasutasid Google'i DeepMindi teadlased Atari videomängude mängimiseks arvuti õpetamiseks süvaõppe ja tugevdusõppe kombinatsiooni. Arvuti ei teadnud mängude toimimisest midagi. Alustati juhuslikult tegutsemisest ja saadi teavet ainult selle kohta, milline ekraan igal hetkel välja nägi ja kui hästi see oli skoorinud. Sügav õppimine aitas ekraanil kuvatavaid funktsioone tõlgendada ja tugevdusõpe premeeris süsteemi kõrgemate hinnete eest. Arvuti sai mitme mängu mängimisel väga heaks, kuid pommitas ka täielikult teisi, mida inimestel oli sama lihtne kasutada.

Sarnane sügava õppimise ja tugevdamise õppimise kombinatsioon on võimaldanud edu DeepMindi AlphaZeros - programmis, mis suutis inimmängijaid lüüa nii males kui ka Go-s, mis on varustatud ainult põhiteadmistega mängureeglitest ja teatavatest planeerimisvõimalustest. AlphaZerol on veel üks huvitav funktsioon: see töötab, mängides enda vastu sadu miljoneid mänge. Nii tehes kärbib see kaotustele viinud vigu ning kordab ja arendab võidule viinud strateegiaid. Sellised süsteemid ja muud, mis hõlmavad tehnikaid, mida nimetatakse generatiivseteks konkureerivateks võrkudeks, genereerivad nii andmeid kui ka vaatlevaid andmeid.

Kui teil on arvutusvõime rakendada neid tehnikaid väga suurte andmekogumite või miljonite e-kirjade, Instagrami piltide või helisalvestiste jaoks, saate lahendada probleemid, mis tundusid varem väga keerulised. See tekitas arvutiteaduses palju elevust. Kuid tasub meeles pidada, et need probleemid - näiteks teadvustamine, et pilt on kass või räägitav sõna on Siri - on inimese väikelapse jaoks triviaalsed. Üks arvutiteaduse huvitavamaid avastusi on see, et meie jaoks lihtsad probleemid (näiteks kasside tuvastamine) on arvutite jaoks rasked - palju raskemad kui male või Go mängimine. Objektid, mida saame kategoriseerida vaid mõnega, vajavad arvutid miljoneid näiteid. Neid alt üles suunatud süsteeme saab üldistada uuteks näideteks; nad saavad uue pildi kassina üsna täpselt märgistada. Kuid nad teevad seda viisil, mis on üsna erinev sellest, kuidas inimesed üldistavad. Mõnda kassi kujutisega peaaegu identset pilti ei saa me üldse kassidena tuvastada. Teised, mis näevad välja nagu juhuslik hägusus, saavad olema.

Ülevalt alla suunatud Bayes'i mudelid

Ülalt-alla lähenemine mängis suurt rolli varajases AI-s ja ka 2000-ndatel koges ta taaselustamist tõenäosuslike või Bayesise generatiivsete mudelite kujul.

Varased katsed seda lähenemisviisi kasutada seisid silmitsi kahte tüüpi probleemidega. Esiteks võiks enamikku tõendamisvorme põhimõtteliselt seletada paljude erinevate hüpoteesidega: Võimalik, et minu ajakirja e-kiri on ehtne, see lihtsalt ei tundu tõenäoline. Teiseks, kust pärinevad põhimõtted, mida generatiivsed mudelid kasutavad? Platon ja Chomsky ütlesid, et olete nendega sündinud. Kuid kuidas seletada, kuidas õpime teaduse uusimaid kontseptsioone? Või kuidas saavad isegi väikesed lapsed aru dinosaurustest ja raketilaevadest?

Bayes'i mudelid ühendavad generatiivsed mudelid ja hüpoteesi testimise tõenäosusteooriaga ning käsitlevad neid kahte probleemi. Bayesi mudel võimaldab teil arvutada, kui tõenäoline on, et antud hüpotees vastab tõele. Ja tehes juba olemasolevate mudelite jaoks väikeseid, kuid süstemaatilisi näpunäiteid ja katsetades neid andmetega, saame mõnikord teha vanadest uusi kontseptsioone ja mudeleid. Kuid need eelised korvavad muud probleemid. Bayesi meetodid aitavad teil valida, kumb kahest hüpoteesist on tõenäolisem, kuid peaaegu alati on tohutul hulgal võimalikke hüpoteese ja ükski süsteem ei suuda neid kõiki tõhusalt kaaluda. Kuidas otsustate, milliseid hüpoteese tasub kõigepealt katsetada?

Brenden Lake NYU-s ja tema kolleegid on kasutanud selliseid ülalt-alla meetodeid, et lahendada veel üks probleem, mis on inimestele lihtne, kuid arvutitele äärmiselt keeruline: harjumatu käsitsi kirjutatud märkide äratundmine. Vaadake tegelast Jaapani kerimisel. Isegi kui te pole seda kunagi varem näinud, võite arvatavasti öelda, kas see sarnaneb mõne teise Jaapani kerimise tähemärgiga või erineb sellest. Tõenäoliselt saate selle joonistada ja isegi kujundada võltsitud jaapani tähemärgi vastavalt sellele, mida näete - see, mis näeb välja hoopis teistsugune kui korea või vene tähemärk.

Alt-üles meetod käsikirjaliste märkide äratundmiseks on tuua arvutile tuhandeid näiteid igaühe kohta ja lasta sel silmapaistvamad omadused välja tõmmata. Selle asemel järv jt. andis programmile tähemärgi joonistamise üldise mudeli: insult läheb kas paremale või vasakule; kui olete ühe lõpetanud, alustate teisega; ja nii edasi. Kui programm nägi konkreetset tegelast, võis see järeldada löökide jada, mis selle kõige tõenäolisemalt põhjustasid - samamoodi nagu ma järeldasin, et rämpspostiprotsess viis mu kahtlase e-kirjani. Siis võis ta otsustada, kas uus tegelane tuleneb tõenäoliselt sellest järjestusest või hoopis teisest, ja see võib ise anda sarnase löögikomplekti. Programm töötas palju paremini kui täpselt samadele andmetele rakendatud süvaõppe programm ja see peegeldas täpselt inimeste jõudlust.

Neil kahel masinõppe lähenemisel on üksteist täiendavad tugevused ja nõrkused. Alt-üles lähenemisviisi puhul ei vaja programm alguseks palju teadmisi, vaid see vajab palju andmeid ja seda saab üldistada vaid piiratud viisil. Ülalt-alla lähenemisviisi korral saab programm õppida vaid mõne näite põhjal ja teha palju laiemaid ja mitmekesisemaid üldistusi, kuid selleks peate alustama palju rohkem. Mitu uurijat üritavad praegu kahte lähenemisviisi ühendada, kasutades sügavõppimist Bayesise järelduste rakendamiseks.

AI hiljutine edu on osaliselt nende vanade ideede laiendamise tulemus. Kuid see on rohkem seotud tõsiasjaga, et tänu Internetile on meil palju rohkem andmeid ja tänu Moore'i seadusele on meil nende andmete suhtes palju rohkem arvutusvõimet. Pealegi on hindamata tõsiasi, et inimesed, kelle andmed meil on, on juba sortinud ja töötanud. Veebi postitatud kassipildid on kanoonilised kassipildid - pildid, mille inimesed on juba valinud “headeks” piltideks. Google Translate töötab seetõttu, et kasutab ära miljonite inimeste tõlkeid ja üldistab need uueks tekstiosaks, selle asemel, et lausetest tõeliselt aru saada.

Kuid tõeliselt tähelepanuväärne on inimlaste puhul see, et nad ühendavad kuidagi iga lähenemisviisi parimad omadused ja lähevad siis neist kaugemale. Viimase viieteistkümne aasta jooksul on arendustegelased uurinud, kuidas lapsed õpivad andmetest struktuuri. Nelja-aastased saavad õppida, kui võtta ainult üks või kaks andmete näidet, nagu ülalt alla süsteem, ja üldistada väga erinevatele mõistetele. Kuid nad saavad ka andmetest ise õppida uusi kontseptsioone ja mudeleid, nagu teeb alt-üles süsteem.

Näiteks anname oma laboris väikestele lastele „põrkedetektori“ - uue nuputamismasina, mida nad pole kunagi varem näinud. See on kast, mis süttib ja mängib muusikat, kui paned sellele teatud objektid, kuid mitte teistele. Me anname lastele vaid ühe või kaks näidet masina töö kohta, näidates neile, et näiteks kaks punast plokki muudavad selle käima, roheline ja kollane kombinatsioon aga mitte. Isegi kaheksateistkuused lapsed saavad kohe aru üldpõhimõttest, mille kohaselt kaks objekti peavad olema samad, et see läheks, ja nad üldistavad selle põhimõtte uuteks näideteks: Näiteks valivad nad kaks sama kujuga objekti masin töötab. Teistes katsetes oleme näidanud, et lapsed saavad isegi aru saada, et mõni peidetud nähtamatu vara paneb masina käima või et masin töötab mingil abstraktsel loogilisel põhimõttel.

Seda saate näidata ka laste igapäevases õppes. Noored lapsed õpivad kiiresti abstraktseid bioloogia, füüsika ja psühholoogia intuitiivseid teooriaid samamoodi nagu täiskasvanute teadlased, isegi suhteliselt vähe andmeid.

Viimaste AI-süsteemide märkimisväärsed masinõppe saavutused, nii alt üles kui ka ülalt alla, toimuvad kitsas ja täpselt määratletud hüpoteeside ja kontseptsioonide ruumis - täpne mängukomplektide ja käikude komplekt, ettemääratud pildikomplekt . Seevastu nii lapsed kui ka teadlased muudavad mõnikord oma kontseptsioone radikaalsel viisil, viies läbi pigem paradigma muutusi kui lihtsalt juba olemasolevate kontseptsioonide varjamist.

Nelja-aastased saavad kassid kohe ära tunda ja sõnadest aru saada, kuid nad võivad teha ka loovaid ja üllatavaid uusi järeldusi, mis ulatuvad kaugelt üle nende kogemuste. Mu enda lapselaps selgitas hiljuti näiteks, et kui täiskasvanu soovib uuesti lapseks saada, peaks ta proovima mitte tervislikke köögivilju süüa, kuna tervislikud köögiviljad muudavad lapse täiskasvanuks. Selline hüpotees, usutav, mida ükski täiskasvanu kunagi ei lõbustaks, on iseloomulik väikestele lastele. Tegelikult oleme kolleegidega ja mina süstemaatiliselt näidanud, et koolieelikud saavad paremini hakkama ebatõenäoliste hüpoteesidega kui vanemad lapsed ja täiskasvanud. Meil pole peaaegu aimugi, kuidas selline loov õppimine ja innovatsioon on võimalik.

Laste töö vaatamine võib programmeerijatele siiski anda kasulikke näpunäiteid arvutiõppe suuniste kohta. Laste õppimise kaks eripära on eriti silmatorkavad. Lapsed on aktiivsed õppijad; nad ei kogu lihtsalt passiivselt andmeid nagu AI-d. Nii nagu teadlased katsetavad, on ka lapsed sisuliselt motiveeritud ammutama teavet ümbritsevast maailmast oma lõputu mängu ja uurimise kaudu. Värsked uuringud näitavad, et see uurimine on süstemaatilisem, kui ta välja näeb, ning on hästi kohandatud leidma veenvaid tõendeid hüpoteesi kujunemise ja teooria valiku toetamiseks. Masinate uudishimu suurendamine ja nende aktiivse maailmaga suhtlemise võimaldamine võib olla tee realistlikuma ja laiahaardelisema õppe juurde.

Teiseks on lapsed, erinevalt olemasolevatest AI-dest, sotsiaalsed ja kultuurilised õppijad. Inimesed ei õpi eraldatult, vaid kasutavad ära eelmiste põlvkondade kogunenud tarkusi. Värsked uuringud näitavad, et isegi koolieelikud õpivad jäljendamise ja teiste ütluste kuulamise kaudu. Kuid nad ei allu oma õpetajatele lihtsalt passiivselt. Selle asemel võtavad nad teistelt saadud teavet silmapaistvalt peenelt ja tundlikult, tehes keerukaid järeldusi selle kohta, kust teave pärineb ja kui usaldusväärne see on, ning integreerides süstemaatiliselt omaenda kogemused kuulatavaga.

“Tehisintellekt” ja “masinõpe” kõlavad hirmutavalt. Ja mõnes mõttes nad on. Neid süsteeme kasutatakse näiteks relvade juhtimiseks ja me peaksime sellest tõesti kartma. Naturaalne rumalus võib siiski palju rohkem hävitada kui tehisintellekt; meie, inimesed, peame uue tehnoloogia nõuetekohaseks reguleerimiseks olema palju nutikamad kui oleme varem olnud. Kuid inimeste asendava AI-de apokalüptilisel või utoopilisel visioonil pole palju alust. Kuni me ei lahenda õppimise põhiparadoksi, ei suuda parimad tehisintellektid keskmise inimese nelja-aastasega konkureerida.

Eelseisvast kogumikust VÕIMALIKUD MÕLED: 25 viisi AI-le vaatamiseks, toimetanud John Brockman. Avaldatud kokkuleppel Penguin Pressiga, kes on Penguin Random House LLC liige. Autoriõigused © 2019 John Brockman.

Kas AI saab kunagi targemaks kui nelja-aastane?