https://frosthead.com

Kas arvutid saavad dešifreerida 5000-aastast keelt?

Induse tsivilisatsioon, mis õitses suures osas III aastatuhandest eKr, oli oma aja kõige ulatuslikum ühiskond. Kõrgusel hõlmas see enam kui poole miljoni ruutmiili suurust ala, mille keskpunkt on täna India-Pakistani piir. Induse jäänuseid on leitud nii põhja pool kui Himaalajad ja nii lõuna pool kui Mumbai. See oli subkontinendi varasem teadaolev linnakultuur ja see uhke kahe suure linnaga, üks Harappa ja teine ​​Mohenjo-daro. Vaatamata oma suurusele ja pikaealisusele ning vaatamata ligi sajandi pikkustele arheoloogilistele uurimustele on Induse kohta suur osa müsteeriumist varjatud.

See, mida vähe me teame, on pärit 1920. aastatel alanud ja tänapäeval jätkuvatest arheoloogilistest kaevamistest. Aastakümnete jooksul on arheoloogid loonud hulgaliselt esemeid, sealhulgas pitserpitserid, amuletid ja väikesed tahvelarvutid. Paljud neist esemetest kannavad seda, mis näib olevat kirjutamise näidised - graveeritud figuurid, mis meenutavad muu hulgas tiivulisi hobuseraudu, kootud rattaid ja püstiseid kalu. Mida need sümbolid täpselt tähendada võivad, on endiselt üks iidsete tsivilisatsioonide stipendiumi kuulsamaid mõistatusi.

Ajaloos on olnud ka muid raskeid koode. Kännatud egüptoloogid püüdsid õnneliku pausi kuulsa Rosetta kivi avastamisega 1799. aastal, mis sisaldas teksti nii egiptuse kui ka kreeka keeles. Maiade hieroglüüfide uurimine langes, kuni vene keeleteadlane nimega Jurjev Knorozov kasutas 1950ndatel nutikalt ära tänapäevaseid räägitud maiade piire. Kuid Induse Rosetta kivi pole olemas ja teadlased ei tea, mis keeltest võis põgeneda induslaste räägitud keel.

Umbes 22 aastat tagasi pööras Indias Hyderabadis kaheksanda klassi õpilane nimega Rajesh Rao ajaloo õpiku lehte ja sai kõigepealt teada selle põneva tsivilisatsiooni ja selle salapärase skripti kohta. Järgnevatel aastatel viisid Rao koolidirektor ja elukutse teda teistsugusesse suunda - ta lõpetas arvutiteaduse harjutamise, mida ta õpetab täna Washingtoni ülikoolis Seattle'is -, kuid ta jälgis Induse stipendiumi hoolikalt, hoides silma peal kümnetel ebaõnnestunutel. katsed skripti mõtestada. Isegi kui ta õppis tehisintellekti ja robootikat, kogus Rao väikese raamatukogu Induse stsenaariumi raamatute ja monograafiate järgi, neist umbes 30. Lähedal asuvas raamaturiiulis hoidis ta ka hinnalist kaheksanda klassi ajalooõpikut, mis tutvustas talle indusid.

"See oli lihtsalt hämmastav, kui palju erinevaid ideid inimesed välja pakkusid, " ütleb ta. Mõned teadlased väitsid, et kirjutamine oli omamoodi sumeri skript; teised asuvad selle Dravidi perekonnas; veel teised arvasid, et see oli seotud Lihavõttesaare keelega. Rao leidis, et see oli “muinasajaloo seisukohast ilmselt üks keerulisemaid probleeme”.

Kuna katse pärast katset skripti dešifreerida ei õnnestunud, hakkasid mõned eksperdid kaotama lootust, et seda saab dekodeerida. 2004. aastal väitsid kolm teadlast vastuolulises artiklis, et Induse sümbolitel polnud üldse keelelist sisu. Selle asemel võisid sümbolid olla midagi enamat kui poliitilisi või religioosseid tegelasi esindavad piktogrammid. Autorid jõudsid nii kaugele, et väitsid, et indused polnud üldse kirjaoskajad tsivilisatsioonid. Mõne põllu jaoks hakkas kogu püüdlus leida keelt nende Induse ofortide taga, meenutada mõttetust.

Mõni aasta hiljem sisenes Rao kaklusse. Kuni selle ajani olid skripti uurinud inimesed arheoloogid, ajaloolased, keeleteadlased või krüptoloogid. Kuid Rao otsustas Induse skripti saladused välja meelitada, kasutades selleks kõige paremini tuttavat tööriista - arvutiteadust.

Alates kaheksandast klassist vaimustatud Induse tsivilisatsioonist kasutab Rajesh Rao Induse skripti dekodeerimiseks infotehnoloogiat ja mõistet "tingimuslik entroopia". (David Zaxi viisakalt) Arheoloogid on aastakümnete jooksul välja pannud väga palju Induse tsivilisatsiooni esemeid, sealhulgas templite pitserid, amuletid ja väikesed tahvelarvutid. (Robert Harding / Robert Harding Maailmapildid / Corbis) Rao ja tema kaastöötajad avaldasid oma järeldused ajakirjas Science mais. Nad ei dešifreerinud keelt, kuid nende avastused suurendasid selle mõistmist. (Robert Harding / Robert Harding Maailmapildid / Corbis) Rao ja tema kolleegid vaatavad nüüd pikemaid tegelaskujusid, kui nad Science teoses analüüsisid. Mustrite leidmine aitab omakorda kindlaks teha, millistesse perekondadesse skript võib kuuluda. (David Zaxi viisakalt)

Seattle'i suvepäeval tervitas Rao mind oma kabinetti, et näidata mulle, kuidas ta ja ta kolleegid probleemile lähenesid. Ta koostas savitõmmiste jäljendite kogu, mille arheoloogid on Induse leiukohtadest üles kerkinud. Need on väikesed - nagu väikesed ruudukujulised šokolaadid - ja enamikul neist on induse sümbolite rea all pilt loomast. Enamik Induse skripti näidiseid on sellised miniatuursed, ainult mõne tähemärgiga; ühtegi suurt monoliiti pole avastatud. Rao ütles mulle, et teadlased on väikeste pitserite toimimises ebakindlad, kuid üks teooria on see, et neid võidi kasutada kaubeldavate toodete kvaliteedi kinnitamiseks. Veel viitab sellele, et pitserid võisid olla viisiks, kuidas ettevõtjad maksid linna sisenedes või sealt lahkudes makse - väravamajade varemetest on leitud palju pitsatit, mis võisid toimida nagu muistsed teemaksuboksid.

Rao ja tema kolleegid ei püüdnud teha imesid - nad teadsid, et neil pole iidse skripti dešifreerimiseks piisavalt teavet -, kuid nad püstitasid hüpoteesi, et arvutusmeetodite abil võiksid nad vähemalt hakata kindlaks tegema, millist tüüpi Indust kirjutada skript oli: kas see kodeerib keelt või mitte? Nad tegid seda, kasutades mõistet “tingimuslik entroopia”.

Vaatamata imposantsele nimele on tinglik entroopia üsna lihtne mõiste: see on jada juhuslikkuse suuruse mõõt. Mõelge meie tähestikule. Kui te võtaksite Scrabble'i plaadid ja viskaksite neid õhku, võite leida mis tahes vana tähe. Kuid tegelikes ingliskeelsetes sõnades esinevad teatud tähed tõenäolisemalt pärast teisi. Inglise keele q- le järgneb peaaegu alati u . A t-le võib järgneda r või e, kuid väiksema tõenäosusega järgneb n või b .

Rao ja tema kaastöötajad - rahvusvaheline grupp, kuhu kuulusid arvutiteadlased, astrofüüsikud ja matemaatikud - kasutasid Induse skripti tingimusliku entroopia mõõtmiseks arvutiprogrammi. Seejärel mõõtsid nad teist tüüpi süsteemide - looduslike keelte (sumeri, tamili, sanskriti ja inglise) - tingimusliku entroopia, tehiskeele (arvutiprogrammeerimiskeel Fortran) ja mittekeelelisi süsteeme (inimese DNA järjestused, bakteriaalsed valgujärjestused ja kaks tehislikku andmekogumit, mis tähistavad tingliku entroopia kõrgeid ja madalaid äärmusi). Kui nad võrdlesid Induse skripti juhuslikkuse arvu teiste süsteemide omadega, leidsid nad, et see sarnaneb kõige enam looduskeeltes leiduvate määradega. Nad avaldasid oma järeldused mais ajakirjas Science .

Nende paber soovitab, et kui see näeb välja keel ja toimib nagu keel, siis tõenäoliselt on see keel. Leiud ei dešifreeri skripti muidugi, kuid need muudavad meie arusaama sellest veelgi paremaks ja on andnud kindluse neile arheoloogidele, kes töötasid eeldusel, et Induse skript kodeerib keelt.

Pärast paberi avaldamist sai Rao üllatuse. Selgub, et küsimus, millisesse perekonda skript kuulub, on tundlik: Induse tsivilisatsiooni vanuse ja olulisuse tõttu soovivad paljud kaasaegsed rühmitused Indias väita, et see on otsene esivanem. Näiteks lõunaosa tamili keelt kõnelevad indiaanlased eelistaksid teada saada, et induslaste skript oli omamoodi proto-dravidialane, kuna tamili põlvneb proto-dravidiaanidest. Hindi keele kõnelejad põhjas oleks pigem sanskriti vana vorm, hindi esiisa. Rao raamatus ei järeldata, millisesse perekonda skript kuulub, ehkki selles märgitakse, et tingimuslik entroopia sarnaneb vana tamiliga - pannes mõned kriitikud kokkuvõtlikult süüdistama meid draviidi natsionalistidena, "ütleb Rao. "Süüdistuste ja rünnakute raevukus oli täiesti ootamatu."

Rao võtab mõnikord kergenduse tagasi pöördudes neuroteaduste ja robootika vähem raevukalt vaidlustatud maailma. Kuid Induse skripti üleskutse on endiselt ahvatlev ja “see, mis varem oli hobi, monopoliseerib nüüd rohkem kui kolmandiku minu ajast, ” ütleb ta. Rao ja tema kolleegid vaatavad nüüd pikemaid tegelaskujusid, kui nad Science teoses analüüsisid. "Kui on mustreid, " ütleb Rao, "võiksime välja töötada grammatilised reeglid. See omakorda piiraks seda, millistele keeleperekondadele ”skript kuuluda võiks.

Ta loodab, et tema tulevased leiud räägivad enda eest, õhutades vähem India ühte piirkonda juurdunud vastastest vähem kui teise. Omalt poolt, kui Rao räägib sellest, mida Induse skript tema jaoks tähendab, kipub ta rääkima kogu India osas. "India pärand rikastaks märkimisväärselt, kui me saaksime aru Induse tsivilisatsioonist, " ütleb ta. Rao ja tema kaastöötajad töötavad selle kallal, üks lähtekoodi rida korraga.

Kas arvutid saavad dešifreerida 5000-aastast keelt?