Varem oli sõna all oleva või mitte olnud asjatundliku allika nime all see koolipäeva klambrid: sõnastik. American Heritage, Websteri kolmas, Oxfordi inglane: mängus oli vähe usaldusväärseid mängijaid.
Aga mis siis, kui need mängijad kaotavad oma eelise?
Võtke sõna "staycation". Viibimine, mis tähendab kodus puhkust, ilmus hiljuti New York Timesis, USA Today ja MSNBC . Kuid tõenäoliselt ei ilmu see sõnastikus niipea. Sama kehtib ka "bracketology" (NCAA March Madness kihlvedude teaduse) Facebooki ja Wikipedia kohta .
"Püüame katta kõige silmapaistvamaid sõnu, " ütleb American Heritage Dictionaryi toimetaja Joe Pickett. "Mida peab haritud võhik teadma?"
Inimesi, kes sõnastikke koostavad, tuntakse leksikograafidena ("sõnaraamatu autorid või toimetajad." Tänan, Merriam-Webster). Ja neil on ajaproovitud meetod, mille abil saab valida, milliseid uusi sõnu enne sõnastiku veebisaidi järgmist väljaannet või värskendust valida ja milliseid välja visata.
Sõnastiku redigeerijate rühmad jälgivad konkreetseid valdkondi, logides uue sõna tabamused. „Hitt” on mainimine raamatus, ajalehes või veebisaidil. Seejärel panevad nad tabamused andmebaasi ja võrdlevad uusi termineid sõnadega, mis neil juba on. Ehkki Facebook ei kuulu kaubamärgi alla, ei kvalifitseeru seda siiski Shakespeare'i näidendite iga sõna - sealhulgas cap-a-pie ("peast jalule") ja Fardel ("koorem"). Olles loova keeleteaduse vanaisa, leiutas Shakespeare rohkem kui 1700 sõna. Kõik need ilmuvad lühendamata sõnastikus.
Sõnaraamatud lükkavad sõnad tagasi liiga tehniliste sõnade tõttu (isegi kõige raskem "Grey anatoomia" fänn ei pea kunagi teadma, mis on mammosomatotroof) või liiga noorte (viibimiskohtade) kohta.
Nad ei loe brändinimesid (koks, Facebook, Vikipeedia) ega enamikku võõraid sõnu ja fraase.
"Me ei ürita olla Vikipeedia, " sõnas Pickett.
Kes siis on? Kes jälgib, loeb ja sorteerib sõnu, mida inglise keelt kõnelevad inimesed igapäevaselt kasutavad?
Austin, Texase osariik, on jälginud sõnu viimased viis aastat. Kasutades oma ekspertide meeskondi ja enda algoritmi, lisavad nad, et inglise keel lisab iga 98 minuti järel uue sõna. See tähendab, et maailmas on rohkem kui 900 000 ingliskeelset sõna ja miljoniline ilmub millalgi 2009. aasta aprillis.
Seevastu enamikes standardsõnastikes on umbes 200 000 sõna, lühendamata sõnaraamatutes umbes 600 000 sõna.
Kuid Monitor on oma numbrite osas nii kindel, et ta on alustanud miljonisõnalist märtsi, mis on miljonilise sõna tagasiarvestus.
"Me läksime tagasi keskmisele inglise keelele ja nägime, et sõna määratlus oli" räägitud mõte "", ütles Monitori president ja peaanalüütik Paul JJ Payack, "mis tähendab, et kui ma ütlen sõna, ja saate aru mina, see on päris sõna. "
Payack loeb sõnadena lahkumist, Facebooki ja Vikipeediat. Kuid ta järgib ka mõnda vana reeglit. Näiteks loendatakse ainult üks kord nimisõnu ja tegusõnu, näiteks "vesi". Ta ei loe kõiki kemikaalide nimesid, sest neid on sadu tuhandeid.
Kui monitor tuvastab sõna, jälgib ta seda aja jooksul, jälgides, kus see sõna ilmub. Selle mõõtmise põhjal otsustavad nad, kas sõnal on põhimõtteliselt "hoog", kas see muutub populaarsemaks või on see keelemaailma ühemõtteline ime.
Esmapilgul tundub see palju nagu sõnastiku süsteem.
"See on sama mis vana [meetod], lihtsalt uue reaalsuse äratundmine, " sõnas Payack. Monitori meetod annab veebis sisalduvatele tsitaatidele palju suurema kaalu.
Kuid kas Payacki "uus reaalsus" on tõeline? Ta väidab, et kiire infovoog ja ülemaailmse inglise keele tulek on muutnud seda, kuidas inimesed sõnu kasutavad. Ja et lõhe inimeste kasutatavate sõnade ja sõnaraamatutes esinevate sõnade vahel võib suureneda.
"Selgub, et kui midagi Internetti siseneb, on see nagu kajakamber, " ütles Payack. Pärast esimese veebibrauseri ilmumist 1991. aastal on Internet lisanud ingliskeelsele keelele palju sõnu - dot-com, ajaveeb - ja lisanud need sõnad kiiresti. Samuti on veeb võtnud olemasolevad sõnad uutele kõrvadele.
"90-ndate aastate keskel pani paarituhande brauseri tabamuse sõna saamine meid sõna sisestama. Nüüd on lävi muutunud, " ütles Pickett. "Ebaselgete sõnade ja väljendite kohta võite leida nii palju tõendeid."
Kuid sõnaraamatud on harjunud järelejõudmist mängima. Lõppude lõpuks on raske sõna määratleda, enne kui see on loodud.
Payacki sõnul pole Internet traditsioonilise sõnaarvestuse metoodika jaoks kõige pakilisem väljakutse. See on tema arvates "globaalne inglise keel".
Inglise keeles on peaaegu 400 miljonit emakeelt kõnelevat inimest, mis asetab selle maailmas teisele kohale, kuid kokku räägib see 1, 3 miljardit kõnelejat, muutes selle maailma kõige laiemalt mõistetavaks keeleks, selgitab Payack. Seda räägib teise keelena enam kui 300 miljonit inimest Indias ja vähemalt paljud Hiina keelt kõnelevad inimesed.
"Kõik, kes räägivad praegu inglise keelt, tunnevad, et neile kuulub see, " ütleb Payack. Vaadake näiteks omadussõna "brokeback". Pärast seda, kui režissöör Ang Lee nimetas oma filmi kahest armunud kauboist "Brokebacki mägiks", muutis sõna "brokeback" ingliskeelsesse keelde sünonüümina "gei". Ehkki "vahendamine" võib USAs hiilgeaegadest mööduda, on selle uue tähendusega sõna Hiinas endiselt populaarne, ütles Payack. See ilmub ajaveebides ja veebisaitidel, mis tähendab, et sellel on hoog, mis tähendab, et see on sõna.
"Tänapäeval on kogu maailmas kõikides suundades liikumas palju rohkem inimkaubandust, " ütles Chicago ülikooli keeleteaduse professor Salikoko Mufwene, kes on uurinud piirkondlike murrete arengut. See, kas Hiina inspireeritud sõnadest saab näiteks ameerika inglise osa või mitte, "sõltub sellest, kui regulaarselt ameeriklased kavatsevad aasialastega inglise keeles suhelda", ütles ta.
Ja kui nad seda teeksid, kas ameeriklased muutuksid keskmiselt palju sõnarohkemaks? Keskmine ameeriklane kasutab päevas umbes 7500 sõna ja teab kokku umbes 20 000 sõna. Isegi Shakespeare teadis vaid umbes 60 000.
Nii et inglise keeles on sõnade arv alati palju-palju rohkem, kui keegi teab või kasutab.
Nii Mufwene kui ka American Heritage's Pickett ütlesid, et inglise keeles võiks juba olla miljon sõna. Sõnade lugemine on ju ebatäpne teadus.
See pole ka sõnastiku teadus. Sõnaraamatute töö on alati olnud Mufwene sõnul "peegeldada seda, kuidas inimesed räägivad, mitte õpetada neile, kuidas rääkida." Kui sõnastiku peegeldus kitseneb, võib see siiski olla väärtuslik.
"Peate inimesi sõnastikku redigeerima ja selle eest vastutama, et see oleks usaldusväärne, " ütles Pickett. "Ja ma ei usu, et see muutub."