https://frosthead.com

Suudlevad keelebarjäärid hüvasti

Universaaltõlk on pikka aega olnud popkultuuri kinnisidee. Star Trek esitleb seda kui mikrofoni meenutavat pihuarvutit, mis suudab enamikku keeli kohe tõlkida . Galaktika autosõitja uhkeldab Paabeli kalaga - olendiga, kes kõrva kinni jäädes pakub galaktika mis tahes keele kohese tõlke.

Seega ei tohiks olla üllatav, et tänapäeva inimesed üritavad luua sama hästi töötavat seadet. On olemas kümneid nutitelefonirakendusi, kuid enamik tõlgib sõnu lihtsal ja ükshaaval; kasutaja kirjutab sõna või räägib seda ja rakendus põrkub tõlkega tagasi. Nüüd on eesmärk ja reaalne rahaline ootamatus inseneride ja ettevõtjate jaoks võimaldada kahel inimesel suhelda erinevates keeltes, samal ajal kui väike seade sülitab tõlked reaalajas välja.

Olemasolevad tõlkerakendused

Kreeka-reisil haigestus ingliskeelne Andrew Lauder.

"Ma käisin apteegis ja nad ei saanud inglise keelest aru, seega ei saanud ma ühtegi ravimit, " ütleb Vocre Translate'i tegevjuht Lauder. Ravimimärgised olid tema jaoks sõna otseses mõttes kreeka keeles. Keelebarjäärid on maailmarändurite jaoks tavalised. Välisriigis muutuvad väikesed tehingud, nagu ravimite ostmine või juhiste hankimine - Lauderi ees veel üks raskus -, et see on väga keeruline ülesanne.

Osariiki naastes lõi Lauder hääle- ja tekstitõlkerakenduse Vocre Translate. See algas tekstidest tekstirakendusena (nimega MyLangauge), seejärel muudeti algselt kõneks mudeliks, mis nagu ka muud rakendused, sealhulgas SayHi Translate, kasutas traditsioonilist mudelit, milles sõna tõlgib otse teisele sõnale. Öelge "Tere" ja nutitelefon või tahvelarvuti kõlavad tagasi automatiseeritud "Hola". "Hüvasti" saab "Sayonara". Ja nii edasi, sarnaselt tekstitõlkega.

Lihtsa helitõlke loomiseks vajasid nende rakenduste loojad andmeid. Vocre kasutas oma teavet üldkasutatavate salvestiste ja dokumentide, näiteks vanade filmide või avalike kuulamiste põhjal. "Me palusime põhimõtteliselt kõneposti transkriptsiooniteenust, et saaksime kasutada nende pilvi kõnetuvastuseks, " ütleb SayHi tegevjuht Lee Bossier.

Kui inseneridel olid heli- ja tekstiandmed, sidusid nad heli ja teksti omavahel sõna-sõnalt. Häältuvastustarkvara tunneb ära juustu ja teisendab selle tekstiks. See teisendatakse prantsuse keeleks ja rakendus leiab prantsuse häälduse "fromage".

See tähendab, et kui kasutaja nimetab midagi cheesy'seks, siis tõlk ka ei tööta, sest kõnekeel pole peaaegu nii staatiline kui kirjakeel. Kadents, släng, käänamine, hääldus, murre ja vestlusvool võivad tähendust muuta

Aja jooksul soovis Lauder siiski vestlusväärsemat seadet. Ta ütleb oma e-kirjas: „Meie kasutusandmete põhjal leidsime, et inimesed räägivad väga erinevalt sellest, mida nad kirjutavad. Hääldatud sõna on palju spontaansem ning vähem formaalne ja sõnasõnaline. ”Nii kasutas ta statistilist masintõlget - seda lähenemist kasutab ka Google, mis kasutab andmeid tavalise sõnakasutuse leidmiseks, loobudes traditsioonilisest sõnasõnalisest tõlkemudelist. Põhimõtteliselt õpib Vocre õigesti. „See õpib iga vestluse, iga fraasi põhjal, mis sellest läbi läheb. See on midagi, mis aja jooksul targemaks saab, ”räägib Lauder.

Praegu võtab mõlema rakenduse tõlkimine siiski mõne sekundi, kuid on kahtlemata tõhus, eriti koos kehakeelega, tehinguvestluste jaoks, näiteks söögi tellimine. Lõppude lõpuks on inimesed juba aastaid võõrkeeltes toitu tellinud ja suudavad alati süüa. Kuid neil pole olnud võimalik pidada põhjalikke ja keerulisi vestlusi.

Vocre'i ja SayHi abil saavad vestlused järsult lahku minna, kuid see pole sama, mis teie emakeeles vestlemine. Google kavatseb seda täielikult muuta.

Google'i lähenemisviis (statistiline masintõlge)

Koolis uue keele õppimisel alustame individuaalsete sõnavaraterminitega. Kuid keel on ladusam - sõnad vajavad konteksti.

„Google'i lähenemisviis on üldisem lähenemisviis, ” ütleb Google Translate'i tarkvarainsener Josh Estelle. "Selle asemel, et proovida kõiki neid reegleid kõvasti kodeerida, proovime neid õppida ka andmete abil."

Tehnoloogiaettevõte väldib üks-ühele-sõnade-meetodit ja kasutab selle asemel statistilist masintõlget, vaadates mitte seda, mida sõnad tähendavad, vaid seda, kuidas keelt modelleeritakse, mida ta andmete kaudu õpib . Niisiis, see on mõeldud metsa, mitte puude jaoks. Ingliskeelne näide: me teame sõnade „break” ja „up” määratlusi. Kuid fraas „break up” ei ole kahe sõna sõnasõnaline kombinatsioon.

Statistiline masintõlge nõuab andmeid. Selle mäed. Meetodi toimimiseks on vaja mitte ainult seda, et juustu puhul on prantsuskeelne päritolu prantsuse keeles, vaid ka 100 näidet nii juustu kui ka juustu lauses kasutatava juustu kohta.

Estelle ütleb, et kui inglise keelt kõneleval inimesel on kaks menüüd, mis on identsed, välja arvatud juhul, kui üks on trükitud inglise keeles ja teine ​​hiina keeles, siis "võite arvatavasti aru saada, mis hiina tähemärk tähendab" suppi "." Kontekst on kuningas. Kuid selle konteksti loomiseks on vaja juurdepääsu miljonitele menüüdele ja kõigile muudele ettekujutatavatele dokumentidele.

See on täpselt see, mis Google'il on. Ilma veebihiiglaseta, kes koguks hunniku andmeid, ei saaks reaalset maailma Paabeli kala eksisteerida. See indekseerib veebi ja kogub kõike - teksti ja heli. Seejärel toidab ta need andmed algoritmideks, mis võrdlevad kõike kõige muuga. Need võrdlused aitavad jõuda keele loomuliku toimimise juurteni.

"Üks asi, mis tõlkimisest rääkides inimesi üllatab, on see, et meie meeskonnas pole ühtegi keelemeest, " räägib Estelle. „Oleme käivitanud 71 keelt ja ma ütleksin, et meie meeskond ei tea, kuidas valdavat osa neist rääkida. Inimtõlk ei saa kõiki neid termineid ja asju õppida nii kiiresti, kui meie [andmed] saavad veebist õppida. ”

Mis mõte sellel on?

Nagu Google, näeb ka Facebook eeliseid. Mõelge sotsiaalse meedia saidi enda meeleavaldusele tõlkimisel.

"Facebooki missioon on ühendanud kogu maailma ja üks maailma ühendamise takistusi pole see, et kõik räägivad sama keelt, " ütleb Facebooki inseneridirektor Tom Stocky. "Tõlke poole pealt arvan, et tõeliselt ambitsioonikas tulevikuvisioon on see, kui saaksite Facebooki kasutada oma emakeeles ja suhelda mõne muu keelega."

Eelmise aasta augustis ostis Facebook Jibbigo, kõnede tõlkimise rakenduse, mis on saadaval Androidi ja iOS-i seadmetele.

Innukad Facebooki kasutajad märgivad, et sotsiaalsaidil on juba tõlge. Kui teil on kunagi olnud ingliskeelsel lehel hispaaniakeelset postitust, on teile kohe antud võimalus see oma emakeelde tõlkida.

Kuid Stocky näeb häälekomponenti võimaliku mängude vahetajana. Nutitelefonide ja tahvelarvutite esiletõus tervitab pidevalt ühendatud maailma ning kõnetuvastustarkvara tõus kutsub uusi võimalusi veebisuhtluseks. Stocky näeb tulevikku, kus kasutajad saavad lihtsalt oma nutitelefonidele käsu anda ja suhelda teiste kasutajatega, jättes kõrvale keeleerinevused.

"Pole kahtlust, et see juhtub lõpuks, sest ainsad piirangud on keelemootori võimsus ning muidugi töötlemise aeg ja töötlemise võimsus, " ütleb ta.

Tulane'i ülikooli globaalsete tervishoiusüsteemide ja arengu osakonna professor ja tunnustatud tehnoloogisskeptik Laura Murphy seab kahtluse alla universaalse tõlgi väärtuse ja selle, et ta ei pea teadma rohkem kui ühte keelt.

Ta arvab, et seade võiks olla mõneti kasulik reisimisel, äri- ja rahvusvahelistes suhetes, kuid mitte murranguline. Teatud tasemel on tõlkijad (inimesed) meil juba olemas ja enamik välissuhetes töötavaid inimesi oskab sobivaid keeli. Murphy leiab, et seadmel võivad olla negatiivsed tagajärjed.

"Ma arvan, et see võib muuta inimesed laisaks, " ütleb Murphy. Keelte tõlkimine võib olla vaimselt keeruline, sundides aju - eriti seda, mis oskab rohkem kui kahte keelt - erineval viisil töötama, kuid harjutus on sellegipoolest rahuldust pakkuv. Aju tõmbab keelelise empaatia koha pealt, kuhu isegi kõige peenem hääletõlk ei jõuaks kunagi.

Ehkki see universaalne suhtlus võiks olla positiivne, möönab Murphy, “võib see viia selleni, et inimesed mõtlevad, et suhtlevad siis, kui nad pole.” Kultuur ei kehastu alati keeles täielikult (võtame näiteks sarkasmi) ja suhtlemine pole alati edastatava teabe kohta.

Millal võime seda tehnoloogiat oodata?

"2005. aastal kulus meil 1000 lause tõlkimiseks 40 tundi, " räägib Estelle Google'ist. "Täna tõlgime iga 10 millisekundi järel 1000 lause ekvivalenti."

Nagu Richard Anderson 1970. aastate teleseriaalis „ Kuus miljonit dollarit ” kuulsalt ütleb: „Meil on tehnoloogia olemas.” Nüüd on vaja vaid oodata andmete kogumist ja analüüsimist. Kui kaua see aega võtab, jääb Estelle sõnul teadmata. Kuid ettevaatlikud hinnangud panid sellise seadme kümne aasta jooksul meie kätte.

Ehkki rakenduste loojad, nagu Bossier, ega sellised hiiglaslikud ettevõtted nagu Google ja Facebook, ei taha ehitada oma versioone Paabeli piiblitornist, tahab see siiski löristamise lõpetada. See kujutab ette maailma, kus me kõik suhtleme - meditsiini, poliitika ja ideede kohta.

Ja see maailm ei pruugi olla kaugel.

Toimetaja märkus: värskendasime seda lugu 4. aprillil 2014, et kirjeldada täpselt Vocre Translate tehnoloogiat.

Suudlevad keelebarjäärid hüvasti