https://frosthead.com

Kuidas GPS õpib teie keelt rääkima

Austraalia laulja ja häälnäitleja Karen Jacobsen sai plaani 2000. aastal, varsti pärast New Yorki saabumist. Produtsendid - korporatiivtüübid - saatsid ta kolmeks nädalaks helisalvestusstuudiosse, kus ta veetis neli tundi päevas, öeldes selliseid asju nagu “järgmisel ristmikul keera vasakule” ja “arvuta uuesti”. Lõpuks polnud see tema hääl. see oli pinges. “Ma ütlesin umbes 186 korda“ umbes ”, ” meenutab Jacobsen. "Selline asi võib sind nutma ajada."

Seotud sisu

  • Ptolemaiost GPS-i, lühiajalist kaartide ajalugu

Kaks aastat hiljem sai ta sõbralt telefonikõne. “Karen, ” turtsus ta sõber. „Ostsin abikaasale ühe neist uutest GPS-asjadest ja panime selle Austraalia häälele. See oled sina! ”Nii sai Jacobsen teada, et tema hääl andis juhiseid 400 miljonile inimesele kogu maailmas.

Tema töö tõstab esile vere ja tehnika hübriidi, mis läheb nüüd laialt levinud häälte hulka, öeldes meile, kuhu pöörduda: iga kuu usaldab Google Maps enam kui miljard inimest ja 80 protsenti aktiveerib häälevõimaluse.

Häälsünteesi esimestel päevadel - mõelge 1970. aastate lõpu Speak & Spell robotilistele helidele - muutis algoritm teksti ühetooniliseks vooguks. Seejärel võis andmebaaside kasvades salvestada sellise häälnäitleja nagu Jacobsen, kes hääldab silpide ja sõnade korpust, mida algoritmid vastavalt põhireeglitele ühendaksid ja muudaksid. Hiljuti on selliste ettevõtete tarkvarakoodrid nagu Nuance, mis kavandab autodele navigatsiooniliideseid, välja töötanud kolmanda lähenemisviisi - süvaõppe rakendamine kõnesünteesis. See segab salvestatud sõnu ja sünteesitud katkendeid, tuginedes tehisintellektile, et muuta hääldus veelgi inimlikumaks. "Need kõlavad ebasoovitavalt looduslikult, " ütleb Nuance tehnoloogiaametnik Vlad Sejnoha.

Muidugi jäävad keeletõmbed kõnesüsteemide jaoks endiselt väljakutseks. "Mõelge" suurele "versus" ostetud "või" lugege "versus" lugemisele ", " ütleb Google'i pressiesindaja. “Kuid loodetavasti saab kasutaja alati arvata, mida me mõtlesime.” Nüüd, kui AI õpetab auto navigatsioonisüsteeme mõistlikumalt rääkima, otsib see järgmine kord veebimaailmast ja nuputab, kuhu soovite minna, enne kui seda teete.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Telli Smithsoniani ajakiri nüüd kõigest 12 dollariga

See artikkel on valik Smithsoniani ajakirja juuli / augusti numbrist

Osta
Kuidas GPS õpib teie keelt rääkima