TARKVARA LOOB ÜHE PILDI, MIS ÜTLEB KÕIK | UUENDUS | SMITHSONIAN - ARTIKLID, KUNST JA KULTUUR, KUNST JA KUNSTNIKUD, INNOVATSIOON, TEHNOLOOGIA

Iga päev laadivad kasutajad Facebooki üles üle 350 miljoni foto. See piltide sissevool on pannud analüütikud hindama, et 10 protsenti maailma 3, 5 triljonist fotost on tehtud viimase aasta jooksul. Kõik need veebi üleujutavad andmed tähendavad, et kui otsite konkreetset pilti või objekti - näiteks kuidas näeb välja oranž habemega kass -, olete positiivselt üle ujutatud otsingutulemustes.

Eelmisel kuul avalikustasid Berkeley osariigi California ülikooli teadlased uue tarkvara, keskmise, ExpressExploreri, mis võimaldab kasutajatel näha "keskmist" pilti, mis tähistab seda, mida nad otsivad. Tuhande sõna väärt pildi asemel on see pilt, mis on väärt tuhat või enamat pilti.

"Kui sisestate Google'i pildiotsingu, sõelute läbi piltide lehti ja lehti, " selgitab UC Berkeley kraadiõppur ja juhtiv autor Jun-Yan Zhu, keda tutvustatakse tänavusel rahvusvahelisel arvutigraafika konverentsil ja näitusel. ja interaktiivsed tehnikad Vancouveris. „See on tohutu ja raske kokku võtta; te ei saa aru, mis toimub. ”

Esialgse pakkumise jaoks kogus Zhu ja tema meeskond Flickri, Google'i ja Bingi pildiotsingute kaudu fotosid. Tarkvara on keskmisel töölaual töötamiseks piisavalt väikese energiatarbega ja suudab üheaegselt krigistada umbes 10 000 pilti.

Kasutajad täpsustavad oma otsinguid paaril erineval viisil. Keskmise pildi tulemuse teravustamiseks saavad nad visandada ja värvida kuju, mis sarnaneb joonisele Adobe Photoshopis või Illustratoris. Näiteks Eiffeli torni keskmise pildi tausta värvimine valib ise keskmise pildi, et tõmmata ainult öösel tehtud pilte. Või võite joonistada nurga all olevad jooned liblika orientatsiooni kontrollimiseks komposiidis.

Puhastades Hingede silla keskmise pildi värve, saate stseeni muuta päevast hämaruseni ööks. (Viisakalt UC Berkeley)

Kui keskmine pilt on loodud, protsess, mis võib kesta kuni minut, saavad kasutajad tulemust veelgi täpsustada, kasutades seda, mida meeskond nimetab Explorer Mode. Selles režiimis kuvatakse pildi teatud osal - näiteks kassi ninal - klõpsamisel selle koha muud tavalised valikud või täpsustused - sinised või mustad ninad või nurga asemel ümardatud ninad. Näiteks viimistles demovideos meeskond pildi jõuluvana süles olevast lastest, valides ainult selliste piltide jaoks, kus jõuluvanal on mõlemal käsivarrel üks laps.

Seal, kus süsteem muutub eriti võimsaks, on Zhu sõnul arvutivaatamise algoritmide treenimiseks mõeldud vahend, nagu näiteks Google Goggles või Amazon Firefly rakendused, mis suudavad tuvastada, mida kaamera osutab. “Arvutinägemise valdkonnas kulutavad inimesed objektide märkimiseks palju raha, ” selgitab ta. „Nüüd saate annotatsiooni rakendada keskmise pildi suhtes. Idee on see, et kõigi andmekogumis olevate piltide levitamiseks peate töötama ainult ühe pildi kallal. ”

Otsingutulemite režiimide täpsustamisega saavad teadlased leida konkreetseid kassitõuge, sealhulgas (vasakult paremale) Ragdoll, Siiami, Maine Coon ja Sphinx. (Viisakalt UC Berkeley)

Kunstiteoste loomine on AverageExploreri madala rippuvusega vili. Meeskond ammutas inspiratsiooni uue meedia kunstnikelt, näiteks Jason Salavonilt, kes on vaevata loonud keskmiselt fotod käsitsi. Seda saaks kasutada ka Facebooki pistikprogrammi loomiseks, mis võimaldab kasutajatel tutvuda keskmise kujutisega endast.

Teadlaste püüdlused on veelgi laiemad ja mõjuvamad. Sotsioloogid võiksid seda süsteemi kasutada sotsiaalsete suundumuste tuvastamiseks ja uurimiseks; näiteks keskmine pilt võiks tõestada, et pruudid seisavad pulmaportreedes enamasti peigmehest paremal. „AverageExplorer” võib olla kasulik vahend ka meedianalüütikutele, kes üritavad telesaateid lahti lõigata - kas Stephen Colberti poos muutub, kui ta räägib George W. Bushist versus Barack Obama?

Lubades kasutajatel visuaalsete andmetega intuitiivselt suhelda, selle asemel et vaeva näha õigete märksõnade sisestamisega, saavad kasutajad ületada seda, mida Zhu nõustaja ja AverageExploreri kaasasutaja Aleksei Efros nimetab keele kitsaskohaks.

Meeskond kujutleb kohandatud tööriistade komplekti, mis on loodud konkreetseteks, raskesti sõnastatavateks ülesanneteks. Näiteks sisseosturakendus võimaldaks kasutajal varustada veebi paari kontsadega, millel on täpne värv, kanna kuju ja kõrgus. Zhu näeb ette tööriista, mis integreerub politsei visandikunstnike töövooga, võimaldades tunnistajal otsida näo andmebaasidest tunnuseid, mis vastavad vägivallatsejale, ja konstrueerida liitportree.

BasicExploreri põhiversioon ilmub sel sügisel.