Koefitsiendid on see, et kui otsustasite telesaate, bändi, kohaliku ettevõtte või toote Facebooki lehele "meeldida", ei kujutanud te ette, et sellel klõpsamisel on palju tagajärgi. See võib näidata teie sõpradele natuke teie huvisid ja aeg-ajalt põhjustada lehe värskenduste kuvamist teie uudistevoogus.
„Meeldimised” on aga Facebookis kõigile vaatamiseks kättesaadavad, isegi inimesed, keda te pole sõpradeks heaks kiitnud. Ja uue uuringu jaoks, mis täna avaldati ajakirjas Proceedings of the National Academy of Sciences, lõi grupp teadlasi arvutiprogrammi, mis võimaldab kasutajal meeldida ja järeldada tema kohta tohutut hulka teavet, sealhulgas vanus, rahvus, IQ, poliitiline kalduvus, uimastitarbimise tase ja isegi seksuaalne sättumus.
Uuringu jaoks analüüsis uurimisrühm - Cambridge'i ülikooli Psychometrics Labi ja Microsoft Research Cambridge'i partnerlus - 58 000 Ameerika Facebooki Facebooki kasutaja andmeid, kes olid otsustanud oma profiilid ja „meeldimised” analüüsi jaoks Facebooki rakenduse myPersonality kaudu edastada. Teadlased panid need meeldimised algoritmi, mis oli loodud spetsiaalselt selle projekti jaoks, ja võrdlesid seejärel mudeli ennustusi mitmete omaduste kohta nende teadmistega, mida nad teadsid kasutajatest, kes olid oma Facebooki profiilide sisu analüüsimiseks esitanud samuti.
Iga uuritud tunnuspaari - näiteks Kaukaasia või Aafrika-Ameerika, Demokraadi või Vabariikliku - valisid teadlased paar kasutaja, kellest igaüks kuulus igasse kategooriasse, ja algoritm pidi pimesi valima, milline kasutaja sobib millisele kategooriale üksnes nende "meeldib". See ei olnud sajaprotsendiliselt täiuslik ühegi kategooria järeldamisel, kuid oli paljude jaoks ennustamisel ebasündsalt täpne, sealhulgas mõned omadused, mida te tõenäoliselt ei eeldaks, võib nende "meeldimiste" põhjal ära arvata.
Näiteks järeldas see õigesti, milline kasutaja oli Kaukaasia ja Aafrika ameeriklane 95 protsenti ajast, demokraadid ja vabariiklased 88 protsenti ajast ning kristlased ja moslemid 82 protsenti ajast. Allpool on toodud selle täpsuse jaotus paljude kaalutud tunnuste ennustamisel (meeldetuletuseks, kui väärtus 1 tähendab, et mudel on 100 protsenti täpne).
Mudel ennustas varjamatu täpsusega kasutajaomadusi. (Pilt PNAS / Kosinski jt kaudu)Enamiku kasutajate jaoks ei sõltunud see täpsuse tase ilmsetest meeldimistest, mida võiks vaadeldavale joonele seostada. Näiteks vähem kui 5 protsendil geiks tuvastatud kasutajatest oli homoabielu "meeldinud" või muud seotud lehed.
Selle asemel koondas algoritm tonni pealtnäha sõltumatuid meeldimisi, et grupeerida kasutajad klassidesse, kus oli ennustatavaid sarnasusi. Võrreldes “meeldimisi” isiksusetesti tulemustega (mis on ka osa myPersonality rakendusest), leidsid teadlased, et kasutajad, kellele meeldib “äike”, “Colberti aruanne”, “Teadus” või “Curly Fries”, on kõik pisut suurema tõenäosusega kõrge IQ kui neil, kellel seda pole. Samamoodi olid meessoost kasutajad, kellele “Mac Cosmetics” või “Wicked The Musical” meeldisid, pisut tõenäolisemalt geid, samas kui neile, kellele meeldis “Wu-Tangi klann” või “Shaq”, olid pisut vähem tõenäolised.
Kasutaja kõigi meeldimiste analüüsimine võimaldas algoritmil luua neist üldise portree, kuid selle täpsust mõjutas tugevalt iga kasutaja jaoks meeldimiste arv. Madalama taseme (1–10 meeldimisega) jaoks ei olnud ennustused paremad kui juhus, kuid neile, kellele meeldis 150–300, suutis algoritm veelgi paremini parandada kasutajate omaduste äraarvamise võimet .
Teadlased viisid uuringu läbi peamiselt selleks, et näidata, kui palju võib meie avalikult kättesaadav teave meie kohta öelda. Võib-olla ei postitata avalikult oma seksuaalset sättumust, poliitilisi vaateid ega seda, kas kasutate narkootikume, kuid selline programm suudab teie meeldimisi analüüsida ja teha päris täpseid arvamisi sõltumata sellest.
Ehkki kasutajad olid esitanud oma meeldimised ja profiilid analüüsimiseks kolmanda osapoole rakenduse kaudu, tähendavad Facebooki vaikeseadistuste vaikeseaded, et teie meeldimised on kõigile avalikud. Juba Facebooki enda algoritmid kasutavad neid meeldimisi selleks, et dikteerida, millised lood kasutaja uudistevoogudes lõppevad, ja reklaamijad saavad neile juurde pääseda, et teha kindlaks, millised on teie sirvimisel kõige tõhusamad reklaamid.