2016. aasta valimiste lähenedes kuuleme palju „punastest olekutest“ ja „sinistest riikidest“. See idioom on muutunud nii juurdunud, et oleme peaaegu unustanud, kust see algselt tuli: andmete visualiseerimine.
Sellest loost
Rahva kaardistamine
Osta2000. aasta presidendivalimistel oli Al Gore'i ja George W. Bushi vaheline võistlus nii tihe, et ringhäälinguorganisatsioonid poseerisid valimiskogude kaartide üle - tavaliselt värvisid nad punast ja sinist värvi. Veelgi enam, nad rääkisid nendest varjunditest. NBC Tim Russert imestas valjuhäälselt, kuidas George Bush "kui soovite, saada ülejäänud 61 valimisringkonna punast osariiki" ja see keel sai rahva ettekujutuses. Ameerika jagunes kaheks värviks - andmed keerlesid puhtaks metafooriks. Nüüd räägivad ameeriklased rutiinselt isegi lillastest riikidest, mis on poliitilise teabe vaimne visuaalsus.
Me elame andmete visualiseerimise ajastul. Minge mis tahes uudiste veebisaidile ja näete graafikat, mis toetab presidendikandidaatide kaardistamist; avage oma iPhone ja terviserakendus genereerib isikupärastatud graafikuid, mis näitavad, kui aktiivne olete sellel nädalal, kuul või aastal olnud. Saidid avaldavad graafikuid, mis näitavad, kuidas kliima muutub, kuidas koolid segregeeruvad, kui palju teevad emad majapidamistöid võrreldes isadega. Ja ajalehed leiavad üha enam, et lugejad armastavad “datavizit”: 2013. aastal oli New York Timesi kõige loetuim lugu kogu aasta jooksul Ameerika Ühendriikide piirkondlike aktsentide visualiseerimine. See on loogiline. Me elame Big Data ajastul. Kui me mõistame oma keerulist maailma, on üks võimas viis selle graafik joonistada.
Kuid see pole esimene kord, kui avastasime teabe piltideks tegemise naudingud. Üle saja aasta tagasi leidsid teadlased ja mõtlejad, et nad on uppunud omaenda andmete tulva - ja selle mõistmiseks leiutasid nad infograafika idee.
**********
Andmete visualiseerimise idee on vana: lõppude lõpuks on see kaart - geograafilise teabe esitus - ja meil on kaarte olnud umbes 8000 aastat. Kuid harva oli graafiku koostamiseks midagi muud peale geograafia. On olemas vaid mõned näited: 11. sajandi paiku koostas nüüd anonüümne kirjatundja diagrammi, kuidas planeedid taevast läbi liikusid. 18. sajandiks olid teadlased soojenemas mõttele teadmisi visuaalselt korraldada. Briti polümaat Matt Joseph Priestley koostas “Biograafia diagrammi”, millel on graafikul kujutatud umbes 2000 ajaloolise inimese elu. Pilt, mille ta väitis, edastas teavet "täpsemini ja palju lühema aja jooksul, kui see [lugemiseks] kuluks".
Andmete visualiseerimine oli siiski haruldane, kuna andmeid oli harva. See hakkas 19. sajandi alguses kiiresti muutuma, sest riigid hakkasid koguma ja avaldama teavet oma ilmastiku, majandustegevuse ja rahvastiku kohta. „Esmakordselt võiksite oluliste sotsiaalsete probleemidega tegeleda raskete faktidega, kui leiate viisi selle analüüsimiseks, ” ütleb Yorki ülikooli psühholoogiaprofessor Michael Friendly, kes uurib andmete visualiseerimise ajalugu. "Andmete vanus tõesti algas."
Telli Smithsoniani ajakiri nüüd kõigest 12 dollariga
See artikkel on valik Smithsoniani ajakirja juuli / augusti numbrist
OstaVarane uuendaja oli Šoti leiutaja ja majandusteadlane William Playfair. Teismelisena õppis ta šotimaa leiutaja James Watt'i juures, kes täiustas aurumasinat. Playfair sai ülesandeks koostada patendid, mis nõudis tal suurepäraseid joonistamis- ja pildijoonistamisoskusi. Pärast Watti laborist lahkumist hakkas Playfair huvi tundma majanduse vastu ja veendus, et ta saab oma ruumi illustreerimiseks kasutada andmete taaselustamiseks.
"Keskmine politoloog oleks kindlasti suutnud avaldamiseks koostada tabeli, kuid mitte tingimata graafikut, " märgib Toronto ülikooli psühholoog Ian Spence, kes kirjutab Playfairi elulugu. Playfair, kes mõistis nii andmeid kui ka kunsti, oli selle uue distsipliini loomiseks suurepäraselt positsioonil.
Ühes kuulsas diagrammis joonistas ta Ühendkuningriigis nisu hinna tööjõukulude järgi. Inimesed kaebasid sageli nisu kõrge hinna üle ja arvasid, et palgad tõstavad hinda. Playfairi graafik näitas, et see pole tõsi: töötasud tõusid palju aeglasemalt kui toote maksumus.
Playfairi kaubandusbilansi aegrea skeem, mis on avaldatud tema kaubandus- ja poliitilises atlases 1786 (Wikipedia)“Ta tahtis avastada, ” märgib Spence. “Ta tahtis leida seaduspärasusi või muutuste kohti.” Playfairi illustratsioonid näevad sageli hämmastavalt kaasaegsed: Ühes joonistas ta tabelid - ka oma leiutise - ja jooned, milles võrreldi eri riikide elanike arvu nende maksutuludega. Taas esitas diagramm uue, karge analüüsi: inglased maksid palju suuremaid makse kui teiste rahvaste kodanikud.
Neuroloogia ei olnud veel jõuline teadus, kuid Playfair näis mõistavat mõnda selle põhimõtet. Ta kahtlustas, et aju töödeldi pilte kergemini kui sõnu: pilt oli tõesti tuhat sõna väärt. "Ta ütles, et asjad kõlavad peaaegu nagu 20. sajandi visiooniuurijad, " lisab Spence. Playfair kirjutas, et andmed peaksid "rääkima silmadega" - kuna nad olid "parim proportsioonikohtunik, kes suutis seda hinnata kiiremini ja täpsemalt kui ükski teine meie organ." Tõeliselt hea andmete visualiseerimine, väitis ta, "Loob vormi ja kuju paljudele eraldi ideedele, mis on muidu abstraktsed ja omavahel seotud."
Varsti kasutasid haritlased kogu Euroopas andmete visualiseerimist, et leppida kokku linnastumisega, näiteks kuritegevuse ja haigustega. 1830-ndatel Prantsusmaal lõi advokaat nimega André-Michel Guerry kaardid, mis näitasid „moraalstatistikat”. Ta oli üks esimesi, kes kasutas andmete kuvamiseks varje - tumedam, kus näiteks kuritegevus oli hullem või kirjaoskamatus suurem. Tema kaardid olid vaieldavad, sest need lükkasid ümber tavalise tarkuse. Prantsuse sotsiaalkriitikud uskusid, et madalam haridus viis kuritegevuseni, kuid kaartide järgi ei olnud see tõsi. “On selge, ” kirjutas Guerry, “seda suhet, millest inimesed räägivad, pole olemas.” Andmepõhine ühiskonnateadus on sündinud.
19. sajandi keskpaigaks oli moraalstatistika õitsele puhkenud ja teadlased kasutasid epideemiate leevendamiseks andmete visualiseerimist. Kui koolera 1854. aastal Londonit laastas, kaardistas arst John Snow juhtumid ja märkas Broad Streetil veepumba ümber suurt kobarat. Skeptiline linnavolikogu sulges pumba, epideemia vaibus ja Snow kaart aitas edasi viia otsustava idee: et haigusi võib põhjustada kokkupuude seni veel tundmatu nakkuse - bakteritega.
Florence Nightingale'i „roosidiagrammid” näitasid surmajuhtumeid (sinine), sõjahaavu (punane) ja muid põhjuseid (must). (Wellcome'i raamatukogu, London)**********
19. sajandi keskel Ameerikas oli üks suuremaid sotsiaalseid probleeme orjus. Ja just orjus pani liikuma mõned riigi tähelepanuväärsemad andmete visualiseerimised: “orjakaardid”.
Kui lõunaosariigid hakkasid eralduma 1860. ja 1861. aastal, tungisid liidu väed Virginiasse, et proovida lõhestajaid tagasi võita. Aga kuhu peaksid nad oma jõud koondama? Lahingute keskel 1861. aasta juunis koostas föderaalvalitsuse rannikualade osakond põneva Virginia kaardi, milles pakuti välja strateegia. Kasutades viimase rahvaloenduse andmeid, näitas kaart orjade kontsentratsiooni igas Virginia maakonnas: mida tumedam on maakond, seda suurem on orjastatud elanikkonna protsent.
Üks suundumus hüppas kohe välja: orjanduse levialaks oli Ida-Virginia. Läänepiirkond oli suhteliselt orjavaba. See näitas, et lääs hoolib vähem orjapidamise vastu võitlemisest; see võib tõepoolest isegi külgi vahetada ja liituda. Kaart oli sügavalt poliitiline andmete visualiseerimine, osutab Susan Schulten, Denveri ülikooli ajaloolane ja programmi Mapping the Nation autor. Sellega üritati näidata, et ainult suhteline vähemus neitsiaanlasi toetas orjapidamist ja sai sellest kasu. Samuti soovitas see sõjalist strateegiat: proovige lõhestada lääs ida poole.
“See oli läbimurdeline kaart, ” märgib Schulten. „See oli katse mõjutada seda, kuidas valitsus nägi rahvust ja kuidas sõjavägi sellest aru sai. See juhtis Lincolni tähelepanu sellele, kus orjandus oli kõige nõrgem. ”
Varsti pärast seda koostas USA rannikuuuring veel ühe orjatiheduse kaardistava kaardi, välja arvatud see, mis hõlmas kõiki lõunaosariike. President Lincoln oli sellest kaardist vaimustatud, tutvudes sellega kodusõja ajal nii sageli, et see näitas „palju teenimise jälgi”, nagu ametlik portretistija Francis Bicknell Carpenter hiljem meenutas. Ühel päeval oli Carpenter laenanud kaardi, et seda uurida, kui Lincoln tuppa tuli.
" Kas olete mu kaardi kasutusele võtnud, kas olete?" Ütles Lincoln. "Olen seda kõike otsinud." President pani oma prillid kinni ja "pagasiruumi istumine hakkas selle üle väga tõsiselt porisema, " nagu Carpenter hiljem kirjutas. Lincoln osutas positsioonile, kus Judson Kilpatricki armee ratsaväedivisjon võitles nüüd Konföderatsiooni vägedega. "See on täpselt selline, nagu ma arvasin, " ütles ta. Ta on ___County lähedal, kus orjad on kõige paksemad. Nüüd peaksime naastes neist „hunniku” saama. ”Sarnaselt Virginia kaardiga kasutas Lincoln kaarti ka riigi mõistmiseks uuel viisil - et näha, kus lõunamaalased oleksid kõige rohkem ja kõige vähem, ent innukad võidelda põhja poole.
**********
19. sajandi lõpuks oli andmete visualiseerimine loonud uut tüüpi kodaniku. USA-s või Euroopas haritud inimestel oli statistiliselt üha mõnusam mõelda. "Meie aja kaks domineerivat sõna, " kirjutas Oliver Wendell Holmes 1860, "on seadus ja keskmine."
Üks tõeline usklik oli Briti meditsiiniõde Florence Nightingale. Lapsena oli ta matemaatikast nii vaimustatud, et organiseeris tabelites teavet oma aianduse kohta. Tema sõnul oli statistika vahend jumala mõtte tundmiseks; kui väsinud, oli pilk numbritabelile „täiesti elustav”.
Krimmi sõja ajal sai ta võimaluse kasutada oma andmeoskusi. Põllul olles oli Ööbik jahmunud rooja ja kahjuritega immutatud armeehaiglate ja sõdurite kasarmute rämedates oludes. Ta veenis kuningannat Victoria laskma seda teemat uurida ja Nightingale tegi koos oma sõbra William Farriga, kes on riigi juhtivstatistik, armee suremusmäärade analüüsi. Nad paljastasid vapustava fakti: suurem osa Krimmi sõja sõduritest polnud lahingus surma saanud. Nad olid surnud “ennetatavatesse haigustesse” - täpselt nagu hirmsa hügieeni põhjustatud haigused. Koristage hügieen ja päästaksite elusid.
Ööbik mõistis kohutavalt, et numbritabeleid ja teksti on liiga raske sõeluda. Naise sõnul oli neil vaja andmete visualiseerimist - „et mõjutada silmi, mida me ei suuda oma sõnakindlate kõrvade kaudu üldsusele edastada.” Tema leiutis oli elegantne „polaaralade diagramm”, uus pirukavariant. diagramm: iga pirukaviil näitas ühe kuu sõja surmajuhtumeid, surmajuhtumite arvu suurenemisel suurenedes suuremaks ja värvi põhjustena surma põhjuste kuvamiseks. Fännid nimetasid seda roosidiagrammiks, kuna see nägi välja nagu lill.
Kuninganna ja parlament nägid lühidalt hügieeni olulisust; nad asutasid tingimuste parandamiseks kiiresti sanitaarkomisjoni ja surmajuhtumid langesid. Ööbikust sai üks esimesi inimesi, kes kasutas veenmiseks veenvalt andmete visualiseerimist - avalike poliitikate mõjutamiseks.
"Ta oli aktivist ja tahtis midagi muuta, " ütleb Lynn McDonald, Ontario Guelphi ülikooli emeriitprofessor ja Firenze ööbiku " The Collected Works" toimetaja.
Visualiseerimine reguleeris isegi seda, kuidas USA territoorium laienes. Paljud ameeriklased soovisid liikuda läände, kuid eliit polnud kindel, kas interjöör sobib põlluharimiseks. Mõni arvas, et see on “suur Ameerika kõrb”; Smithsoniani institutsiooni teadlane ja sekretär Joseph Henry pidas läänt "viljatuks raiskamiseks ... põllumajanduse jaoks kõlbmatuks" ja ta esitas oma väite toetuseks kaardid, milles analüüsiti armee sademete andmeid. Teised tulistasid tagasi oma andmete visualiseerimisega, väites vastupidist: Läänes olid sademete mustrid tsüklilised, väitsid nad, et sealne maa võiks kindlasti toetada loomade karjatamist. Ekspansionistid võitsid lõpuks võidu. Manifesti saatuse visioon ei olnud üles ehitatud mitte ainult sõnavõttude, vaid infograafika abil.
**********
Sel kevadel koostas Wall Street Journal põneva andmete visualiseerimise pealkirjaga “Sinine sööt, punane sööt”. Ajakirja veebis lõi “visuaalne korrespondent” Jon Keegan interaktiivse lehe, mis näitab, kuidas Facebook välja näeb “väga liberaalseid” kasutajaid. või “väga konservatiivne”. Kuna Facebooki uudistevoog rõhutab lugusid, mis sõpradele meeldivad, kipuvad paljud liberaalsete sõpradega inimesed näitama palju vasakpoolset uudist ja vastupidi. Keegan soovis aidata lugejatel näha, kui valju see kajakambri sees oli.
Tulemused olid hämmastavad: kui vaatasite “sinist voogu”, siis näitas see fotosid tugevast, resoluutsest välimusest Hillary Clintonist. "Punane sööt" näitas postitust "Hillary mürgiste plaanide kohta teiseks muudatuseks" pealkirjaga "otse kurjus".
Tundub, et andmete vanus on loonud isegi uue töökoha: andmeajakirjanik, kellel pole mugav mitte ainult telefonikõnesid ja lugusid kirjutada, vaid ka koodi kirjutada ja andmeid krigistada. Jutu “Sinine sööt, punane sööt” jaoks analüüsis Keegan suurt Facebooki postituste akadeemilist andmestikku. Tänu programmeerimiskeeltele nagu R või Python saavad tänased andmeajakirjanikud teha andmete visualiseerimise igapäevase tähtaja jooksul.
"Varem ei olnud isegi kümme aastat tagasi see, et saime ehitada keeruka andmeanalüüsi sama kiirusega, et keegi saaks loo kirjutada, " ütleb ProPublica andmeajakirjanik Scott Klein. “Ja nüüd saame.” Uudiste väljaostud avaldavad sageli terveid andmebaase koos otsimisliidesega, sest lugejad naudivad end suures andmete jões ringi nokitsedes.
„Me võime tugineda andmeoskuse tasemele, millele me ei saanud tugineda 100 aastat ega isegi 40 aastat tagasi, “ lisab Klein. Igapäevastel inimestel on tööriistad oma elu kohta teabe saamiseks. Näiteks Google täiustas hiljuti veebipõhiseid arvutustabelite rakendusi, nii et kasutajad saaksid automaatselt genereerida visuaalseid andmeid nende sisestatud andmete põhjal.
Järgmine samm? Virtuaalne reaalsus. Miami ülikooli ajakirjandusprofessor Alberto Kairo kujutleb, et paneb VR-peakomplekti ette reportaaži lugema või televiisorit vaatama ja vaatab, kuidas visualiseerimised ujuvad tema ees 3D-vormingus. “Kuidas saate andmepildi reaalse pildi peale asetada?” Imestab ta. See on küsimus selle sajandi William Playfairsil.