Argentiinan inflaatiotilastot

The Economist kirjoittaa uusimmassa numerossaan Argentiinan hallituksen harjoittamasta inflaatiotilastojen vääristelystä sekä pääkirjoituksessaan että syvemmälle aiheeseen paneutuvassa feature-arikkelissa. Tämä on hyvä muistutus siitä, että tilastot eivät aina kerro koko totuutta edes silloin kun ne tulevat melko demokraattisen maan viranomaisilta. Inflaatio ei ole mikään täydellisen neutraalisti mitattavissa oleva asia, vaan sen määrittämiseen liittyy aina valintoja, joilla on suuri vaikutus lopputulokseen. Sama pätee muihinkin taloudellisiin ja yhteiskunnallisiin tilastoihin. Luonnontieteissä asiat voi yleensä määritellä melko objektiivisesti, mutta kun tarkastellaan ihmisten toimintaa, ei voida välttyä valinnoilta ja tulkinnoilta.

Terve kriittisyys kuuluu siis kaikkeen tilastojen kanssa työskentelemiseen, myös tilastotiedon visualisointiin. Ja kriittisyys vaatii asiantuntemusta. Jos ei itse ole aiheen asiantuntija, on otettava selvää siitä, mitä varsinaiset asiantuntijat ovat mieltä tämän tai tuon tutkimuksen tai tilaston luotettavuudesta. (Terve kriittisyys ei toki tarkoita sitä, että pelkkään omaan ja/tai kaverien näppituntumaan perustuen kyseenalaistetaan tutkittu tieto vailla kunnon perusteita ja luetaan tilastoja kuin lukihäiriöinen piru Raamattua.) Valitettava tosiasia on, että visualisointitaidot ja tieteellinen asiantunemus eivät yleensä kulje käsi kädessä, eikä tietenkään ole mahdollista ottaa erikseen selvää joka ikisestä asiasta, joka töitä tehdessä tulee vastaan. Siksi meidän visualistien olisi hyvä aina keskustella asiantuntijoiden kanssa, kun työskentelemme sellaisten tietojen parissa, joita emme aivan suvereenisti hallitse. Onneksi asiantuntijat yleensä tykkäävät puhua omasta aiheestaan aina kun tilaisuus vain tulee. ;)

Lisää Open Data Kitchen -videoita

HRI:n visualisointiblogi julkaisi vielä pari videota lisää taannoisesta Open Data Kitchenistä. Näissä äänessä ovat Informaatiomuotoilu.fi:n lisäksi We Love Open Datan Miska sekä mm. Pikseliähky-festarista tuttu Juha Huuskonen. Ensimmäisessä videossa puhutaan avoimen datan visualisoinnista yleisemmällä tasolla ja tässä toisessa spesifimmin siihen käytetyistä työkaluista. Videotuotanto on, tuota, hieman karu (ei, silmäni eivät oikeasti ole noin turvoksissa :D), mutta mielestäni sisältävät ihan mielenkiintoista jutustelua, jos aihe sattuu kinnostamaan.

Open Data Kitchen Korjaamolla 4.2.

Tänän viikonloppuna eri puolilla kaupunkia on mitä erilaisimpia Helsinkin designpääkaupunkivuoteen liittyviä tapahtumia. Mekin kannamme oman kortemme kekoon. Olemme huomenna, lauantaina 4.2. pyörittämässä yhdessä We Love Open Data -porukan kanssa avoimen datan Open Data Kitchen -workshoppia Korjaamolla klo 14–20 osana Invisible City -tapahtumaa.

Tarkoitus olisi pyöritellä Helsingin kaupungin tilastojulkaisujen dataa sekä äänestystulosdataa ja tehdä kaupunginosakohtaisia visualisointeja. Konseptia kokeiltiin viime syksynä menestyksekkäästi Amsterdamissa ja nyt sitä on hiottu vielä vähän lisää. Tule tsekkaamaan meininki ja tarkistamaan miltä oma kaupunginosasi näyttää tilastojen valossa! Vapaa pääsy, ei vaadi ennakkoilmoittautumista.

Tiedon visualisointia Helsingin katukuvassa

Tänään alkoi Helsingin designpääkaupunkivuoteen liittyvä tiedon visualisoitia tunnetuksi tekemään pyrkivä kampanja joka pyörii vaiheittain keskustan ulkomainospaikoilla kolme viikkoa. Me toteutimme kampanjaan 8 julistetta, joiden lisäksi sisältöä on tuottanut Wonderwater-porukka. Designpääkaupunkihankkeen ja meidän sisällöntuottajien lisäksi kamppikseen ovat olleet myötävaikuttamassa Idealist Group ja BOTH. Monta kokkia siis, mutta lopputuloksena ihan kelpo soppa.

Julkaisemme kampanjaa varten toteutetut visualisoinnit myös verkossa Creative Commons nimeä-tarttuva 1.0 suomi -lisenssillä, olkaapa hyvät.

Kirja-arvio: Willard C. Brinton – Graphic methods for presenting facts

Willard C. Brinton: Graphic methods for presenting facts (The Engineering Management Company, 1914. 371 sivua.)

* * *

(Lainaukset kirjasta allekirjoittaneen vapaita suomennoksia.)

Graphic methods for presenting facts on ensimmäinen englanninkielinen informaatiomuotoilun yleisteos (vaikka tuota sanaa ei toki vielä kirjan julkaisuaikaan käytettykään). Spesifimpiä aiheita käsitteleviä teoksia oli tietysti julkaistu myös englanniksi jo aiemmin ja varsinkin ranskalaiset olivat jo 1800-luvun puolella tuottaneet jo laajoja yleisesityksiäkin tiedon visualisoinnin kentästä (esim. Étienne-Jules Marey: La Méthode graphique, 1878). Brinton erosi edeltäjistään paitsi kielen, myös näkökulman osalta. Hänen missionaan oli tuoda tiedon visualisointi tieteen ja tekniikan maailmasta myös yrityselämään ja politiikkaan.

Brintonin kirja on samaan aikaan sekä tiedon visualisoinnin myyntipuhe (esim. s. 2: ”Jos tosiasioita ei esitetä selkeästi ja kiinnostavasti, ne ovat jokseenkin yhtä vaikuttavia kuin äänilevy ilman levysoitinta.”) että varsin käytännönläheinen ”tee näin” -opas. Monilta osin se on kestänyt aikaa varsin hyvin. Voisi sanoa, että tietyssä mielessä liiankin hyvin. Sadassa vuodessa hyvien suunnitteluperiaatteiden tuntemus tuntuu lisääntyneen yllättävän vähän. Samat perusvirheet joista Brinton kirjoittaa, kuten pituuden ja pinta-alan sotkeminen keskenään, ovat edelleen valitettavan yleisiä. ”Graafinen vertailu tulisi tehdä vain yhden ulottuvuuden mukaan jos se vain on mahdollista.” (s. 22) Tätä ei voi liikaa takoa suunnittelijoiden päähän. Valitettavan tutulta kuulostaa myös: ”Ketä hyvänsä meistä pidettäisiin hulluna eikä suinkaan nerona, jos hän yrittäisi keksiä aivan uusia sääntöjä englanninkieliseen ilmaisuun ja luoda tekstiinsä täysin ennenkuulumattoman sanajärjestyksen. Silti monet toimivat melko lailla tähän tapaan koittaessaan kehittää jonkin uuden ja oudon graafisen esittämisen tavan.” (s. 361)

Jatka lukemista ”Kirja-arvio: Willard C. Brinton – Graphic methods for presenting facts”

HRI-visualisointiblogi

Helsinki Region Infoshare (HRI) julkaisi tänään visualisointibloginsa. Informaatiomuotoilu.fi-porukkakin on päässyt parrasvaloihin videot-osiossa, jossa on kolme Stadi.tv:n tuottamaa videota Open Data Kitchen -workshopistamme Amsterdamin PICNIC-festivaalilta syyskuulta. :) Jäämme suurella mielenkiinnolla odottamaan tulevia sisältöpäivityksiä! Jo nyt varsinkin osio visualisointityökaluista on erinomaisen hyödyllistä sisältöä.

Pientä napinan aihetta tulee taas kerran siitä, että tiedon visualisointia ei blogin sisällöissä kunnolla ole erotettu datataiteesta. Hieman hassusti nimetyssä Visualisointiesimerkkejä-osiossa olevat henkilöesittelyt sisältävät mm. Aaron Koblinin joka aivan selvästi on (erittäin kiinnostava) taitelija eikä visualisti, sekä Tatjana Plahovan, jonka tuotanto myös määrittyy enemmän visuaalisen näyttävyyden kuin tiedonvälityksellisten kysymysten kautta. (Jos datataiteen ja tiedon visualisoinnin ero askarruttaa, Robert Kosara määrittelee sen aika näppärästi.)

Tästä kauneusvirheestä huolimatta voi sanoa, että kokonaisuutena HRI-visualisointiblogi vaikuttaa hyvin kiinnostavalta avaukselta. Sisältö on verrattain hyvin toimitettua ja HRI:n laaja toimintakenttä ja kontaktiverkosto taannee sen, että blogiin saadaan kiinnostavaa sisältöä vastaisuudessakin.

Helsinki Public Transport Visualized

Apps4Finland-kilpailun visualisointisarjan voitti odotetusti Lauri Vanhalan Helsinki Public Transport Visualized -animaatio. Toteutukseltaan työ oli selvästi sarjan paras, mutta sisällöllisesti huomattavasti rikkaampia esityksiä olisi kilpailussa riittänyt (esim. Suomen kansantaloudellinen elämänpuu, busbus, Seismi ja Budjettikone). Informaatiomuotoilu.fi-porukasta kellään ei ollut kilpailussa töitä mukana, mutta ehkä ensi vuonna sitten! ;)

Kaikki kunnia Laurille, animaatio on upeasti toteutettu ja esimerkiksi täysin allekirjoittaneen teknisten taitojen yläpuolella. Hauskassa kiitospuheessa palkintojenjakogaalassa kuultiin myös kuinka paljon työtä ja sitkeyttä esityksen valmiiksi saattaminen vaati. Mutta mielestäni esityksen täysi potentiaali ei toteudu. Video on selkeästi tehty visuaalisen näytävyyden ehdoilla ja siinä se onnistuu upeasti. Mutta tiedonvälitystehtävässään se ei onnistu yhtä hyvin. Animaation tuottamiseen on vaadittu valtava määrä dataa, mutta kuinka suuri osa tuosta datasta välittyy katsojalle asti?

Jos kysyy itseltään videon katsottuaan, mitä nyt tietää jota ei vielä kolme minuuttia sitten tiennyt, vastaus on valitettavasti, ettei kauhean paljon. Helsingin sisäänajotiet ehkä hahmottuvat animaatiosta kiinnostavasti jos niitä ei entuudestaan tunne. Mutta liikenteen määrä näytetään vain muutamalta aamun ensimmäiseltä tunnilta, eli ajallista vertailua koko vuorokauden kaarella ei pääse tekemään ja jo animaation lopussa liikennemäärät ovat niin suuria, ettei eroja esimerkiksi tasaisen kirkkaina hehkuvien eri pääväylien välillä erota. Videon tarkkuus ei oikein riitä koko pk-seutua kuvaavan näkymän yksityiskohtien hahmottamiseen ja lähikuvat taas jäävät irrallisiksi kun ei helposti hahmota, edes että mistä päin kaupunkia ne ovat. Värikoodaus ei erottele busseja raitiovaunuista eikä metroa paikallisjunista.

Joka tapauksessa Helsinki Public Transport Visualized on palkintonsa ansainnut. Ja hatunnoston todella kansainvälisen tason visualisoinnista, joita Suomessa ei ole montaa vielä nähty. Toivon kuitenkin, että projekti ei pääty palkinnon saamiseen, vaan jo tehtyä työtä hyödynnettäisiin vahvemmin tiedonvälityksellisiä arvoja korostavien lisävisualisointien tuottamiseen. Lähes kaikki tarvittavat palikat ovat valmiina, joten suhteellisen pienillä muutoksilla esityksestä saisi näyttävän ja informatiivisen.

Sanapilvet ovat huonoa informaatiomuotoilua

Silmiini sattui tänään kiinnostava linkki Antti Poikolan Datajournalismi-Twitter-syötteessä. The New York Timesin Jacob Harris suomii Nieman Journalism Labin blogissa sanapilviä. Aihe on tärkeä ja ansaitsee huomiota.

Numerotiedon visualisointi on yleensä yksinkertaista, mutta laadullisen tiedon kuvallinen esittäminen on suurempi haaste. Tekstimassa josta puuttuu selkeä, vaikkapa tilastografiikan tuottamiseen soveltuva numerodata, tarjoaa raaka-aineet sanapilven luomiseen. Tarkemmassa katsannossa tämä visualisointitapa osoittautuu kuitenkin vakavasti puutteelliseksi.

Sanapilvi ei sinänsä ole uusi keksintö ja sillä on myös perustellut käyttökohteensa. Tälläkin sivustolla on käytössä asiasanapilvi (oikean laidan sivuvalikossa), jo 1990-luvulla yleistynyt verkkosivujen navigaatioelementti, joka antaa nopean yleiskuvan siitä, mitä aiheita sivustolla olevissa kirjoituksissa käsitellään. Wordlen kaltaiset palvelut ovat viime vuosina tehneet sanapilvien tekemisestä mistä tahansa tekstidatasta helppoa ja ne ovatkin yleistyneet räjähdysmäisesti. Asiasanapilven ja Wordle-sanapilven välillä on kuitenkin olennaisia eroja. Harris mainitsee kirjoituksessaan mm. sen seikan, että mekaanisesti tekstistä tuotettu sanapilvi antaa helposti väärän käsityksen todellisista sisältöpainotuksista. Jos esimerkiksi sanat palautetaan perusmuotoihinsa kuten yleensä tehdään, verbi-ilmaisut kuten ”kannatan” ja ”en kannata” palautuvat samaan muotoon ”kannattaa”, vaikka ne merkitsevät täysin vastakkaista asiaa. Asiasanat taas ovat kirjoittajien harkitusti määrittelemiä. Tietyllä asiasanalla merkityt artikkelit yleensä todellakin käsittelevät nimenomaan tuota aihetta, kun taas sama sana artikkelitekstistä mekaanisesti poimittuna ei vielä kerro juuri mitään. Ja kun jonkinlainen navigointi asiasanoja hyödyntäen joka tapauksessa tarvitaan, on mielekästä visuaalisesti korostaa käytetyimpiä asiasanoja, jotka luultavasti kiinnostavat blogin lukijoitakin keskimärin enemmän, ovathan ne kiinnostaneet kirjoittajiakin muita aiheita enemmän.

Harris summaa jutussa varsin hyvin monia sanapilvien keskeisiä ongelmia, mutta otan tässä esiin vielä yhden seikan jota hän ei mainitse. William Cleveland ja Robert McGill (1984) ovat määritelleet kymmenen alkeishavaintoaihetta, eräänlaista visuaalista koodaustapaa, joiden avulla tietoa visuaalisista esityksistä luetaan. Wordlen tuottamat sanapilvet (hieman toki käyttäjän valinnoista riippuen) vaikuttavat ensi silmäyksellä käyttävän näistä seuraavia: sanojen sijainti kuviossa, niiden pituus, (luku-) suunta, pinta-ala ja väri. Tarkemmin katsoessa huomataan kuitenkin että todellisuudessa vain sanojen pinta-ala esittää relevanttia tietoa. Elementtien pituus riippuu niiden esiintyvyyttä enemmän sanan merkkimäärästä ja muut näistä tekijöistä vaihtelevat täysin satunnaisesti. Visualisointi joka voisi esittää viiden eri muuttujan arvot esittääkin siis vain yhden. Tämä ei ole ainoastaan potentiaalin haaskausta, vaan myös suorastaan haitallista. Kyseessä on ns. red herring -virhe, jossa katsojan huomio ohjataan vääriin asioihin ja kuormitetaan havaintoa epärelevantilla informaatiolla.

Sanapilviä parempi tapa tekstimassojen havainnollistamiseen on verkostovisualisointi, joka näyttää sanojen esiintyvyyden lisäksi myös niiden keskinäisiä suhteita ja tuo näin huomattavasti syvempää sisällöllistä tietoa esiin. Hyvä työkalu tähän tarkoitukseen on esimerkiksi avoimen lähdekoodin Gephi. Mutta mikään automatisoitu työkalu ei korvaa kunnianhimoista toimituksellista työtä, jossa merkitys tekstistä kaivetaan esiin The New York Timesin tapaan toimittajien erityisosaamista hyödyntäen.