Potilastietojärjestelmähankkeen kustannusten mittakaava

Informaatiomuotoilu.fi tuo oman panoksensa sosiaalisessa mediassa viime päivinä kuumana käyneeseen keskusteluun Suomeen hankittavaksi suunnitellusta potilastietojärjestelmästä. Hankkeeseen liittyy paljonkin erilaisia merkittäviä kysymyksiä, joita esimerkiksi helsinkiläinen kunnallisvaaliehdokas Otso Kivekäs on tuonut esiin blogissaan. (Full disclosure: olen itse mukana Otson kunnallisvaalikampanjan tukiryhmässä.) Me keskitymme niistä kuitenkin vain yhteen eli hankkeen arvioituihin välittömiin kustannuksiin.

Konsulttiyhtiö Accenturen Sitralle laatimassa selvityksessä on arvioitu, että hankinnan kokonaisarvo olisi 1,2–1,8 miljardia euroa jos ja kun järjestelmä otettaisiin käyttöön kaikissa Suomen sairaanhoitopiireissä. Tämä on valtava summa. Esimerkiksi Kirsi Louhelainen, myös kunnallisvaaliehdokas (Espoossa), vertasi summaa NASA:n avaruussukkulaohjelman tietojärjestelmän kustannuksiin. Esa Heiskanen vuorostaan laski, että 1,8 miljardilla saisi suomalaisilta it-yrityksiltä hankittua työtä noin 14 000 henkilötyövuoden verran. Esimerkiksi Microsoftin Windows 7 -käyttöjärjestelmää oli kehittämässä joidenkin arvioiden mukaan 2 000 ohjelmoijaa noin kolmen vuoden verran. Vaikka ohjelmistoprojekteissa työvoiman lisääminen ei takaa parempia tuloksia vaan usein päinvastoin, antaa jotain käsitystä hankkeen kaavaillusta mittakaavasta että siihen ollaan potentiaalisesti investoimassa enemmän työtä kuin kokonaisen käyttöjärjestelmän kehittämiseen.

Helpoiten mittakaavan hahmottaa kuitenkin visuaalisesti. Seuraavassa potilastietojärjestelmän ennustettu 1,2–1,8 miljardin kokonaiskustannus on suhteutettu muutamiin poliittisessa keskustelussa intohimoja herättäneisiin valtion ja pk-seudun kuntien menoeriin.

Jos suunniteltu hanke onnistuu kaikissa tavoitteissaan, 1,8 miljardin investointi on toki hyvin perusteltu. Mm. valtiontalouden tarkastusvirasto on kiinnittänyt huomiota siihen, että käyttäjäystävällisemmät ohjelmistot toisivat mittavia säästöjä terveydenhuoltoon. Mutta kuinka todennäköistä on, että hanke todella onnistuu kaikissa tavoitteissaan? Ainakaan se ei ole itsestäänselvää. Toisessa vaakakupissa on se riski, että hanke voi myös epäonnistua todella pahasti, myös taloudellisesti.

Jos katsotaan muutamia otsikoissa olleita julkishallinnon it-hankkeita, ei vaikuta kovinkaan tavattomalta että alkuperäiset kustannusarviot ovat osoittautuneet melko optimistisiksi:

Hanke Alkup. kust.arvio Viimeisin kust.arvio Ylitys
Valtionhallinnon dokumentinhallinta ja arkistointi -hanke (VALDA) 5,5 milj. € 9 milj. € 64 % Lähde 1, 2
Ulosoton tietojärjestelmähanke 6 milj. € 16 milj. € 167 % Lähde
Sähköinen kuljettajarekisteri 20 milj. € 100 milj. € 400 % Lähde
Puolustusvoimien atk-, tulostus- ja kopiointjärjestelmien ulkoistaminen 14 milj. € 72 milj. € 414 % Lähde
Kansallinen tietoarkisto ja sähköinen resepti (KANTA) 20 milj. € 450 milj. € 2 150 % Lähde

Rehellisyyden nimissä on todettava, että tähän listaan on tietysti poimittu vain pahimpia epäonnistumisia. Mainiosti onnistuneista hankinnoista ei revitä samanlaisia otsikoita. Silti, worst case -skenaarionkin mahdollisuus ansaitsee osakseen hieman pohdintaa. Näiden viiden VTV:n moittiman hankkeen keskimääräinen kustannusten ylitys oli uskomattomat 639 %. Lisäksi pitää huomioida, että luvuissa ei ole mukana kuin suorat lisäkustannukset, ei viivästymisestä ja huonolaatuisesta lopputuloksesta johtuvia välillisiä kustannuksia. Esimerkiksi VALDA-järjestelmä ajettiin lopulta kokonaan alas eli siihen käytetyt 9 miljoonaa olivat kokonaan hukkaan heitettyä rahaa.

On tietysti pelkkää spekulointia ja kauhuskenaarioiden maalailua väittää, että uuden potilastietojärjestelmän kustannukset, edes välilliset kustannukset huomioiden karkaisivat näin pahasti käsistä. Mutta ajatusleikkinä, entä jos järjestelmän hankinta todella menisi yhtä pahasti puihin kuin yllä kuvatut hankkeet ja ylittäisi budjetin tuolla 639 prosentilla? Silloin kokonaiskustannus olisi 13,3 miljardia euroa ja vertailukohtia pitäisi hakea jo varsin hurjasta suuruusluokasta:

Korostan, että yllä oleva kuva ei ole tarkoitettu realistiseksi arvioksi siitä, miten voi käydä jos tähän hankintaan lähdetään. On silti hyvä muistaa, miten monia pahoja epäonnistumisia julkisen sektorin it-hankinnoissa on tehty ja että jos nyt pohdittavana oleva projekti menee yhtä pahasti kiville, hintalappu on aivan mieletön.

Kun puhutaan näin suurista asioista, tarvittaisiin syvällisempää julkista keskustelua hankinnasta ja sen toteutustavasta kuin mitä tähän asti on nähty. Ei ole oikein, että miljardiluokan hankintaa joka määrittelee suomalaisen terveydenhoidon toimintaedellytyksiä vuosiksi eteenpäin viedään eteenpäin kulissien takana ja luottamushenkilöiden oletetaan toimivan kumileimasimena joka ei kyseenalaista tehtyjä päätöksiä. Toivon vilpittömästi, että Helsingin terveyslautakunta huomisessa kokouksessaan palauttaa asian uudelleen valmisteltavaksi ja siitä käydään se julkinen keskustelu jonka tämän mittakaavan hankinta vaatisi.

______________________________

Lisäys 10.9.2012 

Meiltä on aiheellisesti kysytty, miksi käytämme yllä olevissa kuvioissa pinta-aloja kuvaamaan summia pituuden, siis tavallisen pylväskuvion sijaan. Onhan alalla yleisesti tunnettu fakta, että ihmiset ovat huomattavasti parempia havaitsemaan eroja pituudessa kuin pinta-alassa. Pinta-alaerot yleensä aliarvioidaan varsin reippaasti. Alla ensimmäisen laatikkokuvion tiedot myös perinteisen pylväskuvion muodossa:

Tämä kuvio antaa pienen vihjeen siitä, miksi tällä kertaa päädyimme käyttämään laatikoita pylväiden sijaan. Ennen kaikkea kyse on tilankäytöstä: nimiöt ovat niin pitkiä, että pylväskuviona esitettynä tärkein asia eli elementtien koot ei saa ansaitsemaansa visuaalista painoarvoa. Ja vaikka valittu esitystapa hieman ”vähätteleekin” kokoeroa vertailukohtiin, potilastietojärjestelmän hinta-arvio on niin poskettoman suuri että kuvion viesti tulee selväksi joka tapauksessa.

Kriitiikki on silti perusteltua. Taisimme itse sortua hieman siihen, mistä olemme usein muita kritisoineet: esitystavan näyttävyyden korostamiseen tiedonvälityksellisten kriteerien sijaan.

Lapsiperheiden kantakaupunki – vai väärin laadittu koropleettikartta?

Helsinkiläinen kunnallispoliitikko Mikko Särelä on laatinut jonkin verran huomiota sosiaalisessa mediassa keränneen kartan joka näyttää, kuinka paljon lapsia neliökilometrillä Helsingin eri osissa asuu. On ihan totta, että lasten osuus kantakaupungissa on ollut kasvamaan päin; alle kouluikäisistä helsinkiläislapsista asuu nykyisin kantakaupungissa vajaan viidenneksen isompi prosenttiosuus kuin vuonna 1992. Harmi kyllä, Särelän kartta ei paljasta tätä kunnallispolitiikan kannalta varsin merkittävää seikkaa vaan tulee kertoneeksi lähinnä Helsingin eri osa-alueiden asukastiheyden.

On vanha informaatiomuotoilun nyrkkisääntö, että koropleettikartalla ei pitäisi kuvata absoluuttisia vaan ainoastaan suhteellisia lukuja. Miksi näin? Otetaanpa käytännön esimerkiksi tämä Helsingin seudun kuntia kuvaava kartta:

(Kiitos, kiitos, kyllä tällä komistuksella vielä joku design-palkinto voitetaan!)

Yllä oleva kartta kuvaa HSL:n julkaisusta Liikkumistottumukset Helsingin seudun työssäkäyntialueella vuonna 2008 löytyvää tietoa siitä, kuinka paljon ”pääasillisia autonkäyttäjiä”* alueen eri kunnissa on, neliökilometrille laskettuna. Ja kas vain! Helsingin kantakaupungissa on 1 745 pääasiallista autonkäyttäjää neliökilometrillä kun taas esimerkiksi Vihdissä heitä on vain 25/km².

Voidaanko siis päätellä, että Helsingin kantakaupungissa suurin osa ihmisistä liikkuu omalla autolla ja Vihdissä ei? No ei voida. Pääasiallisten autonkäyttäjien osuus on kantakaupungissa vertailun pienin (37 %) ja Vihdissä puolestaan suurin (68 %). Kartta näyttää käytännössä vain sen, että Helsingin kantakaupungissa asutaan tihemmin kuin Vihdissä.

Koropleettikartta on hyvin herkkä aluejaolle. Jako on harvoin sellainen että eri alueet, olivat ne nyt sitten kuntia kuten esimerkkikartassani, suurpiirejä kuten Särelän kartassa tai jotain muita, olisivat asukasluvultaan ja -tiheydeltään vertailukelpoisia. Niinpä näytettäessä absoluuttisia lukuja, tullaan yleensä kuvanneeksi vain aluejaon ominaisuuksia. Havainnollinen esimerkki löytyy Wikipediasta, jossa sama väestötieto Bostonista on kuvattu sekä absoluuttisena henkilömääränä väestölaskentaruudukon lohkoissa että asukaslukuna eekkerillä samoissa lohkoissa:

Toki absoluuttisia lukujakin kuvaava kartta jotain paljastaa. Se, että kantakaupungissa on enemmän autoja neliökilometrillä kuin Vihdissä on ihan merkittävä tieto liikenteen suunnittelun kannalta. Mutta liikenneinsinöörit tarvitsevat paljon tarkempaa tietoa kuin mitä karkean tason teemakartta paljastaa. Tällaiset kartat palvelevat lähinnä viestinnällisiä tarpeita kun halutaan puhutella muita kuin asiantuntijoita, ja absoluuttisia lukuja esittävä koropleettikartta yleensä lähettää väärän viestin.

On totta, että lapsiperheiden palvelut kantakaupungissa eivät ole kasvaneet samaa tahtia kuin lasten osuus väestöstä ja esimerkiksi päiväkotipaikkojen saaminen on vaikeampaa kuin esikaupunkialueilla. (Poikkeuksia toki on, suuntaan ja toiseen.) Päiväkotipaikkojen pitäisi olla lähellä niiden käyttäjiä, siis lapsia, ja tässä suhteellinen osuus on vähemmän merkittävä tekijä kuin lasten absoluuttinen määrä. Mutta koropleettikartta ei ole oikea väline sen kuvaamiseen. Nyt kartta antaa sellaisen mielikuvan, että kantakaupungissa asuisi suhteellisesti – tai jopa absoluuttisesti – enemmän lapsiperheitä kuin muualla Helsingissä. Kumpikaan ei pidä paikkaansa. Lapsiperheitä asuu kantakaupungissa tiheämmässä kuin esikaupungeissa, mutta niin asuu likipitäen kaikkia muitakin kuviteltavissa olevia ihmisryhmiä: autoilijoita, maahanmuuttajia, työttömiä…

Kantakaupungin lapsiperheet – ryhmä johon kuuluu paljon omiakin ystäviäni ja tuttaviani – ja heidän alimitoitetut palvelunsa ansaitsevat kyllä huomiota näin kunnallisvaalien alla käytävässä julkisessa keskustelussa. Mielestäni Särelä on aivan oikeilla jäljillä nostaessaan teeman esiin, mutta informaatiomuotoilun ammattilaisena täytyy todeta että valittu työkalu ei sovi sen datan esittämiseen, johon sitä nyt on käytetty. Jos koropleettikarttaa haluaa käyttää, sillä voisi kuvata vaikkapa tarjolla olevien päivähoitopaikkojen suhdetta lasten määrään. Jos haluaa näyttää pelkästään lasten absoluuttisen määrän, mielenkiintoisempi olisi vaikkapa aikasarja joka näyttää miten määrä on kehittynyt. Kenties asia on kuitenkin luonteeltaan sellainen, että sen ydin tulee paremmin esiin tekstin kuin grafiikan muodossa.

____

*) Tämän käsitteen tarkempi määritelmä löytyy raportin sivulta 44. Olisin mieluummin näyttänyt henkilöautojen määrän kunnissa, mutta siitä en valitettavasti nopealla googletuksella löytänyt tietoa, joten tämä hieman monimutkainen tilastointimääritelmä saa toimia tämän demonstraation tarpeisiin likiarvona sille.

Koska suomalaiset saavat alkunsa?

Matt Stiles julkaisi The Daily Viz -blogiissan joitain päiviä sitten visualisoinnin joka kuvaa eri syntymäpäivien yleisyyttä Yhdysvalloissa. Ongelmallista Stilesin toteutuksessa oli, että se perustui dataan joka ei sisältänyt varsinaisia syntyvyyslukuja, vaan ainoastaan eri päivämäärien yleisyysjärjestyksen. Tästä syystä Stiles teki vielä uuden version joka perustuu absoluuttisiin lukuihin. Uudesta kuviosta käy ilmi, että kuukausittainen vaihtelu syntyvyydessä on lopulta varsin pieni.

Juttu herätti kysymyksen siitä, miltä syntyvyyden kuukausittainen vaihtelu mahtaisi näyttää Suomessa. Parahiksi Tilastokeskuksella on syntyvyydestä tarjolla varsin tarkkaa dataa. Syntymäkuukautta kiinnostavampaa on ehkäpä se, milloin lapset saavat alkuunsa. Yhdeksän kuukauden siirto lukuihin onnistuu toki päässälaskunakin, mutta hieman hankalasti. Siksi päätin sopivasti näin alkukesän tienoilla tehdä kuvion, joka esittää syntyvyyden kuukausittain ja jossa tämä muutos on tehty valmiiksi. Kuviosta voidaan lukea joko syntymäkuukausi (himmeällä suluissa), tai sen alla voimakkaammalla tekstityypillä ladottu oletettu hedelmöityskuukausi.

 

Koska alkuperäinen data kertoo vain syntyvyydestä, kuvio on lähinnä suuntaa antava, koska se ei huomioi keskimääräistä lyhyempiä tai pidempiä raskauksia. Kuvioon merkityt eri vuodet viittaavat samasta syystä syntymävuoteen, eivät siihen vuoteen jolloin lapsi on saanut alkunsa. Aiheen syklisyydestä johtuen kuviotyypiksi soveltui poikkeuksellisesti tutkakuvio. Kuvion katkaistu asteikko ylikorostaa vaihtelua tarkoituksellisesti.

Kuviosta voidaan havaita, että ajatus juhannuslapsista ei ole täysin tuulesta temmattu: kesäkuussa alkunsa saaneita lapsia on vertailun joka vuonna selvästi enemmän kuin toukokuussa. Muutoin suvunjatkaminen vaikuttaisi painottuvan pikemminkin syksyn ja talven puolelle. Esimerkiksi vuoden 2011 elokuussa, jolloin oli eniten syntyneitä, maailmaan tuli peräti 853 uutta suomalaista enemmän kuin saman vuoden joulukuussa. Vuoden 2011 lapsista oli siis laitettu alulle peräti 18% enemmän marras- kuin maaliskuussa.

Entäpä miltä kuvio näyttäisi, jos vaihtelua ei korosteta asteikkoa katkaisemalla? Tein Stilesin esimerkkiä seuraen tällaisen kuvion, johon on laskettu kuukausien päiväkohtaiset keskiarvot:

Kuukausittainen vaihtelu  näyttäisi tämän perusteella olevan Suomessa aavistuksen suurempi kuin Yhdysvalloissa. Huippukuukausi on sama (syyskuussa syntyneet eli joulukuussa alkunsa saaneet), mutta joulukuun alhainen syntyvyysluku poikkeaa amerikkalaisesta datasta. Mitäköhän Suomessa ja USA:ssa siis tapahtuu maaliskuussa?

______________________________

Päivitys 23.5.2012 

Kommenteissa esitettyjen hyvien huomioiden perusteella päätin tehdä pienen päivityksen. Ensimmäisessä tutkakuviossa oli tosiaan suoraan käytetty absoluuttisia syntyvyyslukuja, joten kuukausien eri pituuksia ei ollut kompensoitu. Pylväskuviossa tämä oli huomioitu, se näyttää syntyneet per kuukausi jaettuna kuukauden pituudella. Alla oleva uusi kuvio näyttää nyt samalla tavalla syntyneet per kuukausi, unohtamatta vuoden 2008 karkauspäivää. Voidaan huomata että helmikuun syntyneiden kohdalla aiemmassa grafiikassa ollut notkahdus on hävinnyt, mutta muutoin yleiskuva on varsin samannäköinen.


Epätarkkuutta lisää tietysti se seikka, että hedelmöityskuukausi voi olla erimittainen kuin syntymäkuukausi. Vaihtelu kuukausien pituudessa on kuitenkin pientä verrattuna raskauksien tavalliseen pituusvaihteluun: raskauden keston arviointi heittää parhaimmassakin tapauksessa 8-9 päivää ja vähemmän kuin viisi prosenttia lapsista syntyy tarkalleen 40 viikon raskauden jälkeen. 80% syntymistä tapahtuu kahden viikon sisällä 40 viikosta. Näin kuvio on hyvin karkeasti suuntaa antava siittämiskuukauden kohdalla. Tarkan tieton saamiseksi siitä milloin suomalaiset lapset on pantu alulle vaatisi siis enemmin kyselytutkimusta. Liekö sellaista tehty?

Aiempien vuosien ja pitkän ajan muutosten visualisointi on ehdottomasti mielessä ja siihen tulen varmasti vielä palaamaan vastaisuudessa, data kun ulottuu aina vuoteen 1900 asti.

Student Works From our Course, Part I

Some of our readers know that we run an information design course at Aalto University each year. It’s organized by the graphic design department, but enrollment is open to all Aalto students. We typically have a slight majority of graphic designers and a growing number of technology students participating. I think a mixed group such as this is what Aalto’s founding group had in mind. All we need now are a few business students to participate in the next course and we’ll boast one of the most diverse groups in the whole university.

We see lots of interesting student works on the course each year, but apart from outside guests to the review sessions, very few people ever get to see them. Here are some examples that I split into two separate posts according to the assignment.

Improve Wikipedia!

Jonatan, Juuso and I have been involved in the Finnish open knowledge community, a budding movement to engage citizens and officials in a drive to open government databases and increase the amount of information that’s freely accessible to the public. The Open Data Kitchen is part of it, but we also take part in other ways.

I was recently made president of Wikimedia Suomi, a small local chapter of the organization that promotes Wikipedia, the free encyclopedia. One of its goals is to get experts and advanced students to participate in editing Wiki articles. Getting text contributions is usually no problem, but the quality of information graphics is far behind that of the articles themselves. We thought we’d help by giving the students in our course an assignment to design new visualizations or to redesign existing ones. To narrow the scope a little, all the articles they’d work on would be related to economics.

Showing how the Gross Domestic Product and national population figures line up in European countries. Countries that are relatively poor have population stacks that flow over the GDP bar. Work by Karoliina Liimatainen, Aalto University School of Science and Technology.

 

 

A diagram by Anssi Kokkonen illustrating the way money is released into the economy.

 

Sasa Kerkos designed a simplified diagram of the Atlantic slave trade.

 

The Big Mac Index is a popular and intuitive tool for many things. For one, it gives you an idea if a currency is over- or undervalued. This visualization shows how many burgers you get if you spend a hundred bucks. Work by Antti Vuorela, Aalto University School of Science and Technology. (click to enlarge)

 

A simplified map of the legendary Silk Road. Work by Jutta Joutjärvi.

 

An experimental way to visualize the Gini coefficient (a measure of income disparity) and GDP per capita. Work by Vahid Mortezaei.

Käsittämättömän kuvaaminen

Teksti on julkaistu lyhennettynä Grafia-lehdessä.

Informaatiomuotoilun voima on asioiden näyttäminen niiden todellisissa mittasuhteissa. Se on verrattain helppoa silloin, kun esitettävät asiat ovat jollain tavalla katsojan arkikokemukseen verrattavia, mutta usein näin ei ole. Valaisivimmat näkemäni esitykset ovat onnistuneet voittamaan käsityskyvyn rajoitukset ja antaneet realistisemman näkökulman asioihin kuin pelkät asiantuntijoiden selitykset.

Kuten tästä dvice.comin kuvasta näkyy, kuuluisan Virgin Galacticin avaruuskoneen lentokorkeus peittoaa saman sarjan kilpailijat, mutta on mainettaan mitättömämpi ainakin verrattuna valtiollisten ohjelmien saavutuksiin.

Yleisimmät vaikeaa mittakaavaa käyttävät esitykset liittyvät avaruuden sijaan tavalla tai toisella talouteen. Vuoden 2008 velkakriisin laajetessa syntyi joukko huonoja uutisia. Niiden myötä ilmestyi uutisiin lukumääriä, jotka ovat satoja kertaluokkia suurempia kuin mitä arkielämässä yleensä kohtaa. Kuukausien sisällä päätettiin satojen miljardien dollarien suuruisten rahamäärien kohtalosta. Pelastuspakettien vastustajat Yhdysvalloissa käyttivät pitkiä puheenvuoroja, jotka vilisivät lukusanoja, joita yleensä käytetään vain tähtitieteessä. Niillä ei kuitenkaan ollut samaa selittävää voimaa kuin hyvillä visualisoinneilla, jotka laittoivat luvut oikeaan asiayhteyteen. Lukijan on helpompi hahmottaa vuoden aikana talouteen kaadetun rahan määrä, kun koko paketti on eritelty ja laitettu vierekkäin maan suurimpien menoerien kanssa kahden vuosisadan ajalta. Tällainen visualisointi on tehokasta ja puhuttelevaa sisältöä ja vaatii suunnittelijalta samaa vastuuta kuin toimittajalta.

Vaikka esitys saisi olla visuaalisesti hiotumpi, se auttaa hahmottamaan elvytyspaketin suuruutta. Kuva ei aivan ehtinyt Bailout Nation -kirjan kovakantiseen painokseen, mutta se osoittaa tekijöidensä kyvyn esittää asiat ymmärrettävässä asiayhteydessä.

Toinen ihmiselle vaikeasti hahmottuva asia on todennäköisyys (tähän lottoamisenkin suosio perustuu). Olemme luonnostamme taitamattomia arvioimaan harvinaisten tapahtumien todennäköisyyksiä. Seuraavanlaisia kuvia voisi jakaa kaikille luulotautisille ja kroonisesti pelokkaille.

(klikkaa päästäksesi suurempaan versioon)

Hyvän viestinnän ohjeen mukaan ihmisen havaintokyky on kaventuva ja tarkentuva: havaitsemme suuripiirteisesti laajoja kokonaisuuksia ja niiden pienempiä osasia yksityiskohtineen, mutta emme kumpaakin yhtä aikaa. Kirjoittajalle tämä tarkoittaa, että uudet asiat esitellään aloittamalla yleisistä piirteistä ja päätymällä lopulta yksityiskohtiin. Informaatiomuotoilussa sama johdattelu tehdään käyttämällä kuvan sisäistä visuaalista kielioppia. Siinä yleinen taso on se, jonka lukija huomaa ensinäkemältä. Se määrittää mittakaavan ja esitettävän tiedon eri tyypit. Yksityiskohtaisin taso näyttää tarkimman tiedon, jonka parhaassa tapauksessa voi suhteuttaa saumattomasti kuvan muihin osiin. Pelkkä datatiheys ei tee kuvasta arvokasta, sillä ilman yhdistäviä vinkkejä se on vain tiedon saareke. Edellä näytetyissä esimerkeissä johdattelu yleisen ja yksityisen välillä tapahtui yksinkertaisesti visualisoimalla luvut eri asiayhteyksiin. Saman voi tehdä monipolvisesti, kuten itse kokeilin tässä puretussa aikajanassa, joka havainnollistaa geologisen ajan jakotapaa:

 

(kuva suurenee klikkaamalla)

Harmittavan yleinen tapa graafikoilla on tekstin välttäminen informaatiomuotoilussa. Ehkä kyse on liiasta itsevarmuudesta (tai turhamaisuudesta). Tekijä luottaa kuvakerrontansa vahvuuteen niin paljon, että tekstin käyttäminen tuntuu luovuttamiselta. Ehkä kyseessä on myös jonkinlainen tiedostamaton reviirijako kuvittavan ja kirjoittavan väen välillä. Joka tapauksessa on harvoin mitään oikeaa syytä olla käyttämättä tekstiä osana esitystä. Uudet asiat on joka tapauksessa avattava sanallisesti, ja parhaiten se onnistuu kun selitys on osa kuvitusta. Typografian hierarkiaa luovat keinot ovat kuvallisia kerrontatapoja muiden rinnalla.

Kun visuaalinen kielioppi on johdonmukainen ja helppo hahmottaa, sitä voi jatkaa eri mittakaavojen lisäksi eri kuviin. Kun samaan raamiin laadittuja kuvallisia tietokokonaisuuksia järjestetään kuvasarjaksi, niitä vertaamalla voi nähdä pieniäkin muutoksia lukumäärien ja muiden arvojen välillä. Edward Tufte käyttää näistä nimitystä small multiples, toistokuvio. Tämän keinon vahvuus vaikeasti hahmotettavien asioiden kuvaamisessa on sen kyky kertoa muutoksen laatu ja määrä hyvin tarkasti. Tällaiset esitykset näyttävät sommittelunsa puolesta hieman sarjakuvilta, ja niissä toimii lukemisen johdattelun kannalta pitkälti sama logiikka. Tufte on sitoutunut pelkistettyyn ja hienovaraiseen esittämiseen ja perustelee mieltymyksensä hyvin, mutta sarjakuvakerronnan keinoilla olisi paljon annettavaa informaatiomuotoilulle. Etenkin aikasarjaan järjestetyissä kuvissa sarjakuvateoreetikko Scott McCloudin ohjeet ruutusommittelusta tekisivät esityksistä parempia. Ne ovat yhtä avartavaa luettavaa kuin mikä tahansa informaatiomuotoilun teorian klassikoista, mutta ikävä kyllä yhtä huonosti saatavilla suomeksi. Hänen nettisivunsa ovat kuitenkin hyvää luettavaa kaikille graafikoille. McCloud jakaa ruutuvaihdosten tyypit kuuteen luokkaan riippuen ajallisen ja tilallisen muutoksen määrästä ruutujen välillä. Hetkestä hetkeen tapahtuva muutos on näistä välittömin, kun taas suurin muutos vaihtaa kohtauksen tapahtumapaikan ja -ajan täysin. Mikään teoria ei tietenkään korvaa kokeneen suunnittelijan visuaalista rytmitajua, mutta ruutukerrontaan liittyy yllättäviä ja helppotajuisia lainalaisuuksia, joita avataan lyhyesti kirjassa Sarjakuva – näkymätön taide.

Tilastografiikassa mitta-asteikon yhdenmukaisuus on selkeyden kulmakivi. Siitä tulee kuitenkin rasite, kun esitetään yhdessä kuvassa täysin eri kertaluokkien lukuja. Tällaisiin tarkoituksiin ei ole sellaisia valmiita ratkaisuja, joita muut kuin asiantuntijat osaisivat lukea. Tämä ei estä hyvää tarkoittavia valistajia yrittämästä. Välillä suurelle yleisölle tarkoitettuihin julkaisuihin eksyy jopa tilastokuvia, joissa käytetään logaritmista asteikkoa. Ne kertovat tekijöiden oppineisuudesta, mutta harvoin avaavat sisältöä lukijalle. Eri mittakaavojen asioita vertailtaessa onkin välillä luovuttava yhtenäisestä mitta-asteikosta. Rinnastus on silti mahdollista, jos muut kuvalliset mittarit ovat yhtenäiset. Väri on tässä yleinen apu, samoin kuin typografinen hierarkia. Isotype-kuvista tutut yksikkösymbolit ovat myös tapa kuvata lukumääriä vertailukelpoisesti. Kun jokainen symboli on suunniteltu hyvin skaalautuvaksi, rinnastettavilla kuvilla voi olla suurikin määrällinen ero. Mittakaavaongelman ratkaisemiseksi osiin purettu kuva vie usein enemmän tilaa ja esittää edelleen saman datamäärän, mutta tiheyden menetystä korvaa sen saama kerronnallinen arvo. Vaikka infokuvan ei pidäkään olla kuvitusta, tällaiset koostetut esitykset ovat usein esteettisestikin kiinnostustavia.

Vaikeasti hahmotettavien asioiden tulkitsemisessa kuviksi pelkät äärimmäiset mittakaavat eivät ole ainoa ongelma. Suunnittelijan oma ymmärrys aiheesta on kapein pullonkaula. Parhaissa esityksissä tekijä on hankkinut vähintään perustiedot aiheesta ennen kuvan luonnostelua, mikä näkyy oivaltavina ja genren rajoja rikkovina ratkaisuina. On parempi, että aineistoon perehtyy graafinen suunnittelija kuin että kuvan tekisi visuaalisuuteen perehtymätön aiheen asiantuntija. Moni tärkeä uutinen on joka tapauksessa vaikea käsittää, ja hyvä kuva avaa sen sisällön tavalla, johon pelkkä teksti ei kykene.

Findikaattori

Suomalaiset viranomaiset tiedottavat tekemisistään välillä turhan vaatimattomasti. Lueskellessani tänään edellisen blogipostauksemme aiheeseen liittyvää Hesarin artikkelia törmäsin mainintaan Findikaattori-palvelusta. Mikä ihmeen Findikaattori?

Kyseessä on valtioneuvoston kanslian ja Tilastokeskuksen yhteinen palvelu, johon on koottu parinkymmenen eri julkisen tahon keräämää tilastotietoa mitä erilaisimmista aiheista, huolella toimitettuna ja visualisoituna. Sivusto avattiin jo syksyllä 2009 jolloin asiasta uutisoitiinkin melko laajasti. Muistelen silloin itsekin käyneeni ihmettelemässä palvelua, mutta koko juttu unohtui nopeasti ja pysyin Tilastokeskuksen Statfin-palvelun uskollisena käyttäjänä.

Kaikessa hiljaisuudessa Findikaattoria on kehitetty ja sisältöä lisätty. Dataa on valtavasti ja käytettävyydeltään paketti on ihan eri tasolla kuin Statfinin oma aataminaikainen insinöörikäyttöliittymä. Aineisto on jäsennelty teemoittain sekä yleisellä tasolla että hallitusohjelman tavoitteiden mukaisesti. Visuaaliset esitykset luodaan automaattisesti tietokannassa olevasta datasta, eli kuviot päivittyvät sitä mukaa kun Tilastokeskus saa uutta aineistoa kerättyä. Jokaisen tilaston saatteena on lyhyt asiantuntijan laatima sanallinen selvitys joka auttaa ymmärtämään aineistoa paremmin. Graafisen esityksen lisäksi sama aineisto on tarjolla myös numeroina, ja sokerina pohjalla tilastot saa myös helposti ladattua omalle koneelle avoimen datan periaatteella. (Avoimen datan periaatteen edistämisestä onkin tuore valtioneuvoston periaatepäätös jonka edistämiseen Findikaattori on erinomainen työkalu.)

OECD:n palkinnonkin saanut Findikaattori on juuri sellainen palvelu josta valtionhallinnon kannattaisi pitää isompaa meteliä. Julkiset tietotekniikkahankkeet kun yleensä ovat otsikoissa vähemmän mairittelevissa yhteyksissä.

OECD:n Better Life -indeksi

The Ulkopolitist-blogi kirjoittaa uusista talous- ja hyvinvointi-indikaattoreista joista toivotaan korviketta jälkiteollisen yhteiskunnan kehityksen mittaamiseen turhan suppealle BKT:lle. Aihe on yleisesti ottaenkin kiinnostava, mutta informaatiomuotoilun näkökulmasta pitää erikseen nostaa esiin artikkeliin linkattu OECD:n Better Life -indeksi. Indeksin 11 komponentin painotuksia pääsee OECD:n ylläpitämällä sivustolla vapaasti muuttamaan ja valitsemaan tästä näkökulmasta itselleen parhaan OECD-maan.

Käyttöliittymä korostaa näyttävyyttä aavistuksen verran liikaa sisällön kustannuksella. ”Kukkasen terälehtien” sijaan maakohtaisia arvoja voisi ilmaista jollain selkeämmällä tavalla ja maiden näyttäminen oletuksena aakkosjärjestyksessä (jonka saa vaihdettua sijoitusjärjestykseen) on huono idea, mutta itse konsepti on kohdallaan. Kun vuorovaikutteisten esitysten tekeminen on helppoa, miksi tyytyä ”yhden koon” ratkaisuun? Tämäntyyppisiä tunnuslukuja ei tuoteta niiden itsensä vuoksi, vaan päätöksenteon tueksi. Eri ihmisillä on erilaiset arvostukset ja näkemykset ja siten erilaiset tiedolliset tarpeet. Tähän mahdollisuus itse painottaa indeksin eri osa-alueita sopii mainiosti.

Henkilökohtaisilla painotuksillani indeksi tarjoaa minulle parhaaksi asuinpaikaksi Australiaa (joka on myös painottamattoman indeksin ykkönen). Valitettavasti kanssaihmisten pukeutumiselle ja ruokavaliolle ei ollut omaa säädintä.