Malofiej – just wow!

Just returned home from Malofiej. What a week it has been! I’ll write a more detailed report (in Finnish) next week, but here are some quick thoughts on the event.

First of all: if you mostly work with information graphics, visualization, data journalism etc., you should go to Malofiej, even if you have no works you’d want to enter to the competition. The competition is only a part of it, albeit probably the most famous part. I personally didn’t enter any projects and quite a few other people I talked with were there likewise only, or at least mainly, because of the conference part. Of course the competition is important and the winners are well worth checking out, but for me the presentations by the judges and the networking opportunities were far more important.

(There’s actually a third part besides the conference and the competition: the Show, Don’t Tell! workshop. It is a masterclass type of three-day workshop for infographics professionals to perfect their skills under the guidance of the world’s top experts. I’d really want to take part in the workshop in the future, but this year I simply couldn’t find the time to do so and thus can’t say much about it. Seems it was a success, which is hardly surprising given the caliber of the teachers.)

All in all it was both a very intensive and a very rewarding experience. At first I was somewhat starstruck to be hanging around with all these people whose work I really admire and whose Twitter feeds and blogs I read for inspiration, but practically everybody I talked with seemed to be very down-to-earth and willing to politely listen to the at times incoherent ramblings of yours truly. I made many new friends and was really fascinated to hear informal behind the scenes stories of the daily grind at world class news organizations’ graphics desks. The sheer amount of all the informal goings-on around the main programme combined with some logistic problems (I ended up spending 21 h travelling from Helsinki to Pamplona due to a cancelled connecting flight) meant that I only catched maybe 15 h of sleep between early Tuesday morning when I left home and Saturday evening when I’m writing this post. Add to that the considerable amount of boozing involved, and my hot tip for next year is to rest well before coming to Malofiej and reserve some time after it for recuperation.

As for the conference programme itself, I must really congratulate the organizers for getting together such an interestingly diverse set of judges/speakers. All the presentations were interesting and the best ones were fantastic. Some themes spanning several presentations included the importance of sketching, programming vs. hand-crafting and different narrative formats (linear vs. nonlinear, the role of annotation etc.). More of these in a later post. The works shown were really interesting and showed a wide variety of themes and techniques, which was also great.

To list a few negative things I have to mention keeping schedules and translation. Some of the speakers kept within their alotted time very well, but some were more liberal in their use of time which is a bit unfair towards the other speakers. Basically all the talks were so interesting that they could have filled a longer time slot, but time is a limited resource so if one speaker goes overtime, someone else often needs to cut their presentation shorter. Not nice!

All the talks were either in English or in Spanish (except for one which was half in Spanish and half in Portuguese) and interpreted into the other language. The basic setup with wireless headphones worked reasonably well, but the translators had a hard time at least when translating to English. The impression I got was that something was lost in translation with all the non-English-language presentations. I think a part of the problem may be that the translators (I think there were two) were Spanish native speakers. It probably would work better if Spanish was translated  to English by a native speaker and vice versa. At least that’s how they usually do it in organizations like the EU.

I’ll write later more about the actual awards, but to quickly summarize I think all the gold medal winners certainly earned their prize. I’m slightly disappointed that NYTimes’ 512 Paths to White House didn’t win the Best in Show, but at least it got gold and the NYTimes’ sports piece about hurdles is very well worth the prize, too. Awarding the “best online map” to ProPublica’s StateFace font was an interesting move and certain to create a bit of controversy. The first ever medal (bronze) for a Finnish media was awarded to Hannu Kyyriäinen’s map of shrinking Palestine in Suomen Kuvalehti. Finland even beated our eternal arch-rival the Swedish who this time got no medals. (Personally I think SvD’s graphics should have deserved some, but let’s not go there…)

I highly recommend checking out tweets with the hashtag #malofiej, especially Alberto Cairo’s fantastic coverage.

To sum up, I really enjoyed myself, learned a lot and made new friends and professional contacts. Easily worth the money and time spent. I’m definitely going next year (the dates for 2014 were already announced: 23rd to 28th March) and highly recommend everyone to do similarly!

PS. A minor, but to me an imporant point: Being a “pesco-vegetarian” I did occasionally find it a bit challenging to feed my self in Pamplona. Although many a restaurant offered had a great selection of fish and seafood, many seem to put ham in an amazing variety of dishes, including seemingly vegetarian ones. I hear the local ham is really good, but if you’re a vegetarian – or muslim – I’d be careful. And it would be nice if there was a meatless option for the awards dinner next year. ;)

Kill your darlings, osa 2: Fraktuura vs. antiikva

Kill your darlings -sarjamme jatkuu, tällä kertaa vuorossa ihan hauska, mutta viime kädessä kirjan varsinaiseen aiheeseen nähden turhan pitkä referaatti Pekka Mervolan väitöskirjan antiikvakirjasimen maihinnousua Suomeen käsittelevästä osiosta.

* * *

Suomalaisten sanomalehtien ulkoasun historiaa tutkinut Pekka Mervola kuvaa väitöskirjassaan* värikkäästi typografisista kysymyksistä Suomessa vuosikymmenten varrella käytyä keskustelua. Pitkäänhän Suomessa yleisimpänä kirjaintyyppinä oli saksalaisella kielialueella suosittu, keskiaikaisesta käsikirjoitustyylistä kehittynyt fraktuura. 1800-luvulla alettiin käydä keskustelua siitä, tulisiko se Suomessakin korvata Ruotsissa ja muualla Euroopassa jo yleistyneellä ja nykyaikaisempana pidettynä antiikvalla, nykyisinkin yleisesti käytössä olevalla päätteellisellä kirjaintyylillä (jonka rinnalla nykyään käytetään yleisesti myös päätteetöntä groteskia).

Vastustus antiikvaa kohtaan oli pitkään huomattavaa. J.V. Snellman esimerkiksi huomautti kirjeessä Helsingin yliopiston suomen kielen lehtorille, Suomalainen-lehden päätoimittajalle K.A. Gottlundille, että useimmat kansanihmiset osasivat lukea vain fraktuuraa, sillä Raamattu ja kaikki kansankirjallisuus oli kautta aikojen ladottu tuolla kirjaintyylillä. Ruotsia puhuvalla väestönosalla tällaisia rajoitteita ei ilmeisesti ollut, sillä pitkään rinnakkain suomen- että ruotsinkielistä aineistoa sisältävissä lehdissä suomenkieliset uutiset ja ilmoitukset ladottiin fraktuuralla ja ruotsinkieliset antiikvalla.

Antiikvan puolustajien piti marssittaa esiin raskaan kaliiperin argumentit syrjäyttääkseen fraktuura lopullisesti lehtien sivuilta. Uuden Suomettaren yhtiökokouksen pöytäkirjoihin keväältä 1913 on tallentunut lääkintöneuvos K. Reijovaaran esittämä arvio, että antiikvakirjoitus on fraktuuraa terveellisempi lukijoiden silmille.

Myös ulkomaiset asiantuntijat marssitettiin typografiasodan rintamalle. Sanomalehdenkustantajain Liitto julkaisi 1919 saksalaisen professorin Münsterbergin näkemyksiä sanomalehden ulkoasusta. Professoria kuultiin itseoikeutetusti asiantuntijana hänen kehittämästään sanomalehtien psykotekniikasta, joka korosti lehden lukemisen helppoutta. Hän piti hyvälaatuista fraktuuraa saksalaisille sanomalehdille sopivampana kuin antiikvaa, mutta katsoi, että ulkomaalaisille tarkoitettu teksti oli parempi latoa antiikvalla.

Münsterberg otti kantaa myös muihin typografisiin kysymyksiin kuin vain kirjainlajiin, mm. suosittellen lehtien hieman suurentavan kirjasinkokojaan. Kirjoissa palstaleveys sai hänen mukaansa olla korkeintaan 90 mm, mutta sanomalehtipalstan leveyden tuli olla tuntuvasti kapeampi. Professorin suositus perustui siihen, että silmän hyppäys riviltä toiselle on aina sitä raskaampi mitä leveämpi palsta on. Liian suuri palstanleveys aiheutti hänen mukaansa silmissä epäsuhtaisen ”akkomodaatiojännityksen”, mikä haittaa luettavuutta. Münsterbergin mukaan saksalaisissa lehdissä on pyritty pieneen sivukokoon, sillä se on lukijalle mukava. Useimmat 1900-luvun alun sanomalehdethän olivat fyysiseltä kooltaan valtavia, reilusti nykyisiä [kirjoitettu ennen Hesarin tabloid-uudistusta –JK] broadsheet-kokoisia lehtiäkin isompia.

Münsterberg suositteli lehtimiehiä myös lyhentämään tekstikappaleiden pituutta. Hänen mukaansa lyhyet pysähdykset eli kappaleiden sisennykset miellyttävät lukijoita. ”Pitkät kappaleet taas vaikuttavat lukijaan samoin kuin pitkä, suora katu.” Hän otti kantaa myös kiivaana käyneeseen keskusteluun otsikoiden koosta. Aiemminhan juttuja ei välttämättä otsikoitu lainkaan, nyt suuret ja massiiviset otsikot olivat leviämässä Yhdysvalloista Eurooppaan, mikä herätti suuria intohimoja. Münsterberg suhtautui asiaan rennosti: ”Psykotekniikan kannalta katsottuna  ei voida mitään sanoa lihavia päällekirjoituksia vastaan, mitkä heti johdattavat silmän uusimpaan ja tärkeimpään lehdessä.” Suomessa tätä uutta otsikointityyliä oli ensimmäisenä edustanut Työmies, jonka lukijat olivat huonommin koulutettua väkeä, jolle pitkien tekstimassojen lukeminen oli sivistyneistöä hankalampaa. Otsikoinnin siis ajateltiin helpottavan luettavuutta ja maailmallakin otsikointi oli yleistynyt ensin kansalle tarkoitetuissa lehdissä kuten keltaisessa lehdistössä.

Myöhempinä vuosina näyttävässä otsikoinnissa mentiinkin sitten niin pitkälle, että peräti valtiovalta katsoi tarpeelliseksi puuttua asiaan: ”Mielestäni kahden palstan otsakkeet ilman alaotsakkeita riittävät useimmissa tapauksissa”, totesi pääministeri Antti Hackzell syksyllä 1944 paperipulan kirvoittamana.

Merkittävä käännekohta fraktuuran ja antiikvan välisessä taistelussa tapahtui kun 1912 julkaistiin antiikvalla ladottu Raamatun taskukokoinen laitos ja 20-luvulla perhe- ja vihkiraamatuissakin siirryttiin antiikvaan.

*) Mervola, Pekka 1995. Kirja, kirjavampi, sanomalehti. Ulkoasukierre ja suomalaisten sanomalehtien ulkoasu 1771–1994. Helsinki ym., Suomen Historiallinen Seura & Jyväskylän yliopisto. Väitöskirja.

Kill your darlings osa 1: Valekerroin

Blogi (ja Twitter-tilimme) on viettänyt nyt kirjoittajien lomien, työkiireiden ja kausi-influenssan vuoksi aika pitkään hiljaiseloa. Asiaan tulee nyt ainakin hetkeksi muutos.

Pidämme juuri viikon mittaista kirjoitustyöpajaa jossa yritämme saada työstettyä tulevan Informaatiomuotoilu-kirjamme käsikirjoitusta julkaisukuntoon. Valmista tekstiä on jo todella paljon, mutta se ei vielä muodosta kunnolla toimivaa kokonaisuutta ja sitä tässä nyt yritetään kursia kasaan. Yksi osa tätä työtä on ”kill your darlings”, eli kylmästi heittää pois tavaraa johon on jo ehtinyt vähän kiintymään. Onneksi meillä on blogi, jossa voi julkaista niitä tekstinpätkiä, joissa on joku järjen hiven, mutta jotka eivät kunnolla istu kirjan kokonaisuuteen. :) Tällä viikolla blogiin ilmestynee ainakin muutamia tällaisia juttuja. Alla niistä ensimmäinen, jossa jauhetaan valekertoimen käsitteestä ja asteikkojen katkaisemisesta tarpeettoman pitkällisesti yleistajuisen kirjan tarpeisiin.

* * *

Yksi tunnetuimpia tilastografiikan nyrkkisääntöjä on Edward Tuften kirjassaan The Visual display of quantative information (1983) esittelemä valekertoimen käsite. Sen ajatus on yksinkertainen:

grafiikan esittämä ilmiön koko
———————————————  =  valekerroin
datan esittämä ilmiön koko

Kun valekertoimen arvo on tasan 1, grafiikka esittää datan rehellisesti. Jos sen arvo poikkeaa tästä, grafiikka esittää ilmiön suuruuden väärin. Useimmiten poikkeama on ylöspäin eli grafiikka liioittelee ilmiön suuruutta. Tyypillinen esimerkki on tapaus, jossa tilastografiikkaesitykseen lisätään esteettisistä syistä perspektiivivaikutelma. Tällöin ero katsojasta kauempana ja tätä lähempänä olevien kuvioelementtien välillä näyttää suuremmalta kuin sen lukujen valossa pitäisi olla.

Toinen valitettavan tyypillinen virhe syntyy kun pylväskuvion pylväät korvataan jollain esittävällä kuvalla jota suurennetaan arvon muuttuessa, vaikkapa öljynkulutusta eri vuosina kuvaavilla eri kokoisilla öljytynnyreillä. Jos elementtiä venytetään vain pystysuunnassa, ongelma on lähinnä esteettinen: venytetty öljytynnyri näyttää kummalliselta. Mutta tämän esteettisen ongelman korjaaminen tynnyriä vastaavasti leventämällä saa aikaan valekertoimen arvon nousemaan huikeaksi: jos mittasuhteet säilytetään entisellään, tynnyrin korkeuden tuplaaminen saa kuvion pinta-alan nelinkertaistumaan. Ja todellisuudessahan tynnyri on kolmiulotteinen objekti, jolloin sen ulkomittojen tuplaaminen johtaisi tilavuuden kahdeksankertaistumiseen!

On ilmeistä, että tällainen kuvioelementtien paisuttelu nostaa valekerrointa. Nopeasti kuitenkin huomataan, että valekertoimen arvon tarkka määrittely ei ole tällaisessa tapauksessa aivan niin yksiselitteistä kuin Tufte esittää. Tutkimukset* ovat nimittäin osoittaneet, että pinta-alan ja tilavuuden muutokset arvioidaan keskimäärin pienemmiksi kuin ne todellisuudessa ovat. Jos tämä tekijä huomioidaan, havaitaan nopeasti että valekertoimelle ei voi antaa yksiselitteistä arvoa. Luvut matemaattisesti oikein pinta-aloina näyttävä esitys voi vaikuttaa vähättelevän niiden eroja ja toisaalta numeroita liioitteleva voi vaikuttaa näyttävän ne paremmin oikein.

Valekerroin on siis oikeansuuntainen, mutta liian yksioikoinen lähtökohta toimivan informaatioesityksen laatimiseen. Valekertoimen tulisi useimmissa tapauksissa saada arvo 1, mutta tämä ei vielä yksinään riitä takaamaan, että esitys on selkeä ja ymmärretään niin kuin sen suunnittelijat toivoisivat. Toisaalta on myös tilanteita, joissa valekerroin voi Tuften ohjeiden mukaan laskettuna olla suurikin, mutta katsoja ymmärtää silti asian paremmin kuin samasta aiheesta tehdyn esityksen jossa valekerroin olisi vain 1.

Tuften valekerroin saa yhdestä poikkeavia arvoja aina kun asteikko katkaistaan jostain kohtaa, joten sitä ehdottomana ohjenuorana käyttäessä asteikon katkaisu ei koskaan ole sallittua. Meidän mielestämme joissain mainituissa tapauksissa katkaiseminen kuitenkin on soveliasta, kunhan se merkitään hyvin selvästi.

Useimmat tilastografiikan auktoriteetit hyväksyvät pylväskuviossa yksittäisten pylväiden katkaisemisen ”yläpäästä”. Tällä tarkoitetaan tilannetta, jossa yksi tai kaksi pylvästä olisivat niin pitkiä, että jos ne piirrettäisiin samaan mittakaavaan kuin muut, ne latistaisivat muiden keskinäisen vaihtelun olemattomiin. Tällöin voidaan merkitä ylimittaiset pylväät katkaisumerkillä ja kirjoittaa niiden viereen pylväiden tarkat arvot. Samoin useimmat hyväksyvät asteikon katkaisun viivakuviossa. Kuten aiemmin mainittiin, viivakuvio korostaa ennen kaikkea muutosta ja trendiä, eikä niinkään yksittäisten datapisteiden absoluuttisia arvoja. Jos olennaista kuviossa on suhteellinen vaihtelu eli vaihtelun osuus kokonaisuudesta, asteikkoa ei saa katkaista. Jos sen sijaan olennaista on vaihtelu itsessään, viivakuviossa asteikon katkaiseminen voi olla perusteltua.

Pylväskuvioissa koko asteikon katkaisemiseen suhtaudutaan yleisesti ottaen negatiivisesti. Useimmiten tämä näkökanta on perusteltu. Asteikon mielivaltainen katkaisu ylikorostaa pylväiden eroja ja antaa siten väärän käsityksen kokonaisuudesta. Joskus kuitenkin myös pylväskuviossa erot saattavat olla tärkeämpiä kuin muuttujien saamat tarkat arvot. Pystypylväskuvion voi tällaisessa tilanteessa yleensä korvata viivakuviolla, mutta viivakuviolla ei voi kuvata sellaisia ryhmiä, joissa toisella akselilla on luokitteleva muuttuja. Jos hyvin pienetkin erot ovat tarkasteltavan aiheen kannalta merkityksellisiä, katkaistut pylväät voivat antaa asiasta paremman kuvan kuin katkaisemattomat.

Ajatelkaamme seuraavanlaista esimerkkiä: Tietojärjestelmien luotettavuus ilmaistaan palvelutasosopimuksissa usein saatavuusprosentteina, jotka kuvaavat sitä kuinka suuren osan ajasta palvelun luvataan olevan käytettävissä. Mikäli luvattu taso ei toteudu, järjestelmän toimittaja sitoutuu hyvittämään puutteen.

Kuvitellaan, että haluamme tehdä kuvion, jossa vertaillaan eri palveluntarjoajia joiden lupaamat saatavuusprosentit vaihtelevat välillä 99–99,999 %. Jos teemme näistä luvuista vaakapylväskuvion katkaisematta asteikkoa, eroa parhaan ja huonoimman palveluntarjoajan välillä kuviosta tuskin huomaa.

Erohan on alle prosentti, ei siis kovin suuri, joten mitä sitten? Näin on helppo ajatella, jos ei ymmärrä, mitä tuo prosentti oikeastaan kertoo. Ero on itse asiassa valtava. 99 % saatavuusprosentti merkitsee, että yhteensä 88 tunnin ajan vuodessa palvelu ei ole käytettävissä, siis esim. vartin käyttökatkosta vuoden jokaisena päivänä. 99,999 % saatavuusprosentti taas merkitsee lupausta korkeintaan reilun viiden minuutin yhteenlasketuista käyttökatkoista vuodessa. Ero on tuhatkertainen! Pylväiden katkaisematta jättäminen siis vääristää tässä tapauksessa kuvion antamaa vaikutelmaa pahasti.

Edellä kuvattu on toki äärimmäinen poikkeustapaus. Yleisemmin voi sanoa, että kuvion tulee näyttää merkitykselliset erot riittävän suurina, että ne hahmotetaan oikein. Asteikon katkaisemista tulee pääsääntönä välttää, mutta jos katkaistu asteikko kuvaa ilmiötä paremmin kuin katkaisematon, silloin asteikko kannattaa katkaista. Asteikon katkaisemista datapisteiden keskeltä tulee kuitenkin välttää jokseenkin aina.

 *) Esim. Macdonald-Ross, Michael 1977: How numbers are shown: a review of research on the presentation of quantitative data in texts. AV Communication Review 25:4, 259–409.

Apps4Finland-kisan tuloksista

Eilen julkistettiin vihdoin tämänvuotisen Apps4Finland-kilpailun voittajat. Koko kisan epävirallisen pääpalkinnon eli sovellussarjan ykkössijan nappasi odotetusti näkövammaisille suunnattu paikannuspalvelu BlindSquare, suurimman määrän palkintoja (3 kpl) voitti suunnistusharrastajille maastokarttoja automaattisesti tuottava Karttapullautin.

Informaatiomuotoilu.fi-porukalla oli visualisointisarjan finaalissa mukana peräti kolme työtä: designpääkaupunkivuoden ulkomainoskampanjaan toteutetut Ta-daa, dataa! -julisteet, Asuntokuume-blogiin toteuttamani datajournalistinen artikkeli Omistusasuminen kannattaa aina, jos on aikaa odottaa sekä yhteistyössä FloAppsin kanssa Kuntaliitolle toteuttamani KuntaNavigaattori-eksploraatiotyökalu. Visualisointisarjassa ei tällä kertaa palkintosijoille ylletty, mutta toinen Asuntokuumeelle laatimani artikkeli, Katso kartta: Täältä löytyy edullisin koti urbaanille lapsiperheelle voitti Helsingin kaupungin tilastodatan erikoispalkinnon vaikkei päässytkään visualisointisarjassa finalistien joukkoon.

Erikoispalkinto tuli itselleni hienoisena yllätyksenä. Helsinki on suomalaisten kuntien joukossa ollut selkeä edelläkävijä tilastotietojen tuottamisessa ja niiden avaamisessa vapaasti käyttöön, niin Helsinki Region Infoshare -palvelunAluesarjat.fi-palvelun kuin kaupungin tietokeskuksen omien julkaisukanavien kautta. Kokemukseni mukaan tietokeskuksen henkilökunta suhtautuu todella ystävällisesti myös suoraan heiltä tilastotietoja kyseleviin wannabe-datajournalisteihin. Helsingin kaupunkia koskevaa laadukasta tilastotietoa on siis todella runsaasti helposti saatavilla ja niinpä olisin kuvitellut että sitä hyödyntäviä töitäkin olisi kisassa ollut enemmän. Mutta en valita! :)

Sen sijaan pikkuisen haluaisin purnata visualisointisarjan palkinnoista. Asiaan vaikuttaa tietysti hieman sekin ettei palkintoa sattunut omalle kohdalle, mutta väittäisin että kevyttä rakentavaa kritiikkiä voisi perustellusti antaa riippumatta siitä oliko kisassa omia töitä mukana vai ei.

Sarjan voittaja, Ilmanlaadun mukaan vaihtuva kännykän taustaväri on yksinkertaisuudessaan nerokas, ”miksen keksinyt tätä itse” -reaktion aiheuttaja ja ehdottomasti palkintonsa ansainnut. Siitä ei sen enempää. Kaksi muuta palkintoa menivät HS.fi:ssä julkaistuille visualisoinneille: Hesarin työryhmän koostamalle Kuntavaaliehdokkaiden mielipiteiden arvokartalle ja Jaakko Salosen Sidonnaisuuskytkökset Käypä Hoito -suosituksissa -grafiikalle.

HS on ollut datajournalismin edelläkävijä Suomessa ja olisi ollut suorastaan skandaali jos se ei olisi palkintoa sarjassa voittanut. (Nimestään huolimatta visualisointisarja on samalla myös datajournalismisarja. Nimenmuutos esimerkiksi muotoon ”visualisointi- ja datajournalismisarja” voisi muuten olla harkitsemisen arvoinen.) Kuntavaaliehdokkaiden mielipiteiden arvokartta on varsin kelvollinen kokonaisuus, vaikka tosin kuten Osmo Soininvaara huomauttaa grafiikan yhteydessä julkaistussa artikkelissa, vaalikoneen kysymyksiä on kuitenkin aika pieni määrä joten tuloksiin yksittäisten ehdokkaiden kohdalla kannattaa suhtautua varauksella. Puoluetasolla grafiikan antama kokonaiskuva lienee oikea.

Sidonnaisuuskytköksiä kuvaava grafiikka on kinkkisempi tapaus. Siihen pohajutuva, HS:n painetussa lehdessä julkaisema artikkelikokonaisuus samasta aiheesta on arvokasta datajournalismia, mutta pelkkä visualisointi itsessään on mielestäni epäselvä eikä kerro juuri mitään muuta kuin että sidonnaisuuksia on paljon. Kyseessä on klassinen ”karvapallo”, verkostomalli jossa on niin paljon tavaraa että metsää ei enää näe puilta. Mielestäni palkinnon olisi sidonnaisuuskytkös-karvapalloa ennemmin ansainnut vaikkapa Suomen Kuvalehden Tulvakartta.

Tietysti kun hyviä töitä on paljon, käy niin että kaikki eivät voi voittaa. Jos kilpailutöiden määrä vastaisuudessakin kasvaa, tulisi minusta harkita myös kunniamainintojen jakamista varsinaisten palkintojen lisäksi. Mutta hieman herättäisin keskustelua siitä että jos kerran kilpailussa on visualisointisarja, miksei sinänsä erinomaisen ansioituneista osaajista koostuvassa tuomaristossa ole mukana ensimmäistäkään visualisointieksperttiä?

Itseään ei ole kohteliasta ehdottaa (sitä paitsi luulenpa että haluan osallistua kisaan tulevina vuosinakin ihan kilpailijana), mutta onneksi valinnanvaraa riittää ilmankin. Potentiaalisina tuomariehdokkaina alan kovista kotimaisista tekijöistä voisi mainita esimerkiksi seuraavat: Jens Finnäs, Tuomas Siitonen, viime vuoden visualisointisarjan voittaja Lauri Vanhala, Miska Knapek, visualisoinnin lehtori Markku Reunanen, kartografian lehtori Paula Ahonen-Rainio, tilastotieteilijä Kimmo Vehkalahti, Readingin yliopiston Jasso Lamberg tai vaikkapa runsaasti jurykokemusta graafisen suunittelun kilpailuista kerännyt professori emeritus Tapio Vapaasalo.

Informaatiomuotoilu tekee tiedon näkyväksi

Artikkeli on julkaistu Maanmittauslaitoksen Positio-lehdessä.

Uusi tieto omaksutaan nopeimmin visuaalisesti. 

Helsingin kaupunkisuunnitteluviraston näyttelyyn toteuttamamme visualisointi havainnollistaa matka-aikoja eri kulkuvälineillä kaupungin keskustassa.

Informaatiomuotoilu merkitsee tiedon esitystavan suunnittelemista mahdollisimman selkeäksi. Työvaiheisiin kuuluvat esitettävän tiedon valitseminen, järjestäminen ja esittäminen valitun kohderyhmän tarpeet ja ominaisuudet sekä käyttökontekstin huomioiden. Yleensä käsitteellä viitataan nimenomaan tiedon visuaalisen esitysasun muotoiluun, tiedon visualisointiin.

On arvioitu, että näköaisti kykenee välittämään informaatiota ympäristöstämme aivoihin peräti sata kertaa nopeammin kuin kuuloaisti. Vaikka tarkoista luvuista voidaan kiistellä, on ilmeistä että näkö on vahvin aistimme ja että uuden tiedon omaksuminen tapahtuu nopeimmin visuaalisesti. Kuvat myös muistetaan tutkimusten mukaan paremmin kuin pelkkä teksti.

Tiedon kuvallisella esittämisellä onkin erittäin pitkät perinteet. Kuvien avulla on välitetty kertomuksia ja tietoa maailmasta jo kauan ennen kirjoitusjärjestelmien keksimistä. Varhaisimmat luolamaalaukset ovat nykykäsityksen mukaan ainakin 25 000 vuotta vanhempia kuin kirjoitustaito.

Kartat tienraivaajina

Ennen kuin voidaan puhua varsinaisesti informaatiomuotoilusta, on tehtävä käsitteellinen harppaus näköhavaintoa jäljittelevistä esittävistä kuvista abstraktimpaan ilmaisuun. Erityisesti paikkatieto ja sen visualisoiminen, kartat, ovat näytelleet abstraktin kuvailmaisun kehityksessä tienraivaajan roolia.

Jonkinlaisia karttoja on tehty liki kaikissa maapallon kulttuuripiireissä, usein jo ennen kirjoitustaidon omaksumista. Esimerkiksi Pohjois-Amerikan inuiiteilla oli jo kauan ennen eurooppalaisten tuloa erittäin tarkasti rantaviivan muotoa kuvaavia kaiverrettuja puupaloja, joita käytettiin karttoina.

Helsingin yliopiston kulttuurimaantieteen dosentin Allan Tiitan mukaan karttojen ja maisemamaalauksen välillä ei alkujaan ollut ratkaisevaa eroa: molemmat pyrkivät löytämään maiseman olennaisimmat piirteet ja luomaan niistä havainnollisen kokonaisesityksen. Vähitellen kartoille alkoi kuitenkin kehittyä oma abstrakti kuvailmaisunsa, joka erkani esittävien kuvien visuaalisesta kielestä.

Abstrakti visualisointi oivallettiin 1700-luvun lopulla

Kesti varsin pitkään ennen abstrakti kuvailmaisu levisi kartografian piiriä laajemmalle. Tähtitieteellisiä ilmiöitä jouduttiin käytännön syistä kuvaamaan jossain määrin abstrakteilla piirroksilla. Muutamia irrallisia varhaisia esimerkkejä tunnetaan muiltakin aloilta, mutta laajemmin abstraktien visualisointien mahdollisuudet alettiin huomata vasta 1700-luvun lopulla.

Eräänä käännekohtana voi pitää skotlantilaisen kansantaloustieteilijän William Playfairin Commercial and Political Atlas -kirjaa (1786), jossa kirjoittaja esitteli nykyisin pylväs- ja viivakuvioina tunnetut tilastografiikan peruskuviotyypit. (Playfair keksi hieman myöhemmin myös piirakkakuvion.) Tilastografiikan pohjalle ovat sittemmin rakentuneet lähes kaikki myöhemmät abstraktin tiedon visualisointikeinot kuten tieteelliset visualisoinnit sekä konseptuaalisia suhteita kuvaava käsitegrafiikka.

Grafiikka tutkimustyökaluna

Kartat toimivat tilastografiikan keksimisen jälkeenkin tienraivaajana visualisointien kehityksessä. Erityisesti temaattisen kartografian piirissä on otettu ensimmäisenä käyttöön sellaisia keinoja, joita sittemmin on hyödynnetty laajasti muissakin informaatiomuotoilun lajityypeissä. Esimerkiksi tästä käyvät vaikkapa elementtien värikoodaus ja kuvamerkkien eli piktogrammien käyttö.

Yksityiskohta Seamanin kartasta, joka julkaistiin The Medical Repository -lehdessä. Se on harmillisesti jäänyt paikkatiedon historiassa John Snow’n kuuluisan Lontoon vuoden 1854 koleraepidemian kartan varjoon. Snow’n kartta on valtavasti velkaa Seamanin tekemälle pohjatyölle.

Myös varhaisimmat tunnetut esimerkit
eksploratiivisesta grafiikan käytöstä ovat karttoja: amerikkalaisen lääkärin Valentine Seamanin 1798 tekemät kaksi karttaa, jotka kuvasivat New Yorkissa riehuneen keltakuume-epidemian aiheuttamia kuolemantapauksia ja alueen jätteenkaatopaikkoja, joita Seaman epäili taudin aiheuttajiksi. Hän toi näin ensi kertaa grafiikan viestinnällisen funktion rinnalle myös uuden tiedon etsimisen eli eksploraation.

Eksploratiivinen grafiikka onkin sittemmin muodostunut keskeiseksi tieteellisen tutkimuksen välineeksi. Sen mahdollisuuksia havainnollistaa hyvin tilastotieteilijä Francis Anscomben 1973 kehittämä ns. Anscomben kvartetti, neljä datasettiä joiden eroja on vaikea löytää matemaattisin menetelmin mutta joista visualisoituina on helposti nähtävissä niiden keskeiset ominaisuudet. Erityisesti poikkeavat havainnot (engl. outlier), jotka usein ovat seurausta mittausvirheestä, on visuaalisessa muodossa helppo huomata.

Anscomben kvartetti koostuu neljästä datasetistä, joiden useat matemaattiset ominaisuudet kuten varianssi ja lineaarinen regressio ovat identtisiä, mutta joiden erot tulevat helposti näkyviin visualisoituna.

Koska nykyisin tällaisia visualisointeja on mahdollista tuottaa täysin automaattisesti, tutkijat muodostavat kokonaiskuvan aineistostaan usein ensiksi nimenomaan visuaalisesti ja ryhtyvät vasta sen jälkeen soveltamaan tilastollisia menetelmiä sen perkaamiseen.

Tietotulvan hallintaa 

Elämme paraikaa tiedon visualisoinnin nousukautta. Kenties ilmeisin syy virinneeseen kiinnostukseen ovat teknisen kehityksen mukanaan tuomat helpommat välineet esitysten laatimiseen. Kun vielä 1980-luvun alussa yksinkertaisen sääkartan tuottaminen sanomalehteen saattoi vaatia kolmen ihmisen täysipäiväisen työpanoksen, nykyisin tarjolla on runsaasti erilaisia automaattisia työkaluja visualisointiin niin netti- kuin painokäyttöönkin.

Teknisen kehityksen myötä myös julkaisukanavat ovat monipuolistuneet. Kun aiemmin niin tieteellisellä puolella kuin lehdistössäkin julkaisualustana oli yleensä mustavalkoinen, huonolaatuinen painotuote, nykyisin verkko mahdollistaa värillisten ja vuorovaikutteisten esitysten julkaisemisen hyvin edullisesti.

Kartograph-kirjasto mahdollistaa selainpohjaisten karttasovellusten toteuttamisen huomattavasti vapaammin kuin Google Mapsin tapaiset karttapalvelut. Esimerkiksi käytettävän karttaprojektion voi valita liki 30 eri vaihtoehdosta.

Hyvänä esimerkkinä tekniikan uusista mahdollisuuksista ovat internetin karttapalvelut Google Maps tai Open Street Map, joihin on helppo liittää uusia visualisointitasoja ja tyylimuotoiluja valmiin infrastruktuurin ja kartta-aineiston päälle. Mikäli haluaa vapaammat kädet esim. karttaprojektion valitsemiseen, voi haluamansa aineistot ladata pienellä vaivalla Open Street Mapista tai Maanmittauslaitokselta omalle palvelimelleen ja ottaa niiden esittämiseen käyttöön vaikkapa avoimen lähdekoodin Kartograph-kirjaston.

Informaatiomuotoilu tuntuu ajankohtaisemmalta kuin koskaan aiemmin ehkä kuitenkin ennen kaikkea siksi, että tarvitsemme työkaluja meitä ympäröivän tietotulvan hallintaan. Ihmiskunta tuottaa tätä nykyä kahdessa vuodessa enemmän dataa kuin yhteensä koko edeltävän historian aikana. Sitä tuottavat niin tekniset laitteet kuin vaikkapa sosiaalisen median käyttäjätkin. Samaan aikaan avoimen datan aate tuo aiemmin piilossa pidettyä aineistoa kaikkien saataville.

Hakukoneet ja muut tekniset ratkaisut auttavat datatulvan hallitsemiseen, mutta ainakin vielä toistaiseksi sen valjastamiseen hyötykäyttöön tarvitaan ihmistä ja hänen vajavaisia aistejaan. Aisteja, joista näkö on kaikkein vahvin.

Juuso Koponen ja Jonatan Hildén

Kirjoittajat ovat informaatiomuotoiluun erikoistuneita graafisia suunnittelijoita, jotka ylläpitävät Informaatiomuotoilu.fi-blogia ja opettavat mm. Aalto-yliopistossa. Artikkeli sisältää katkelmia heidän tulevasta Informaatiomuotoilu-kirjastaan.

Lähteet:

Zimmermann, Manfred 1989. The nervous system in the context of information theory. Teoksessa Schmidt, Robert F. & Thews, Gerhard (toim.), Human physiology. Berlin ym., Springer-Verlag, 166–173.
Atkinson, Robert K., Levin, Joel R., Kiewra, Kenneth A., Meyers, Tom, Kim, Sung-Il, Atkinson, Laura Ann, Renandya, Willy A. & Hwang, Yooyeun 1999. Matrix and mnemonic text-processing adjuncts: comparing and combining their components. Journal of Educational Psychology 91:2, 342–357
Holmes, Nigel 1991. Pictorial maps. New York, Watson-Guptill Publications.
Tiitta, Allan 1999.  Suomen karttakuvan kehitys. Tieteessä tapahtuu 17:4, 16–23.
Koch, Tom 2012. Knowing its place: mapping as medical investigation. The Lancet 379:9819, 887–888.
Sanomalehtigrafiikan työmenetelmien kehityksestä ks. esim. Järvi, Outi 2006. ”Informatiivinen graafi premillä” – Johdatusta sanomalehtigrafiikan kielioppiin. Vaasan yliopisto, kielitiede. Väitöskirja.
Lohr, Steve 2012. The Age of Big Data. The New York Times 11.2.2012

Lapsiperheiden kantakaupunki – vai väärin laadittu koropleettikartta?

Helsinkiläinen kunnallispoliitikko Mikko Särelä on laatinut jonkin verran huomiota sosiaalisessa mediassa keränneen kartan joka näyttää, kuinka paljon lapsia neliökilometrillä Helsingin eri osissa asuu. On ihan totta, että lasten osuus kantakaupungissa on ollut kasvamaan päin; alle kouluikäisistä helsinkiläislapsista asuu nykyisin kantakaupungissa vajaan viidenneksen isompi prosenttiosuus kuin vuonna 1992. Harmi kyllä, Särelän kartta ei paljasta tätä kunnallispolitiikan kannalta varsin merkittävää seikkaa vaan tulee kertoneeksi lähinnä Helsingin eri osa-alueiden asukastiheyden.

On vanha informaatiomuotoilun nyrkkisääntö, että koropleettikartalla ei pitäisi kuvata absoluuttisia vaan ainoastaan suhteellisia lukuja. Miksi näin? Otetaanpa käytännön esimerkiksi tämä Helsingin seudun kuntia kuvaava kartta:

(Kiitos, kiitos, kyllä tällä komistuksella vielä joku design-palkinto voitetaan!)

Yllä oleva kartta kuvaa HSL:n julkaisusta Liikkumistottumukset Helsingin seudun työssäkäyntialueella vuonna 2008 löytyvää tietoa siitä, kuinka paljon ”pääasillisia autonkäyttäjiä”* alueen eri kunnissa on, neliökilometrille laskettuna. Ja kas vain! Helsingin kantakaupungissa on 1 745 pääasiallista autonkäyttäjää neliökilometrillä kun taas esimerkiksi Vihdissä heitä on vain 25/km².

Voidaanko siis päätellä, että Helsingin kantakaupungissa suurin osa ihmisistä liikkuu omalla autolla ja Vihdissä ei? No ei voida. Pääasiallisten autonkäyttäjien osuus on kantakaupungissa vertailun pienin (37 %) ja Vihdissä puolestaan suurin (68 %). Kartta näyttää käytännössä vain sen, että Helsingin kantakaupungissa asutaan tihemmin kuin Vihdissä.

Koropleettikartta on hyvin herkkä aluejaolle. Jako on harvoin sellainen että eri alueet, olivat ne nyt sitten kuntia kuten esimerkkikartassani, suurpiirejä kuten Särelän kartassa tai jotain muita, olisivat asukasluvultaan ja -tiheydeltään vertailukelpoisia. Niinpä näytettäessä absoluuttisia lukuja, tullaan yleensä kuvanneeksi vain aluejaon ominaisuuksia. Havainnollinen esimerkki löytyy Wikipediasta, jossa sama väestötieto Bostonista on kuvattu sekä absoluuttisena henkilömääränä väestölaskentaruudukon lohkoissa että asukaslukuna eekkerillä samoissa lohkoissa:

Toki absoluuttisia lukujakin kuvaava kartta jotain paljastaa. Se, että kantakaupungissa on enemmän autoja neliökilometrillä kuin Vihdissä on ihan merkittävä tieto liikenteen suunnittelun kannalta. Mutta liikenneinsinöörit tarvitsevat paljon tarkempaa tietoa kuin mitä karkean tason teemakartta paljastaa. Tällaiset kartat palvelevat lähinnä viestinnällisiä tarpeita kun halutaan puhutella muita kuin asiantuntijoita, ja absoluuttisia lukuja esittävä koropleettikartta yleensä lähettää väärän viestin.

On totta, että lapsiperheiden palvelut kantakaupungissa eivät ole kasvaneet samaa tahtia kuin lasten osuus väestöstä ja esimerkiksi päiväkotipaikkojen saaminen on vaikeampaa kuin esikaupunkialueilla. (Poikkeuksia toki on, suuntaan ja toiseen.) Päiväkotipaikkojen pitäisi olla lähellä niiden käyttäjiä, siis lapsia, ja tässä suhteellinen osuus on vähemmän merkittävä tekijä kuin lasten absoluuttinen määrä. Mutta koropleettikartta ei ole oikea väline sen kuvaamiseen. Nyt kartta antaa sellaisen mielikuvan, että kantakaupungissa asuisi suhteellisesti – tai jopa absoluuttisesti – enemmän lapsiperheitä kuin muualla Helsingissä. Kumpikaan ei pidä paikkaansa. Lapsiperheitä asuu kantakaupungissa tiheämmässä kuin esikaupungeissa, mutta niin asuu likipitäen kaikkia muitakin kuviteltavissa olevia ihmisryhmiä: autoilijoita, maahanmuuttajia, työttömiä…

Kantakaupungin lapsiperheet – ryhmä johon kuuluu paljon omiakin ystäviäni ja tuttaviani – ja heidän alimitoitetut palvelunsa ansaitsevat kyllä huomiota näin kunnallisvaalien alla käytävässä julkisessa keskustelussa. Mielestäni Särelä on aivan oikeilla jäljillä nostaessaan teeman esiin, mutta informaatiomuotoilun ammattilaisena täytyy todeta että valittu työkalu ei sovi sen datan esittämiseen, johon sitä nyt on käytetty. Jos koropleettikarttaa haluaa käyttää, sillä voisi kuvata vaikkapa tarjolla olevien päivähoitopaikkojen suhdetta lasten määrään. Jos haluaa näyttää pelkästään lasten absoluuttisen määrän, mielenkiintoisempi olisi vaikkapa aikasarja joka näyttää miten määrä on kehittynyt. Kenties asia on kuitenkin luonteeltaan sellainen, että sen ydin tulee paremmin esiin tekstin kuin grafiikan muodossa.

____

*) Tämän käsitteen tarkempi määritelmä löytyy raportin sivulta 44. Olisin mieluummin näyttänyt henkilöautojen määrän kunnissa, mutta siitä en valitettavasti nopealla googletuksella löytänyt tietoa, joten tämä hieman monimutkainen tilastointimääritelmä saa toimia tämän demonstraation tarpeisiin likiarvona sille.

Pitääkö visualisoinnin olla kaunis?

Cartastrophe-blogin Daniel Huffman kirjoittaa PBS:n America Revealed -dokumenttisarjaa varten tehdyistä näyttävistä visualisoinneista. Kirjoitus on hyvä ja vaikkei ihan kaikista yksityiskohdista olisi samaa mieltä (en itse pidä linkkitornivisualisoinnin epätarkkuutta tässä kontekstissa niin vakavana ongelmana kuin Huffman), se herättää tärkeän kysymyksen visualisointien perimmäisestä roolista. Onko niiden tarkoitus olla kauniita ja näyttäviä vai selkiyttää tiedonvälitystä?

Valinta ei tietenkään ole mustavalkoinen joko–tai. Siteeraan tähän aihetta käsittelevän pätkän tulevan Informaatiomuotoilu-kirjamme käsikirjoituksesta:

Yhä useammin tiedon visualisoinnin tehtävänä nähdään myös lukijan houkutteleminen tiedon pariin. Informaatiomuotoilun tehtävä ei kuitenkaan ole tiedon koristeleminen. Kuten El Mundo -lehden grafiikkatoimitussihteeri Juantxo Cruz asian muotoilee: ”Visuaalisen journalistin tehtävä ei ole tiedon naamioiminen vain jotta sivu näyttäisi kauniimmalta. Tehtävämme on auttaa ymmärtämään, mitä tapahtuu.” Kauneus ei ole informaatiomuotoilun kontekstissa päätavoite vaan sivutuote. Päätavoite on auttaa välittämään, löytämään ja tallentamaan tietoa.

Esteettisillä valinnoilla on toki merkityksensä tiedonvälityksessä. Käytettävyystutkimuksissa on havaittu*, että ihmiset pitävät teknisiä laitteita helppokäyttöisempinä, jos niiden käyttöliittymä on esteettisesti miellyttävä. Kyse ei ole pelkästään ensivaikutelmasta vaan ero on havaittavissa jopa siinä, kuinka nopeasti koehenkilöt suoriutuvat laitteella tutkijoiden heille antamista tehtävistä.

Tämä havainto on laajennettavissa tietografiikan kontekstiin siten, että kaunis visualisointi koetaan epäesteettistä helpommin ymmärrettäväksi. Kauneus on siis tavoiteltavaa informaatiomuotoilussakin, koska se edistää viestinnällisiä päämääriä. Mutta mikäli selkeyden ja esteettisen miellyttävyyden välillä joudutaan tekemään valinta, on selkeyden oltava aina etusijalla.

*) Esim. Tractinsky, N.; Katz, A.S. & Ikar D. 2000. What is beautiful is usable. Interacting with Computers 13:127–145; Sonderegger, Andreas & Sauer, Juergen 2010. The influence of design aesthetics in usability testing. Effects on user performance and perceived usability. Applied Ergonomics 41:403–410.

Visualisoinneiksi tai infografiikaksi kutsuttavat esitykset voi jakaa karkeasti kolmeen kategoriaan niiden pääasiallisen funktion kautta. (Alla olevat kuvat aukeavat suuremmiksi klikkaamalla.)

Tutuin lienee tietoa välittävä grafiikka, joka pyrkii havainnollistamaan jotain, jonka grafiikan tekijä (tai tilaaja) tietää ja haluaa viestiä muille. Puhtaimmillaan tämä funktio toteutuu vaikkapa jonkin laitteen toimintaperiaatetta kuvaavassa piirroksessa, mutta esimerkiksi myös tilastografiikalla pyritään useimmiten havainnollistamaan jotain asiaa, jonka grafiikan tekijä itse tietää ja haluaisi lukijoidensa ymmärtävän. Tehtäessä ero termien infografiikka ja visualisointi välillä (niitä voi käyttää myös toistensa synonyymeinä) termillä infografiikka viitataan yleensä nimenomaan tiedonvälitystarkoitusta palvelevaan grafiikkaan.

Varsinkin tieteentekijät käyttävät paljon myös eksploratiivista grafiikkaa, jonka tarkoitus on helpottaa uusien piirteiden löytämistä tietoaineistosta. Grafiikan tekijä ei siis itsekään aluksi tiedä, mitä grafiikasta paljastuu. Termillä visualisointi viitataan yleensä grafiikkaan, jolla on eksploratiivinen tehtävä puhtaan tiedonvälityksen sijaan tai ainakin lisäksi. Klassinen esimerkki eksploratiivisesta grafiikasta on nykyaikaisen epidemiologian isänä pidetyn John Snow’n 1854 Lontoossa riehuneesta koleraepidemiasta tekemä kartta, johon hän merkitsi kaikkien koleraan kuolleiden asuinpaikat. Snow huomasi, että kuolintapaukset keskittyivät Broad Streetilla sijainneen kaivon ympärille ja näin selvisi epidemian alkulähde. Eksploratiivisten visualisointien käyttö on yleistynyt runsaasti tietokoneiden kehityksen myötä kun on tullut mahdolliseksi tuottaa niitä automaattisesti. Usein ne ovat luonnosmaisia ja ulkoasultaan viimeistelemättömiä, koska niitä ei ole ajateltukaan laajan yleisön nähtäväksi. Alkujaan eksploratiiviseen käyttöön tehty grafiikka saattaa kuitenkin sittemmin päätyä viestinnälliseen käyttöön kun esimerkiksi tutkija haluaa kertoa löydöksistään muille. Tällöin myös kuvalliseen esitystapaan on hyvä kiinnittää huomiota.

Vielä kolmas kategoria ovat graafiset esitykset, joiden pääasiallinen tarkoitus on vain houkutella lukija tai katsoja tiedon pariin ja tuoda emotionaalinen ulottuvuus viestintään. Ne eivät siis pyri havainnollistamaan tai tekemään näkyväksi datan ominaisuuksia vaan ainoastaan luomaan mielikuvia ja mielenkiintoa aihetta kohtaan. Tätä grafiikan lajia kuvajournalismin pioneeri Harold Evans kutsui (Merja Salon suomentamana) höystegrafiikaksi erotuksena tietoa välittävästä faktagrafiikasta (infografiikka ja visualisoinnit). Graafiset suunnittelijat ja art directorit kutsuvat sitä yleensä kuvitukseksi. Varsinkin aikakauslehdistössä kuvitukset ovat olleet keskeinen osa kuvailmaisua jo modernin aikakauslehden syntyvaiheista 1900-luvun alkupuolelta asti ja niillä on selkeä, faktagrafiikasta poikkeava viestinnällinen tehtävänsä. Viime vuosina kuitenkin on voimistunut kyseenalainen trendi, jossa myös hämmästyttävän iso osa varsinkin netissä kiertävästä ”infografiikaksi” kutsutusta materiaalista vetoaa puhtaasti esteettis–emotionaaliseen rekisteriin ja grafiikan tietoa välittävä komponentti on vähäinen tai olematon. Itse kutsun tällaista tietoa välittävän grafiikan visuaalista kieltä jäljittelevää höystegrafiikkaa infografiikkamaiseksi kuvitukseksi.

Tämäkään kolmijako ei ole terävärajainen vaan usein grafiikassa on sekä tietoa välittäviä, eksploratiivisia että kuvituksellisia piirteitä. Esimerkiksi Isotype-ryhmän filosofiassa tiedon esitysasun esteettistä houkuttelevuutta pidettiin tärkeänä vaikka toiminnan ytimessä oli nimenomaan tiedon välittäminen. Tällainen ajattelu on järkevää erityisesti esimerkiksi oppikirjojen kuvituksien kohdalla; niiden lukijat eivät välttämättä ole lähtökohtaisesti kiinnostuneita sisällöstä vaan opiskelumotivaatiota pitää myös tietoisesti pyrkiä luomaan suunnittelemalla tiedon esitysasu houkuttelevaksi. Vapaaehtoisesti aineistoa tutkivat aikuiset ovat kuitenkin erilainen yleisö kuin vastentahtoiset koululaiset ja jos grafiikan tekijä kokee, että tietoa on koristeltava jollain tavoin että se olisi kiinnostavaa, olisi hyvä hetki pohtia onko koko aiheen valinta pielessä. Edward Tuften sanoin: ”Jos tilasto on tylsä, siinä on väärät luvut.”

Jos päämääränä on todella vain tuottaa kaunista ja näyttävää jälkeä tiedonvälityksen sijaan, miksi tehdä näennäisinfografiikkaa sen sijaan että käyttäisi reilusti kuvittajaa? On hämmästyttävää, miten usein infografiikkana kaupitellaan sen ulkoisen visuaalisen kielen omaksunutta mutta lähes puhtaasti kuvituksellista grafiikkaa (esimerkiksi GOOD-lehden grafiikka yllä). Samoin monet visualisointeina markkinoidut esitykset ovat puhdasta datataidetta, jossa data on vain raakamateriaalia kiinnostavan esityksen luomiselle.

Tutkitaanpa visualisointitutkija Robert Kosaran esittämää visualisoinnin määritelmää:

  • Visualisointi perustuu (ei-visuaaliseen) dataan,
  • visualisointiprosessi tuottaa lopputuloksenaan kuvan ja
  • tämän lopputuloksen tulee olla tulkittavissa ja tunnistettavissa.

Kaksi ensimmäistä kriteeriä kyllä toteutuvat datataiteessakin, mutta kolmas kriteeri erottaa sen ja visualisoinnit toisistaan. Tarkastellaanpa esimerkiksi oheista Miska Knapekin Windcuts-sarjaan kuuluvaa veistosta. Se on leikattu tietokoneohjattavalla jyrsimellä puuhun, käyttäen aineistona Ilmatieteen laitoksen keräämää tietoa tuulen nopeudesta ja suunnasta sekä lämpötilasta eräällä Helsingissä sijaitsevalla mittausasemalla viiden vuorokauden ajalta. Tuo tieto on kyllä pienellä vaivannäöllä luettavissa valmiista teoksesta jos tietää käytetyn visuaalisen koodaustavan, mutta missään nimessä se ei ole kovin helppoa ja esimerkiksi nopean yleiskuvan muodostaminen mittauspaikan tuulioloista ei teoksesta onnistu. Veistos on kiinnostava taideteos ja tutkielma kokeellisesta visualisointitekniikasta, mutta jos tarkoituksena olisi kehittää mahdollisimman selkeä tapa välittää säätietoa kuvallisessa muodossa, valittaisiin luultavasti joku toinen tapa esittää sitä.

Visualisointi sanan varsinaisessa merkityksessä tarkoittaa, että keskiössä on datan parempi ymmärtäminen ja esitystapa valitaan sen mukaan. Onnistunut visualisointi pystyy vastaamaan kysymyksiin aineistosta paremmin kuin pelkkä teksti. Datataiteessa vuorostaan esitystapa on tärkeämpi kuin sisältö ja ymmärrettävyys.

Oikealla on Opte-projektin tuottama visualisointi internetin rakenteesta marraskuussa 2003. Se on tyyppiesimerkki tahattomasta datataiteesta: visualisointi on monimutkaisuutensa vuoksi niin vaikeaselkoinen, että esitystapa muodostuu sen olennaiseksi sisällöksi ja data jää toissijaiseksi, koska sitä ei saa purettua kuviosta. Visualisointi voisi yhtä hyvin olla generoitu täysin satunnaisesti – kuka tietää vaikka olisikin?

Ihmiset ovat kuitenkin luonnostaan essentialisteja. Tarina kuvion takana olevasta tietomäärästä kiehtoo, vaikka sitä olisi mahdotonta nähdä lopputuloksesta. ”Tutkijat laativat upean kartan universumin rakenteesta, katso kuvat!” kerää enemmän tykkäyksiä Facebookissa kuin ”Nörtti teki upean kuvan satunnaisesta datasta, katso kuvat!” Mutta tämän ei pitäisi oikeuttaa älyllistä laiskuutta visualisointien tekijöiltä. Vaikka käsittämätön visualisointi oikeasta datasta olisi parempi kuin käsittämätön visualisointi keksitystä datasta, vielä parempi on ymmärrettävä ja havainnollinen visualisointi oikeasta datasta.

* * *

Huffman nostaa blogikirjoituksessaan esiin myös tärkeän kysymyksen esitystavan abstraktisuuden asteesta suhteessa sisältöön: ”On epätodennäköistä, että tämän kartan sisältämää tietoa pidettäisiin abstraktina koska pohjakartta hienoine valaistusefekteineen ja pilvineen ei näytä kovin abstraktilta. –– Visuaalisen abstraktiotason tulee vastata tiedon abstraktiotasoa. Nähdessään hyvin yksinkertaistetun visualisoinnin lukijat olettavat, että myös data kertoo hyvin yksinkertaistetun tarinan. Nähdessään hyvin realistisen ja yksityiskohtaisen pohjakartan he todennäköisesti uskovat myös siinä kuvatun tiedon olevan samalla tarkkuustasolla.”

Lukijan tulisi siis yhdellä silmäyksellä nähdä grafiikasta kuinka hienojakoista tietoa se sisältää. Tämä ajatus on luonteva kartografian piirissä, jossa on totuttu tekemään samoista kohteista käyttötarkoituksen mukaan erilaisella tarkkuustasolla olevia karttoja. Olisi älytöntä kuvata vaikkapa vaalituloksen jakautumista äänestysalueittain käyttämällä pohjakarttana kantakarttaa, tarkinta saatavissa olevaa kartta-aineistoa maanpäällisestä rakennetusta ympäristöstä, johon on merkitty niin maastonmuodot kuin yksittäiset puut ja sähkötolpatkin. Tietokoneavusteisten visualisointien tekijöille tämä sisällön ja esitystavan abstraktiotasojen yhteys ei ole aina aivan yhtä selkärankaan iskostunut. Ei valitettavasti ole kovin tavatonta nähdä visualisointeja, jotka ensi vilkaisulla näyttävät sisältävän valtavasti tietoa mutta joista tarkemmassa katsannossa osoittautuukin että niissä yksinkertainen data on piiloitettu monimutkaisen esitystavan alle.

* * *

Infografiikan ja visualisoinnin kauneudella ja näyttävyydellä on arvonsa ja viestinnällinen funktionsa, mutta niiden pitäisi olla alisteisia tiedonvälityksellisille tarpeille. Esteettiset ratkaisut eivät saisi vaarantaa kuvion ymmärrettävyyttä eikä yksinkertaista dataa pitäisi kuorruttaa monimutkaisella esitystavalla vau-kertoimen lisäämiseksi. Kun artikkeli, kirja tai nettisivu kaipaa jotain näyttävää ja kaunista, kannattaa yleensä ennemmin tilata kuvitus kuin infografiikka. Samaan aikaan pitää kuitenkin muistaa, että kuten käytettävyystutkimuksissa on havaittu, esteettisesti miellyttävä koetaan myös helpommin ymmärrettävänä. Niinpä myös infograafikon kannattaa töissään pyrkiä kauneuteen, niin kauan kuin se ei vaaranna muita ymmärrettävyyden kannalta tärkeitä tekijöitä.

Opastusta Kampissa

Kävin pari päivää sitten Kampin kauppakeskuksessa. Olin etsimässä tiettyä kauppaa, joten yritin löytää infotaulun, jossa kiinteistön kaupat olisi sijoitettu kartalle. Pienen etsiskelyn jälkeen minulle valkeni, että kaikki perinteiset infotaulut oli korvattu isoilla kosketusnäytöillä. Olin aluksi vain kävellyt niiden ohi koska en halunnut vuorovaikuttaa päätteen kanssa, vaan ainoastaan nähdä kartan. Infotaulut näyttävät lepotilassa vain näytönsäästäjäkuvaa, ja päästäkseen kauppakeskuksen karttaan joutuu painamaan näyttöä vähintään kahdesti. Siltä varalta, että näytönsäästäjäkuva ei ole riittävän ilmeinen, näyttöjen reunaan on lisätty pienet jälkiviisaat tarrat: ”Infotaulu löytyy koskettamalla ruutua!”. Tästäkään huolimatta en heti tajunnut, mihin infotaulut olivat kadonneet.

Näyttöjen kuva ei myöskään päivity järin nopeasti ja sen tarkkuus on turhan matala lähikatseluun. Sinänsä kosketusnäyttöjen käytössä infotauluina ei ole mitään vikaa. Ne myös helpottavat muuttuneiden tietojen päivittämistä verrattuna painettuihin opastauluihin. Kampin näyttöjen suurin ongelma on, että oletuskuvan informaatioarvo on nolla ja käyttäjä pakotetaan navigoimaan entuudestaan tuntematonta valikkorakennetta ennen kuin pääsee varsinaiseen tietonäkymään, eli karttaan.

Ensimmäinen valikko.

Kun kartan saa auki, huomaa ettei se ole järin selkeästi toteutettu, varsinkin liikkeiden sijainnin hahmottaminen on turhan hankalaa. Helppo keino lisätä havainnollisuutta olisi käyttää värikoodausta eri palveluiden merkitsemiseen.

E-kerroksen karttanäkymä.

Mielestäni voi turvallisesti olettaa, että yleisin tieto, jota kauppakeskusken kävijä kaipaa tällaiselta infonäytöltä on juuri opaskartta. Digitaalisen kartan tulisi toimia päänäkymänä ja aukioloaikojen, hakujen ynnä muun hyödyllisen, mutta toissijaisen tiedon avautua sen päälle. Kauppakeskuksen kartta on jo itsessään usein tuntematon käyttöliittymä, jota pitää tutkia melko huolella vaikka tietäisikin mitä hakee. Kampin näytöissä joutuu lisäksi näkemään vaivaa vielä siihen, että edes löytää koko kartan.

Kampin opastaulujen päivittäminen kosketusnäytöiksi olisi ollut tilaisuus parantaa käytettävyyttä. Tämä mahdollisuus on hukattu, mikä on harmillista varsinkin kun Kamppi on aikoinaan palkittu esteettömyydestä näkövammaisille suunniteltujen opasteiden takia. Esteettömyys ja käytettävyys eivät kuitenkaan ole taineet pysyä kauppakeskuksen prioriteeteissa enää yhtä korkealla rakentamisvaiheen jälkeen.

 

Tietosivu kaupunginosista

Helsingin kaupungin tietokeskuksella on varsin paljon dataa Helsingistä kaupunginosien tasolla. Yksittäisistä taulukoista tai edes Tilastollisesta vuosikirjasta ei kuitenkaan ole aina helppoa hahmottaa kokonaiskuvaa yksittäisistä kaupunginosista. Siksi päätimme viime viikonlopun Open Data Kitchenissä yhdessä Janne Aukian ja We Love Open Datan kanssa tehdä pienen työkalun, jonka avulla voi luoda tietosivuja kaupunginosadatasta.

Työkalu ei ole valmis, mutta se on toimiva prototyyppi jolla pystyy visualisoimaan erilaista dataa kaupunginosista, kunhan se on ensin käsitelty sopivasti muotoilluiksi csv-tiedostoiksi. Mielenkiintoinen jatkokehitysmahdollisuus työkalulle olisi esimerkiksi verkkopohjainen versio, jonka avulla kävijä voisi tulostaa tai jakaa valitsemansa dataa omasta kaupunginosastaan.

Projekti on rakennettu Nodeboxilla ja on ladattavissa kokonaisuudessaan Githubista: https://github.com/jaukia/odk-localdata.
Pdf-tulosteet kaikista kaupunginosista löytyvät täältä.

Kartta perustuu kaupungin avoimeen seutukarttaan, joka on Qgisin ja kml-to-svg-konvertterin avulla muutettu svg-muotoon.

English summary: We made a tool for creating local data sheets from Helsinki city district level data in collaboration with  Janne Aukia ja We Love Open Data. It is made in Nodebox  and is available on Github: https://github.com/jaukia/odk-localdata

Käsittämättömän kuvaaminen

Teksti on julkaistu lyhennettynä Grafia-lehdessä.

Informaatiomuotoilun voima on asioiden näyttäminen niiden todellisissa mittasuhteissa. Se on verrattain helppoa silloin, kun esitettävät asiat ovat jollain tavalla katsojan arkikokemukseen verrattavia, mutta usein näin ei ole. Valaisivimmat näkemäni esitykset ovat onnistuneet voittamaan käsityskyvyn rajoitukset ja antaneet realistisemman näkökulman asioihin kuin pelkät asiantuntijoiden selitykset.

Kuten tästä dvice.comin kuvasta näkyy, kuuluisan Virgin Galacticin avaruuskoneen lentokorkeus peittoaa saman sarjan kilpailijat, mutta on mainettaan mitättömämpi ainakin verrattuna valtiollisten ohjelmien saavutuksiin.

Yleisimmät vaikeaa mittakaavaa käyttävät esitykset liittyvät avaruuden sijaan tavalla tai toisella talouteen. Vuoden 2008 velkakriisin laajetessa syntyi joukko huonoja uutisia. Niiden myötä ilmestyi uutisiin lukumääriä, jotka ovat satoja kertaluokkia suurempia kuin mitä arkielämässä yleensä kohtaa. Kuukausien sisällä päätettiin satojen miljardien dollarien suuruisten rahamäärien kohtalosta. Pelastuspakettien vastustajat Yhdysvalloissa käyttivät pitkiä puheenvuoroja, jotka vilisivät lukusanoja, joita yleensä käytetään vain tähtitieteessä. Niillä ei kuitenkaan ollut samaa selittävää voimaa kuin hyvillä visualisoinneilla, jotka laittoivat luvut oikeaan asiayhteyteen. Lukijan on helpompi hahmottaa vuoden aikana talouteen kaadetun rahan määrä, kun koko paketti on eritelty ja laitettu vierekkäin maan suurimpien menoerien kanssa kahden vuosisadan ajalta. Tällainen visualisointi on tehokasta ja puhuttelevaa sisältöä ja vaatii suunnittelijalta samaa vastuuta kuin toimittajalta.

Vaikka esitys saisi olla visuaalisesti hiotumpi, se auttaa hahmottamaan elvytyspaketin suuruutta. Kuva ei aivan ehtinyt Bailout Nation -kirjan kovakantiseen painokseen, mutta se osoittaa tekijöidensä kyvyn esittää asiat ymmärrettävässä asiayhteydessä.

Toinen ihmiselle vaikeasti hahmottuva asia on todennäköisyys (tähän lottoamisenkin suosio perustuu). Olemme luonnostamme taitamattomia arvioimaan harvinaisten tapahtumien todennäköisyyksiä. Seuraavanlaisia kuvia voisi jakaa kaikille luulotautisille ja kroonisesti pelokkaille.

(klikkaa päästäksesi suurempaan versioon)

Hyvän viestinnän ohjeen mukaan ihmisen havaintokyky on kaventuva ja tarkentuva: havaitsemme suuripiirteisesti laajoja kokonaisuuksia ja niiden pienempiä osasia yksityiskohtineen, mutta emme kumpaakin yhtä aikaa. Kirjoittajalle tämä tarkoittaa, että uudet asiat esitellään aloittamalla yleisistä piirteistä ja päätymällä lopulta yksityiskohtiin. Informaatiomuotoilussa sama johdattelu tehdään käyttämällä kuvan sisäistä visuaalista kielioppia. Siinä yleinen taso on se, jonka lukija huomaa ensinäkemältä. Se määrittää mittakaavan ja esitettävän tiedon eri tyypit. Yksityiskohtaisin taso näyttää tarkimman tiedon, jonka parhaassa tapauksessa voi suhteuttaa saumattomasti kuvan muihin osiin. Pelkkä datatiheys ei tee kuvasta arvokasta, sillä ilman yhdistäviä vinkkejä se on vain tiedon saareke. Edellä näytetyissä esimerkeissä johdattelu yleisen ja yksityisen välillä tapahtui yksinkertaisesti visualisoimalla luvut eri asiayhteyksiin. Saman voi tehdä monipolvisesti, kuten itse kokeilin tässä puretussa aikajanassa, joka havainnollistaa geologisen ajan jakotapaa:

 

(kuva suurenee klikkaamalla)

Harmittavan yleinen tapa graafikoilla on tekstin välttäminen informaatiomuotoilussa. Ehkä kyse on liiasta itsevarmuudesta (tai turhamaisuudesta). Tekijä luottaa kuvakerrontansa vahvuuteen niin paljon, että tekstin käyttäminen tuntuu luovuttamiselta. Ehkä kyseessä on myös jonkinlainen tiedostamaton reviirijako kuvittavan ja kirjoittavan väen välillä. Joka tapauksessa on harvoin mitään oikeaa syytä olla käyttämättä tekstiä osana esitystä. Uudet asiat on joka tapauksessa avattava sanallisesti, ja parhaiten se onnistuu kun selitys on osa kuvitusta. Typografian hierarkiaa luovat keinot ovat kuvallisia kerrontatapoja muiden rinnalla.

Kun visuaalinen kielioppi on johdonmukainen ja helppo hahmottaa, sitä voi jatkaa eri mittakaavojen lisäksi eri kuviin. Kun samaan raamiin laadittuja kuvallisia tietokokonaisuuksia järjestetään kuvasarjaksi, niitä vertaamalla voi nähdä pieniäkin muutoksia lukumäärien ja muiden arvojen välillä. Edward Tufte käyttää näistä nimitystä small multiples, toistokuvio. Tämän keinon vahvuus vaikeasti hahmotettavien asioiden kuvaamisessa on sen kyky kertoa muutoksen laatu ja määrä hyvin tarkasti. Tällaiset esitykset näyttävät sommittelunsa puolesta hieman sarjakuvilta, ja niissä toimii lukemisen johdattelun kannalta pitkälti sama logiikka. Tufte on sitoutunut pelkistettyyn ja hienovaraiseen esittämiseen ja perustelee mieltymyksensä hyvin, mutta sarjakuvakerronnan keinoilla olisi paljon annettavaa informaatiomuotoilulle. Etenkin aikasarjaan järjestetyissä kuvissa sarjakuvateoreetikko Scott McCloudin ohjeet ruutusommittelusta tekisivät esityksistä parempia. Ne ovat yhtä avartavaa luettavaa kuin mikä tahansa informaatiomuotoilun teorian klassikoista, mutta ikävä kyllä yhtä huonosti saatavilla suomeksi. Hänen nettisivunsa ovat kuitenkin hyvää luettavaa kaikille graafikoille. McCloud jakaa ruutuvaihdosten tyypit kuuteen luokkaan riippuen ajallisen ja tilallisen muutoksen määrästä ruutujen välillä. Hetkestä hetkeen tapahtuva muutos on näistä välittömin, kun taas suurin muutos vaihtaa kohtauksen tapahtumapaikan ja -ajan täysin. Mikään teoria ei tietenkään korvaa kokeneen suunnittelijan visuaalista rytmitajua, mutta ruutukerrontaan liittyy yllättäviä ja helppotajuisia lainalaisuuksia, joita avataan lyhyesti kirjassa Sarjakuva – näkymätön taide.

Tilastografiikassa mitta-asteikon yhdenmukaisuus on selkeyden kulmakivi. Siitä tulee kuitenkin rasite, kun esitetään yhdessä kuvassa täysin eri kertaluokkien lukuja. Tällaisiin tarkoituksiin ei ole sellaisia valmiita ratkaisuja, joita muut kuin asiantuntijat osaisivat lukea. Tämä ei estä hyvää tarkoittavia valistajia yrittämästä. Välillä suurelle yleisölle tarkoitettuihin julkaisuihin eksyy jopa tilastokuvia, joissa käytetään logaritmista asteikkoa. Ne kertovat tekijöiden oppineisuudesta, mutta harvoin avaavat sisältöä lukijalle. Eri mittakaavojen asioita vertailtaessa onkin välillä luovuttava yhtenäisestä mitta-asteikosta. Rinnastus on silti mahdollista, jos muut kuvalliset mittarit ovat yhtenäiset. Väri on tässä yleinen apu, samoin kuin typografinen hierarkia. Isotype-kuvista tutut yksikkösymbolit ovat myös tapa kuvata lukumääriä vertailukelpoisesti. Kun jokainen symboli on suunniteltu hyvin skaalautuvaksi, rinnastettavilla kuvilla voi olla suurikin määrällinen ero. Mittakaavaongelman ratkaisemiseksi osiin purettu kuva vie usein enemmän tilaa ja esittää edelleen saman datamäärän, mutta tiheyden menetystä korvaa sen saama kerronnallinen arvo. Vaikka infokuvan ei pidäkään olla kuvitusta, tällaiset koostetut esitykset ovat usein esteettisestikin kiinnostustavia.

Vaikeasti hahmotettavien asioiden tulkitsemisessa kuviksi pelkät äärimmäiset mittakaavat eivät ole ainoa ongelma. Suunnittelijan oma ymmärrys aiheesta on kapein pullonkaula. Parhaissa esityksissä tekijä on hankkinut vähintään perustiedot aiheesta ennen kuvan luonnostelua, mikä näkyy oivaltavina ja genren rajoja rikkovina ratkaisuina. On parempi, että aineistoon perehtyy graafinen suunnittelija kuin että kuvan tekisi visuaalisuuteen perehtymätön aiheen asiantuntija. Moni tärkeä uutinen on joka tapauksessa vaikea käsittää, ja hyvä kuva avaa sen sisällön tavalla, johon pelkkä teksti ei kykene.