A misleading chart about Chávez’s legacy

FAIR has an entertaining piece critizising AP’s treatment of the late Venezuelan president Hugo Chávez. While I have some serious misgivings about the tendency of some left-leaning writers to skate over the awful human rights record of the Chavéz regime just because he was seen as a counterweight to the United States’ economic and foreign policy, it is certainly true that spending oil revenues on social programs instead of skyskrapers or museums is a sensible choice for a country like Venezuela. However, I take issue with the use of graphics in the FAIR article.

Accompanying the story is a graphic comparing the number of people living in poverty (defined here as a daily income of less than $ 2 at purchasing power parity) in Venezuela and Brazil:

Why is the vertical scale truncated at 10 %? And more importantly, why does the x-axis start at 2003? President Chávez took office in 1999 so wouldn’t that be a more relevant starting point? (I know the short answer to these questions that the graphic is a screenshot from World Bank’s website, but I still think it’s sloppy journalism to cut corners like this when it would have taken 5 minutes to download the relevant data and do the graphic in Excel.)

I downloaded the same World Bank data and did the graphic below, starting from 1998, a year before Chávez took office. I also added the data for Colombia and Mexico. I also added the data about U.S. oil price in real (inflation-adjusted) dollars per barrel as an inverted bar chart on the background to give context.

The World Bank data is somehat patchy, but by connecting the data points we have an interesting picture appears. In 1998 Brazil, Mexico and Venezuela had the same share of population living in poverty at roughly 20 %. In Colombia the share was some 7 percentage points higher. In the newest available data Brazil and Venezuela are roughly on par and Colombia is still trailing the two by the same amount as in 1998, whereas Mexico clearly has broken off the pack. Venezuela’s progress seems to be tracking the oil price curve whereas Mexico and Brazil show steadier, if less dramatic progress towards lower poverty rates.

The moral of the story is that it’s often possible to frame the data so that it supports your claim, whether true or not. Stepping back and showing more gives the audience the chance to judge for themselves. In this case it would seem that Venezuela did indeed make significant progress in reducing poverty during Chávez’s reign, but so did other oil exporting Latin American countries. Venezuela no more looks exceptional when showing a more complete set of data.

Kill your darlings, osa 2: Fraktuura vs. antiikva

Kill your darlings -sarjamme jatkuu, tällä kertaa vuorossa ihan hauska, mutta viime kädessä kirjan varsinaiseen aiheeseen nähden turhan pitkä referaatti Pekka Mervolan väitöskirjan antiikvakirjasimen maihinnousua Suomeen käsittelevästä osiosta.

* * *

Suomalaisten sanomalehtien ulkoasun historiaa tutkinut Pekka Mervola kuvaa väitöskirjassaan* värikkäästi typografisista kysymyksistä Suomessa vuosikymmenten varrella käytyä keskustelua. Pitkäänhän Suomessa yleisimpänä kirjaintyyppinä oli saksalaisella kielialueella suosittu, keskiaikaisesta käsikirjoitustyylistä kehittynyt fraktuura. 1800-luvulla alettiin käydä keskustelua siitä, tulisiko se Suomessakin korvata Ruotsissa ja muualla Euroopassa jo yleistyneellä ja nykyaikaisempana pidettynä antiikvalla, nykyisinkin yleisesti käytössä olevalla päätteellisellä kirjaintyylillä (jonka rinnalla nykyään käytetään yleisesti myös päätteetöntä groteskia).

Vastustus antiikvaa kohtaan oli pitkään huomattavaa. J.V. Snellman esimerkiksi huomautti kirjeessä Helsingin yliopiston suomen kielen lehtorille, Suomalainen-lehden päätoimittajalle K.A. Gottlundille, että useimmat kansanihmiset osasivat lukea vain fraktuuraa, sillä Raamattu ja kaikki kansankirjallisuus oli kautta aikojen ladottu tuolla kirjaintyylillä. Ruotsia puhuvalla väestönosalla tällaisia rajoitteita ei ilmeisesti ollut, sillä pitkään rinnakkain suomen- että ruotsinkielistä aineistoa sisältävissä lehdissä suomenkieliset uutiset ja ilmoitukset ladottiin fraktuuralla ja ruotsinkieliset antiikvalla.

Antiikvan puolustajien piti marssittaa esiin raskaan kaliiperin argumentit syrjäyttääkseen fraktuura lopullisesti lehtien sivuilta. Uuden Suomettaren yhtiökokouksen pöytäkirjoihin keväältä 1913 on tallentunut lääkintöneuvos K. Reijovaaran esittämä arvio, että antiikvakirjoitus on fraktuuraa terveellisempi lukijoiden silmille.

Myös ulkomaiset asiantuntijat marssitettiin typografiasodan rintamalle. Sanomalehdenkustantajain Liitto julkaisi 1919 saksalaisen professorin Münsterbergin näkemyksiä sanomalehden ulkoasusta. Professoria kuultiin itseoikeutetusti asiantuntijana hänen kehittämästään sanomalehtien psykotekniikasta, joka korosti lehden lukemisen helppoutta. Hän piti hyvälaatuista fraktuuraa saksalaisille sanomalehdille sopivampana kuin antiikvaa, mutta katsoi, että ulkomaalaisille tarkoitettu teksti oli parempi latoa antiikvalla.

Münsterberg otti kantaa myös muihin typografisiin kysymyksiin kuin vain kirjainlajiin, mm. suosittellen lehtien hieman suurentavan kirjasinkokojaan. Kirjoissa palstaleveys sai hänen mukaansa olla korkeintaan 90 mm, mutta sanomalehtipalstan leveyden tuli olla tuntuvasti kapeampi. Professorin suositus perustui siihen, että silmän hyppäys riviltä toiselle on aina sitä raskaampi mitä leveämpi palsta on. Liian suuri palstanleveys aiheutti hänen mukaansa silmissä epäsuhtaisen ”akkomodaatiojännityksen”, mikä haittaa luettavuutta. Münsterbergin mukaan saksalaisissa lehdissä on pyritty pieneen sivukokoon, sillä se on lukijalle mukava. Useimmat 1900-luvun alun sanomalehdethän olivat fyysiseltä kooltaan valtavia, reilusti nykyisiä [kirjoitettu ennen Hesarin tabloid-uudistusta –JK] broadsheet-kokoisia lehtiäkin isompia.

Münsterberg suositteli lehtimiehiä myös lyhentämään tekstikappaleiden pituutta. Hänen mukaansa lyhyet pysähdykset eli kappaleiden sisennykset miellyttävät lukijoita. ”Pitkät kappaleet taas vaikuttavat lukijaan samoin kuin pitkä, suora katu.” Hän otti kantaa myös kiivaana käyneeseen keskusteluun otsikoiden koosta. Aiemminhan juttuja ei välttämättä otsikoitu lainkaan, nyt suuret ja massiiviset otsikot olivat leviämässä Yhdysvalloista Eurooppaan, mikä herätti suuria intohimoja. Münsterberg suhtautui asiaan rennosti: ”Psykotekniikan kannalta katsottuna  ei voida mitään sanoa lihavia päällekirjoituksia vastaan, mitkä heti johdattavat silmän uusimpaan ja tärkeimpään lehdessä.” Suomessa tätä uutta otsikointityyliä oli ensimmäisenä edustanut Työmies, jonka lukijat olivat huonommin koulutettua väkeä, jolle pitkien tekstimassojen lukeminen oli sivistyneistöä hankalampaa. Otsikoinnin siis ajateltiin helpottavan luettavuutta ja maailmallakin otsikointi oli yleistynyt ensin kansalle tarkoitetuissa lehdissä kuten keltaisessa lehdistössä.

Myöhempinä vuosina näyttävässä otsikoinnissa mentiinkin sitten niin pitkälle, että peräti valtiovalta katsoi tarpeelliseksi puuttua asiaan: ”Mielestäni kahden palstan otsakkeet ilman alaotsakkeita riittävät useimmissa tapauksissa”, totesi pääministeri Antti Hackzell syksyllä 1944 paperipulan kirvoittamana.

Merkittävä käännekohta fraktuuran ja antiikvan välisessä taistelussa tapahtui kun 1912 julkaistiin antiikvalla ladottu Raamatun taskukokoinen laitos ja 20-luvulla perhe- ja vihkiraamatuissakin siirryttiin antiikvaan.

*) Mervola, Pekka 1995. Kirja, kirjavampi, sanomalehti. Ulkoasukierre ja suomalaisten sanomalehtien ulkoasu 1771–1994. Helsinki ym., Suomen Historiallinen Seura & Jyväskylän yliopisto. Väitöskirja.

Kill your darlings osa 1: Valekerroin

Blogi (ja Twitter-tilimme) on viettänyt nyt kirjoittajien lomien, työkiireiden ja kausi-influenssan vuoksi aika pitkään hiljaiseloa. Asiaan tulee nyt ainakin hetkeksi muutos.

Pidämme juuri viikon mittaista kirjoitustyöpajaa jossa yritämme saada työstettyä tulevan Informaatiomuotoilu-kirjamme käsikirjoitusta julkaisukuntoon. Valmista tekstiä on jo todella paljon, mutta se ei vielä muodosta kunnolla toimivaa kokonaisuutta ja sitä tässä nyt yritetään kursia kasaan. Yksi osa tätä työtä on ”kill your darlings”, eli kylmästi heittää pois tavaraa johon on jo ehtinyt vähän kiintymään. Onneksi meillä on blogi, jossa voi julkaista niitä tekstinpätkiä, joissa on joku järjen hiven, mutta jotka eivät kunnolla istu kirjan kokonaisuuteen. :) Tällä viikolla blogiin ilmestynee ainakin muutamia tällaisia juttuja. Alla niistä ensimmäinen, jossa jauhetaan valekertoimen käsitteestä ja asteikkojen katkaisemisesta tarpeettoman pitkällisesti yleistajuisen kirjan tarpeisiin.

* * *

Yksi tunnetuimpia tilastografiikan nyrkkisääntöjä on Edward Tuften kirjassaan The Visual display of quantative information (1983) esittelemä valekertoimen käsite. Sen ajatus on yksinkertainen:

grafiikan esittämä ilmiön koko
———————————————  =  valekerroin
datan esittämä ilmiön koko

Kun valekertoimen arvo on tasan 1, grafiikka esittää datan rehellisesti. Jos sen arvo poikkeaa tästä, grafiikka esittää ilmiön suuruuden väärin. Useimmiten poikkeama on ylöspäin eli grafiikka liioittelee ilmiön suuruutta. Tyypillinen esimerkki on tapaus, jossa tilastografiikkaesitykseen lisätään esteettisistä syistä perspektiivivaikutelma. Tällöin ero katsojasta kauempana ja tätä lähempänä olevien kuvioelementtien välillä näyttää suuremmalta kuin sen lukujen valossa pitäisi olla.

Toinen valitettavan tyypillinen virhe syntyy kun pylväskuvion pylväät korvataan jollain esittävällä kuvalla jota suurennetaan arvon muuttuessa, vaikkapa öljynkulutusta eri vuosina kuvaavilla eri kokoisilla öljytynnyreillä. Jos elementtiä venytetään vain pystysuunnassa, ongelma on lähinnä esteettinen: venytetty öljytynnyri näyttää kummalliselta. Mutta tämän esteettisen ongelman korjaaminen tynnyriä vastaavasti leventämällä saa aikaan valekertoimen arvon nousemaan huikeaksi: jos mittasuhteet säilytetään entisellään, tynnyrin korkeuden tuplaaminen saa kuvion pinta-alan nelinkertaistumaan. Ja todellisuudessahan tynnyri on kolmiulotteinen objekti, jolloin sen ulkomittojen tuplaaminen johtaisi tilavuuden kahdeksankertaistumiseen!

On ilmeistä, että tällainen kuvioelementtien paisuttelu nostaa valekerrointa. Nopeasti kuitenkin huomataan, että valekertoimen arvon tarkka määrittely ei ole tällaisessa tapauksessa aivan niin yksiselitteistä kuin Tufte esittää. Tutkimukset* ovat nimittäin osoittaneet, että pinta-alan ja tilavuuden muutokset arvioidaan keskimäärin pienemmiksi kuin ne todellisuudessa ovat. Jos tämä tekijä huomioidaan, havaitaan nopeasti että valekertoimelle ei voi antaa yksiselitteistä arvoa. Luvut matemaattisesti oikein pinta-aloina näyttävä esitys voi vaikuttaa vähättelevän niiden eroja ja toisaalta numeroita liioitteleva voi vaikuttaa näyttävän ne paremmin oikein.

Valekerroin on siis oikeansuuntainen, mutta liian yksioikoinen lähtökohta toimivan informaatioesityksen laatimiseen. Valekertoimen tulisi useimmissa tapauksissa saada arvo 1, mutta tämä ei vielä yksinään riitä takaamaan, että esitys on selkeä ja ymmärretään niin kuin sen suunnittelijat toivoisivat. Toisaalta on myös tilanteita, joissa valekerroin voi Tuften ohjeiden mukaan laskettuna olla suurikin, mutta katsoja ymmärtää silti asian paremmin kuin samasta aiheesta tehdyn esityksen jossa valekerroin olisi vain 1.

Tuften valekerroin saa yhdestä poikkeavia arvoja aina kun asteikko katkaistaan jostain kohtaa, joten sitä ehdottomana ohjenuorana käyttäessä asteikon katkaisu ei koskaan ole sallittua. Meidän mielestämme joissain mainituissa tapauksissa katkaiseminen kuitenkin on soveliasta, kunhan se merkitään hyvin selvästi.

Useimmat tilastografiikan auktoriteetit hyväksyvät pylväskuviossa yksittäisten pylväiden katkaisemisen ”yläpäästä”. Tällä tarkoitetaan tilannetta, jossa yksi tai kaksi pylvästä olisivat niin pitkiä, että jos ne piirrettäisiin samaan mittakaavaan kuin muut, ne latistaisivat muiden keskinäisen vaihtelun olemattomiin. Tällöin voidaan merkitä ylimittaiset pylväät katkaisumerkillä ja kirjoittaa niiden viereen pylväiden tarkat arvot. Samoin useimmat hyväksyvät asteikon katkaisun viivakuviossa. Kuten aiemmin mainittiin, viivakuvio korostaa ennen kaikkea muutosta ja trendiä, eikä niinkään yksittäisten datapisteiden absoluuttisia arvoja. Jos olennaista kuviossa on suhteellinen vaihtelu eli vaihtelun osuus kokonaisuudesta, asteikkoa ei saa katkaista. Jos sen sijaan olennaista on vaihtelu itsessään, viivakuviossa asteikon katkaiseminen voi olla perusteltua.

Pylväskuvioissa koko asteikon katkaisemiseen suhtaudutaan yleisesti ottaen negatiivisesti. Useimmiten tämä näkökanta on perusteltu. Asteikon mielivaltainen katkaisu ylikorostaa pylväiden eroja ja antaa siten väärän käsityksen kokonaisuudesta. Joskus kuitenkin myös pylväskuviossa erot saattavat olla tärkeämpiä kuin muuttujien saamat tarkat arvot. Pystypylväskuvion voi tällaisessa tilanteessa yleensä korvata viivakuviolla, mutta viivakuviolla ei voi kuvata sellaisia ryhmiä, joissa toisella akselilla on luokitteleva muuttuja. Jos hyvin pienetkin erot ovat tarkasteltavan aiheen kannalta merkityksellisiä, katkaistut pylväät voivat antaa asiasta paremman kuvan kuin katkaisemattomat.

Ajatelkaamme seuraavanlaista esimerkkiä: Tietojärjestelmien luotettavuus ilmaistaan palvelutasosopimuksissa usein saatavuusprosentteina, jotka kuvaavat sitä kuinka suuren osan ajasta palvelun luvataan olevan käytettävissä. Mikäli luvattu taso ei toteudu, järjestelmän toimittaja sitoutuu hyvittämään puutteen.

Kuvitellaan, että haluamme tehdä kuvion, jossa vertaillaan eri palveluntarjoajia joiden lupaamat saatavuusprosentit vaihtelevat välillä 99–99,999 %. Jos teemme näistä luvuista vaakapylväskuvion katkaisematta asteikkoa, eroa parhaan ja huonoimman palveluntarjoajan välillä kuviosta tuskin huomaa.

Erohan on alle prosentti, ei siis kovin suuri, joten mitä sitten? Näin on helppo ajatella, jos ei ymmärrä, mitä tuo prosentti oikeastaan kertoo. Ero on itse asiassa valtava. 99 % saatavuusprosentti merkitsee, että yhteensä 88 tunnin ajan vuodessa palvelu ei ole käytettävissä, siis esim. vartin käyttökatkosta vuoden jokaisena päivänä. 99,999 % saatavuusprosentti taas merkitsee lupausta korkeintaan reilun viiden minuutin yhteenlasketuista käyttökatkoista vuodessa. Ero on tuhatkertainen! Pylväiden katkaisematta jättäminen siis vääristää tässä tapauksessa kuvion antamaa vaikutelmaa pahasti.

Edellä kuvattu on toki äärimmäinen poikkeustapaus. Yleisemmin voi sanoa, että kuvion tulee näyttää merkitykselliset erot riittävän suurina, että ne hahmotetaan oikein. Asteikon katkaisemista tulee pääsääntönä välttää, mutta jos katkaistu asteikko kuvaa ilmiötä paremmin kuin katkaisematon, silloin asteikko kannattaa katkaista. Asteikon katkaisemista datapisteiden keskeltä tulee kuitenkin välttää jokseenkin aina.

 *) Esim. Macdonald-Ross, Michael 1977: How numbers are shown: a review of research on the presentation of quantitative data in texts. AV Communication Review 25:4, 259–409.

Apps4Finland-kisan tuloksista

Eilen julkistettiin vihdoin tämänvuotisen Apps4Finland-kilpailun voittajat. Koko kisan epävirallisen pääpalkinnon eli sovellussarjan ykkössijan nappasi odotetusti näkövammaisille suunnattu paikannuspalvelu BlindSquare, suurimman määrän palkintoja (3 kpl) voitti suunnistusharrastajille maastokarttoja automaattisesti tuottava Karttapullautin.

Informaatiomuotoilu.fi-porukalla oli visualisointisarjan finaalissa mukana peräti kolme työtä: designpääkaupunkivuoden ulkomainoskampanjaan toteutetut Ta-daa, dataa! -julisteet, Asuntokuume-blogiin toteuttamani datajournalistinen artikkeli Omistusasuminen kannattaa aina, jos on aikaa odottaa sekä yhteistyössä FloAppsin kanssa Kuntaliitolle toteuttamani KuntaNavigaattori-eksploraatiotyökalu. Visualisointisarjassa ei tällä kertaa palkintosijoille ylletty, mutta toinen Asuntokuumeelle laatimani artikkeli, Katso kartta: Täältä löytyy edullisin koti urbaanille lapsiperheelle voitti Helsingin kaupungin tilastodatan erikoispalkinnon vaikkei päässytkään visualisointisarjassa finalistien joukkoon.

Erikoispalkinto tuli itselleni hienoisena yllätyksenä. Helsinki on suomalaisten kuntien joukossa ollut selkeä edelläkävijä tilastotietojen tuottamisessa ja niiden avaamisessa vapaasti käyttöön, niin Helsinki Region Infoshare -palvelunAluesarjat.fi-palvelun kuin kaupungin tietokeskuksen omien julkaisukanavien kautta. Kokemukseni mukaan tietokeskuksen henkilökunta suhtautuu todella ystävällisesti myös suoraan heiltä tilastotietoja kyseleviin wannabe-datajournalisteihin. Helsingin kaupunkia koskevaa laadukasta tilastotietoa on siis todella runsaasti helposti saatavilla ja niinpä olisin kuvitellut että sitä hyödyntäviä töitäkin olisi kisassa ollut enemmän. Mutta en valita! :)

Sen sijaan pikkuisen haluaisin purnata visualisointisarjan palkinnoista. Asiaan vaikuttaa tietysti hieman sekin ettei palkintoa sattunut omalle kohdalle, mutta väittäisin että kevyttä rakentavaa kritiikkiä voisi perustellusti antaa riippumatta siitä oliko kisassa omia töitä mukana vai ei.

Sarjan voittaja, Ilmanlaadun mukaan vaihtuva kännykän taustaväri on yksinkertaisuudessaan nerokas, ”miksen keksinyt tätä itse” -reaktion aiheuttaja ja ehdottomasti palkintonsa ansainnut. Siitä ei sen enempää. Kaksi muuta palkintoa menivät HS.fi:ssä julkaistuille visualisoinneille: Hesarin työryhmän koostamalle Kuntavaaliehdokkaiden mielipiteiden arvokartalle ja Jaakko Salosen Sidonnaisuuskytkökset Käypä Hoito -suosituksissa -grafiikalle.

HS on ollut datajournalismin edelläkävijä Suomessa ja olisi ollut suorastaan skandaali jos se ei olisi palkintoa sarjassa voittanut. (Nimestään huolimatta visualisointisarja on samalla myös datajournalismisarja. Nimenmuutos esimerkiksi muotoon ”visualisointi- ja datajournalismisarja” voisi muuten olla harkitsemisen arvoinen.) Kuntavaaliehdokkaiden mielipiteiden arvokartta on varsin kelvollinen kokonaisuus, vaikka tosin kuten Osmo Soininvaara huomauttaa grafiikan yhteydessä julkaistussa artikkelissa, vaalikoneen kysymyksiä on kuitenkin aika pieni määrä joten tuloksiin yksittäisten ehdokkaiden kohdalla kannattaa suhtautua varauksella. Puoluetasolla grafiikan antama kokonaiskuva lienee oikea.

Sidonnaisuuskytköksiä kuvaava grafiikka on kinkkisempi tapaus. Siihen pohajutuva, HS:n painetussa lehdessä julkaisema artikkelikokonaisuus samasta aiheesta on arvokasta datajournalismia, mutta pelkkä visualisointi itsessään on mielestäni epäselvä eikä kerro juuri mitään muuta kuin että sidonnaisuuksia on paljon. Kyseessä on klassinen ”karvapallo”, verkostomalli jossa on niin paljon tavaraa että metsää ei enää näe puilta. Mielestäni palkinnon olisi sidonnaisuuskytkös-karvapalloa ennemmin ansainnut vaikkapa Suomen Kuvalehden Tulvakartta.

Tietysti kun hyviä töitä on paljon, käy niin että kaikki eivät voi voittaa. Jos kilpailutöiden määrä vastaisuudessakin kasvaa, tulisi minusta harkita myös kunniamainintojen jakamista varsinaisten palkintojen lisäksi. Mutta hieman herättäisin keskustelua siitä että jos kerran kilpailussa on visualisointisarja, miksei sinänsä erinomaisen ansioituneista osaajista koostuvassa tuomaristossa ole mukana ensimmäistäkään visualisointieksperttiä?

Itseään ei ole kohteliasta ehdottaa (sitä paitsi luulenpa että haluan osallistua kisaan tulevina vuosinakin ihan kilpailijana), mutta onneksi valinnanvaraa riittää ilmankin. Potentiaalisina tuomariehdokkaina alan kovista kotimaisista tekijöistä voisi mainita esimerkiksi seuraavat: Jens Finnäs, Tuomas Siitonen, viime vuoden visualisointisarjan voittaja Lauri Vanhala, Miska Knapek, visualisoinnin lehtori Markku Reunanen, kartografian lehtori Paula Ahonen-Rainio, tilastotieteilijä Kimmo Vehkalahti, Readingin yliopiston Jasso Lamberg tai vaikkapa runsaasti jurykokemusta graafisen suunittelun kilpailuista kerännyt professori emeritus Tapio Vapaasalo.

Can election results be predicted from the voters’ musical preferences?

The answer is probably: no. But that has not stopped me from creating this tongue-in-cheek analysis of the U.S. presidential election for Basso Magazine.

(Click on the picture to enlarge.)

Using a complicated and very unscientific method I calculated how well gigs played by artists touring the U.S. in the three months leading to the election predicted the result of each state. I scraped the concert data from Eventful.com API and cross-referenced that with the state-level election results, taking into account the margin of votes by which each state was won as well as the total number of concerts played in each state.

The index number for each artist was calculated by dividing the margin of win (in absolute votes, positive if for Obama and negative if for Romney) by total number of gigs in each state and awarding this number for all the artists who played a gig in the state. If an artist had more than one gig in a state, the second gig yielded only half of the index points, the third gig one third etc.

To feature on the final graphic the artist had to play gigs in at least ten states or states in which a total of 50 million votes or more were cast. More than one thousand artists qualified even with this limitation, so in the central part of the graphic only a select 70 artists are shown, chosen by their poplularity in Finland where the magazine is published. The final graphic was created in Nodebox and then finalized in Adobe Illustrator.

The artist who best predicted an Obama win was the reggae band Rebelution, whereas a Romney win was best predicted by a gig by the country singer Don Williams. The artist who least predicted win for either was Chris Isaak, probably best known for his 1990s hit ”Wicked Game”. The map below shows the gigs played by these three artists by state in the three months before the election.

(It should be noted that such apparent correlation is not an indication of the political preferences of the artists in question themselves. For example, a gig by Meat Loaf, who is a Romney supporter did not predict a win for Romney, whereas a gig by Weedeater did.)

What did we learn from all this? Probably not much – except I personally did learn quite a bit about data scraping! It was a fun excercise and I hope our readers know a little bit more about U.S. politics than they did before this. And just sayin’, but Nate Silver should maybe keep his eye on Rebelution and Don Williams in 2016! ;)

Kuntavaaleissa oli vain häviäjiä

Kuntavaalien vaalistudiota katsellessa vaikutti siltä, että liki jokaisen puolueen puheenjohtaja oli sitä mieltä, että juuri hänen puolueensa selviytyi näistä vaaleista voittajana: suurin ääniosuus, eniten valtuutettuja, pienin pudotus ääniosuudessa, liikkuvaan junaan hypänneeltä uudelta puheenjohtajalta huima tulos… Käytännön politiikan teon kannalta valtuustopaikat ratkaisevat ja siinä valossa moni näistä selityksistä voi olla järkeenkäypä. Jos kuitenkin katsotaan eri puolueiden kansalaisilta saamaa mandaattia, voi todeta, ettei näissä vaaleissa ollut kuin häviäjiä.

Vaalien äänestysprosentti, 58,2 %, on aivan surkea. Puolueet paukuttelevat nyt henkseleitään kun ovat saaneet ison siivun pienestä kakusta. Mutta kun katsotaan kuinka moni äänestäjä antoi kullekin puolueelle äänensä, lopputulos on että mikään, siis mikään puolue ei onnistunut keräämään lisää äänestäjiä verrattuna sekä edellisiin kuntavaaleihin 2008 että viimeisimpiin vaaleihin, jotka olivat siis vuoden 2011 eduskuntavaalit. (Presidentinvaaleja en pidä vertailukelpoisena koska niissä puoluetaustan rooli on vähäisempi.) Perussuomalaiset paransivat kyllä äänisaalistaan viime kuntavaaleihin verrattuna, mutta eduskuntavaaleihin verrattuna puolueen äänestäjien määrä on lähes puolittunut.

Oheiseen taulukkoon ja sen lukujen pohjalta laadittuun grafiikkaan on listattu nämä madonluvut. (Luvut on painotettu kussakin vaalissa äänioikeutettujen määrän mukaan, eli tarkalleen ottaen ilmoitettu muutos on puolueen saamassa osuudessa kaikkien äänioikeutettujen äänistä, ei absoluuttisissa äänimäärissä.)

muutos 2008– muutos 2011–
Kokoomus –11,4 % –12,1 %
SDP –12,5 % –16,1 %
Perussuomalaiset +58,7 % –47,0 %
Keskusta –11,8 % –3,0 %
Vihreät –9,4 % –3,7 %
Vasemmistoliitto –13,4 % –19,4 %
RKP –4,7 % –9,6 %
Kristillisdemokraatit –15,2 % –24,1 %
Suomen Työväenpuolue –27,5 % –72,8 %
Itsenäisyyspuolue –13,8 % –60,8 %
Köyhien Asialla –47,8 % –58,8 %
Piraattipuolue –61,8 %
Vapauspuolue –99,7 %
Muutos 2011 –83,8 %
Suomen Kommunistinen Puolue –22,1 % +17,1 %
Kommunistinen Työväenpuolue –35,5 % –56,7 %
Muut ryhmät –37,4 % +83,5 %

Ainoat puolueet, joiden saama äänimäärä on laskenut alle kymmenyksellä molemmista vertailuvaaleista ovat vihreät ja rkp ja nekin vain juuri ja juuri. Eipä ole hurraamista.

Kyllä poliitikoilla on tässä iso peiliin katsomisen paikka. Koko demokraattisen järjestelmämme legitimiteetti on koetuksella, jos tällainen kehitys jatkuu.

______________________________

Lisäys 29.10.2012 

Tässä vielä painottamattomat luvut, eli siis muutokset puolueiden saamien äänten kappalemäärissä. Yleiskuva säilyy aika pitkälti samana. Keskusta ja vihreät ovat nollatuloksessa edellisiin eduskuntavaaleihin verrattuna ja kaikki miinusprosentit pienenevät hieman painotettuihin lukuihin verrattuna, mutta aika surkealta tulos näyttää näinkin arvioituna.

muutos 2008– muutos 2011–
Kokoomus –9,1 % –9,1 %
SDP –10,1 % –13,2 %
Perussuomalaiset +61,5 % –45,1 %
Keskusta –9,4 % +0,3 %
Vihreät –7,0 % –0,4 %
Vasemmistoliitto –11,1 % –16,6 %
RKP –2,1 % –6,5 %
Kristillisdemokraatit –12,9 % –21,5 %
Suomen Työväenpuolue –25,6 % –71,8 %
Itsenäisyyspuolue –11,5 % –59,5 %
Köyhien Asialla –46,4 % –57,5 %
Piraattipuolue –60,4 %
Vapauspuolue –99,7 %
Muutos 2011 –83,2 %
Suomen Kommunistinen Puolue –20,1 % +21,1 %
Kommunistinen Työväenpuolue –33,8 % –55,2 %
Muut ryhmät –35,7 % +88,1 %

Apps4Finland-kilpailutöitä

Töiden jättö Apps4FInland-kilpailuun loppui tänään kello 15. Vähän viime metreille meni ja sunnitteilla ollut New York Timesin puoluekokousissa pidettyjen puheiden sisältöanalyysiin pohjautuvan visualisoinnin innoittama, Suomen monipuoluejärjestelmään sovellettu versio joka käyttäisi aineistonaan Puheenvuorot-palveluun kerättyjä kansanedustajien puheenvuoroja ei valmistunut ajallaan. Tästä lienee syyttäminen paitsi viime tinkaan jätettyä aikataulua, allekirjoittaneen ruosteiseksi päässeitä koodaustaitoja. Ehkäpä teen sen joskus vielä loppuun, mutta tähän kisaan se ei nyt ehtinyt.

Ideasarjaan jätin Smithsonian-museon Michael Edsonin OKFestivalilla pitämän mainion keynote-puheenvuoron jäljiltä takaraivoon muhimaan jääneen idean siitä, miten kulttuurilaitokset, museot ja kirjastot voisivat hyödyntää joukkoistamista verkkosisältöjen linkittämisessä. Wikilinkit-nimen viiden minuutin brainstormauksen jälkeen saanut idea sai myös leiskansa ja projektikuvauksensa vain hetkeä ennen deadlineä.

Onneksi meillä oli tarjota kilpailuun myös vähän viimeistellympi satsi vuoden mittaan valmistuneita duuneja. Kisaan päätyivät Designpääkaupunkivuoden hankkeena toteutetut Ta-daa, dataa! -julisteet, viime talven Open Data Kitchenissä syntyneet  Tietosivut Helsingin kaupunginosista sekä sarja Asuntokuume-blogiin kirjoittamiani juttuja grafiikoineen: 12345. Olin lisäksi itse mukana suunnittelemassa KuntaNavigaattoria, joka on myös ehdolla visualisointisarjassa.

Kilpailutöitä voi tykkäillä Facebook-tunnuksilla, mutta varsinaiseen yleisöäänestykseen osallistutaan erilllisellä lomakkeella. Kannattaa tsekata jos haluaa olla mukana vaikuttamassa yleisöpalkinnon jakamiseen. :) Mukana kisaamassa on siis paljon muutakin kiintoisaa kuin vain meidän duunimme. Kilpailun tulokset julkistetaan 4.12. Helsingin kaupungintalolla, tilaisuuteen on vapaa pääsy ja ohjelma näyttää varsin kiintoisalta joten kannattaa ilmoittautua mukaan.

Informaatiomuotoilu tekee tiedon näkyväksi

Artikkeli on julkaistu Maanmittauslaitoksen Positio-lehdessä.

Uusi tieto omaksutaan nopeimmin visuaalisesti. 

Helsingin kaupunkisuunnitteluviraston näyttelyyn toteuttamamme visualisointi havainnollistaa matka-aikoja eri kulkuvälineillä kaupungin keskustassa.

Informaatiomuotoilu merkitsee tiedon esitystavan suunnittelemista mahdollisimman selkeäksi. Työvaiheisiin kuuluvat esitettävän tiedon valitseminen, järjestäminen ja esittäminen valitun kohderyhmän tarpeet ja ominaisuudet sekä käyttökontekstin huomioiden. Yleensä käsitteellä viitataan nimenomaan tiedon visuaalisen esitysasun muotoiluun, tiedon visualisointiin.

On arvioitu, että näköaisti kykenee välittämään informaatiota ympäristöstämme aivoihin peräti sata kertaa nopeammin kuin kuuloaisti. Vaikka tarkoista luvuista voidaan kiistellä, on ilmeistä että näkö on vahvin aistimme ja että uuden tiedon omaksuminen tapahtuu nopeimmin visuaalisesti. Kuvat myös muistetaan tutkimusten mukaan paremmin kuin pelkkä teksti.

Tiedon kuvallisella esittämisellä onkin erittäin pitkät perinteet. Kuvien avulla on välitetty kertomuksia ja tietoa maailmasta jo kauan ennen kirjoitusjärjestelmien keksimistä. Varhaisimmat luolamaalaukset ovat nykykäsityksen mukaan ainakin 25 000 vuotta vanhempia kuin kirjoitustaito.

Kartat tienraivaajina

Ennen kuin voidaan puhua varsinaisesti informaatiomuotoilusta, on tehtävä käsitteellinen harppaus näköhavaintoa jäljittelevistä esittävistä kuvista abstraktimpaan ilmaisuun. Erityisesti paikkatieto ja sen visualisoiminen, kartat, ovat näytelleet abstraktin kuvailmaisun kehityksessä tienraivaajan roolia.

Jonkinlaisia karttoja on tehty liki kaikissa maapallon kulttuuripiireissä, usein jo ennen kirjoitustaidon omaksumista. Esimerkiksi Pohjois-Amerikan inuiiteilla oli jo kauan ennen eurooppalaisten tuloa erittäin tarkasti rantaviivan muotoa kuvaavia kaiverrettuja puupaloja, joita käytettiin karttoina.

Helsingin yliopiston kulttuurimaantieteen dosentin Allan Tiitan mukaan karttojen ja maisemamaalauksen välillä ei alkujaan ollut ratkaisevaa eroa: molemmat pyrkivät löytämään maiseman olennaisimmat piirteet ja luomaan niistä havainnollisen kokonaisesityksen. Vähitellen kartoille alkoi kuitenkin kehittyä oma abstrakti kuvailmaisunsa, joka erkani esittävien kuvien visuaalisesta kielestä.

Abstrakti visualisointi oivallettiin 1700-luvun lopulla

Kesti varsin pitkään ennen abstrakti kuvailmaisu levisi kartografian piiriä laajemmalle. Tähtitieteellisiä ilmiöitä jouduttiin käytännön syistä kuvaamaan jossain määrin abstrakteilla piirroksilla. Muutamia irrallisia varhaisia esimerkkejä tunnetaan muiltakin aloilta, mutta laajemmin abstraktien visualisointien mahdollisuudet alettiin huomata vasta 1700-luvun lopulla.

Eräänä käännekohtana voi pitää skotlantilaisen kansantaloustieteilijän William Playfairin Commercial and Political Atlas -kirjaa (1786), jossa kirjoittaja esitteli nykyisin pylväs- ja viivakuvioina tunnetut tilastografiikan peruskuviotyypit. (Playfair keksi hieman myöhemmin myös piirakkakuvion.) Tilastografiikan pohjalle ovat sittemmin rakentuneet lähes kaikki myöhemmät abstraktin tiedon visualisointikeinot kuten tieteelliset visualisoinnit sekä konseptuaalisia suhteita kuvaava käsitegrafiikka.

Grafiikka tutkimustyökaluna

Kartat toimivat tilastografiikan keksimisen jälkeenkin tienraivaajana visualisointien kehityksessä. Erityisesti temaattisen kartografian piirissä on otettu ensimmäisenä käyttöön sellaisia keinoja, joita sittemmin on hyödynnetty laajasti muissakin informaatiomuotoilun lajityypeissä. Esimerkiksi tästä käyvät vaikkapa elementtien värikoodaus ja kuvamerkkien eli piktogrammien käyttö.

Yksityiskohta Seamanin kartasta, joka julkaistiin The Medical Repository -lehdessä. Se on harmillisesti jäänyt paikkatiedon historiassa John Snow’n kuuluisan Lontoon vuoden 1854 koleraepidemian kartan varjoon. Snow’n kartta on valtavasti velkaa Seamanin tekemälle pohjatyölle.

Myös varhaisimmat tunnetut esimerkit
eksploratiivisesta grafiikan käytöstä ovat karttoja: amerikkalaisen lääkärin Valentine Seamanin 1798 tekemät kaksi karttaa, jotka kuvasivat New Yorkissa riehuneen keltakuume-epidemian aiheuttamia kuolemantapauksia ja alueen jätteenkaatopaikkoja, joita Seaman epäili taudin aiheuttajiksi. Hän toi näin ensi kertaa grafiikan viestinnällisen funktion rinnalle myös uuden tiedon etsimisen eli eksploraation.

Eksploratiivinen grafiikka onkin sittemmin muodostunut keskeiseksi tieteellisen tutkimuksen välineeksi. Sen mahdollisuuksia havainnollistaa hyvin tilastotieteilijä Francis Anscomben 1973 kehittämä ns. Anscomben kvartetti, neljä datasettiä joiden eroja on vaikea löytää matemaattisin menetelmin mutta joista visualisoituina on helposti nähtävissä niiden keskeiset ominaisuudet. Erityisesti poikkeavat havainnot (engl. outlier), jotka usein ovat seurausta mittausvirheestä, on visuaalisessa muodossa helppo huomata.

Anscomben kvartetti koostuu neljästä datasetistä, joiden useat matemaattiset ominaisuudet kuten varianssi ja lineaarinen regressio ovat identtisiä, mutta joiden erot tulevat helposti näkyviin visualisoituna.

Koska nykyisin tällaisia visualisointeja on mahdollista tuottaa täysin automaattisesti, tutkijat muodostavat kokonaiskuvan aineistostaan usein ensiksi nimenomaan visuaalisesti ja ryhtyvät vasta sen jälkeen soveltamaan tilastollisia menetelmiä sen perkaamiseen.

Tietotulvan hallintaa 

Elämme paraikaa tiedon visualisoinnin nousukautta. Kenties ilmeisin syy virinneeseen kiinnostukseen ovat teknisen kehityksen mukanaan tuomat helpommat välineet esitysten laatimiseen. Kun vielä 1980-luvun alussa yksinkertaisen sääkartan tuottaminen sanomalehteen saattoi vaatia kolmen ihmisen täysipäiväisen työpanoksen, nykyisin tarjolla on runsaasti erilaisia automaattisia työkaluja visualisointiin niin netti- kuin painokäyttöönkin.

Teknisen kehityksen myötä myös julkaisukanavat ovat monipuolistuneet. Kun aiemmin niin tieteellisellä puolella kuin lehdistössäkin julkaisualustana oli yleensä mustavalkoinen, huonolaatuinen painotuote, nykyisin verkko mahdollistaa värillisten ja vuorovaikutteisten esitysten julkaisemisen hyvin edullisesti.

Kartograph-kirjasto mahdollistaa selainpohjaisten karttasovellusten toteuttamisen huomattavasti vapaammin kuin Google Mapsin tapaiset karttapalvelut. Esimerkiksi käytettävän karttaprojektion voi valita liki 30 eri vaihtoehdosta.

Hyvänä esimerkkinä tekniikan uusista mahdollisuuksista ovat internetin karttapalvelut Google Maps tai Open Street Map, joihin on helppo liittää uusia visualisointitasoja ja tyylimuotoiluja valmiin infrastruktuurin ja kartta-aineiston päälle. Mikäli haluaa vapaammat kädet esim. karttaprojektion valitsemiseen, voi haluamansa aineistot ladata pienellä vaivalla Open Street Mapista tai Maanmittauslaitokselta omalle palvelimelleen ja ottaa niiden esittämiseen käyttöön vaikkapa avoimen lähdekoodin Kartograph-kirjaston.

Informaatiomuotoilu tuntuu ajankohtaisemmalta kuin koskaan aiemmin ehkä kuitenkin ennen kaikkea siksi, että tarvitsemme työkaluja meitä ympäröivän tietotulvan hallintaan. Ihmiskunta tuottaa tätä nykyä kahdessa vuodessa enemmän dataa kuin yhteensä koko edeltävän historian aikana. Sitä tuottavat niin tekniset laitteet kuin vaikkapa sosiaalisen median käyttäjätkin. Samaan aikaan avoimen datan aate tuo aiemmin piilossa pidettyä aineistoa kaikkien saataville.

Hakukoneet ja muut tekniset ratkaisut auttavat datatulvan hallitsemiseen, mutta ainakin vielä toistaiseksi sen valjastamiseen hyötykäyttöön tarvitaan ihmistä ja hänen vajavaisia aistejaan. Aisteja, joista näkö on kaikkein vahvin.

Juuso Koponen ja Jonatan Hildén

Kirjoittajat ovat informaatiomuotoiluun erikoistuneita graafisia suunnittelijoita, jotka ylläpitävät Informaatiomuotoilu.fi-blogia ja opettavat mm. Aalto-yliopistossa. Artikkeli sisältää katkelmia heidän tulevasta Informaatiomuotoilu-kirjastaan.

Lähteet:

Zimmermann, Manfred 1989. The nervous system in the context of information theory. Teoksessa Schmidt, Robert F. & Thews, Gerhard (toim.), Human physiology. Berlin ym., Springer-Verlag, 166–173.
Atkinson, Robert K., Levin, Joel R., Kiewra, Kenneth A., Meyers, Tom, Kim, Sung-Il, Atkinson, Laura Ann, Renandya, Willy A. & Hwang, Yooyeun 1999. Matrix and mnemonic text-processing adjuncts: comparing and combining their components. Journal of Educational Psychology 91:2, 342–357
Holmes, Nigel 1991. Pictorial maps. New York, Watson-Guptill Publications.
Tiitta, Allan 1999.  Suomen karttakuvan kehitys. Tieteessä tapahtuu 17:4, 16–23.
Koch, Tom 2012. Knowing its place: mapping as medical investigation. The Lancet 379:9819, 887–888.
Sanomalehtigrafiikan työmenetelmien kehityksestä ks. esim. Järvi, Outi 2006. ”Informatiivinen graafi premillä” – Johdatusta sanomalehtigrafiikan kielioppiin. Vaasan yliopisto, kielitiede. Väitöskirja.
Lohr, Steve 2012. The Age of Big Data. The New York Times 11.2.2012

Informaatiomuotoilu Twitterissä

Vaikka jo kukausi sitten muuta lupailtiin, ei kiire ole helpottanut emmekä ole ehtineet blogia juurikaan päivittelemään. Tästä syvimmät pahoittelut. Vähemmän hektisiä aikoja odotellessa päätimme ensihätään pistää pystyyn Twitter-tilin, jos vaikka sitä tulisi päivitettyä vähän matalammalla kynnyksellä eli useammin.

Tunnarina on @infomuotoilu ja päivityskielenä ainakin alkuun pitkälti englanti. Että ei muuta kuin seuraamaan!

Suomen Kuvalehti, vaihtuvat asteikot ja graafisen journalismin työprosessi

Tieto Näkyväksi -seminaari on vihdoin paketissa, joten nyt meilläkin on taas aikaa tarttua muihin päivänpolttaviin aiheisiin. (Myös kattava raportti seminaarista on tulossa, mutta sen koostamiseen menee pieni tovi.) Ja mikäpä sen luontevampi aihe kuin toisten tekemisten kritisoiminen! :)

* * *

Ainakin Katleena Kortesuo ja Timo Suvanto ovat blogeissaan kirjoittaneet Suomen Kuvalehden julkaisemasta grafiikasta, jonka perusteella eri puolueiden kannattajilla näkyy olevan hurjat näkemyserot eri kysymysten tärkeydestä kuntavaaleissa:

Jokaisen kuvion taustalla on samanlainen hilaviivoitus, joka antaa ymmärtää, että ne hyödyntäisivät samaa asteikkoa. Lähempi tarkastelu paljastaa kuitenkin, että eri kysymysten visualisoinnissa on käytetty eri mittakaavaa!

Pyöräytin kuvion nopeasti Photoshopissa ja siirsin grafiikan sellaiseen muotoon, että siinä käytetään johdonmukaisesti samaa asteikkoa. Pahoittelen hieman rosoista jälkeä:

Suurin ongelma SK:n alkuperäisessä grafiikassa ei mielestäni ole erojen liioittelu, vaan että todellinen tarina jää kertomatta. Kun kyse ei ole määrä- vaan välimatka-asteikosta, ei asteikon katkaisu sinänsä ole välttämättä suurikaan synti. Todellinen ongelma on pikemminkin, ettei kuvio kerro oikeastaan yhtään mitään koska eri asteikkojen käytön vuoksi vertailtavuus puuttuu. Esimerkiksi terveyspalvelut näyttäisivät olevan melko lailla kaikkien mielestä tärkeä kysymys vaaleissa, kun taas hallituksen linja eurokriisissä ja kuntaliitokset ovat kysymyksiä, joiden tärkeydestä on isoja näkemyseroja eri puolueiden kannattajien välillä. Tämä ei kuitenkaan ilmene alkuperäisestä grafiikasta kuin numeroarvoja katsomalla, jolloin sen voisi aivan hyvin korvata tekstillä tai taulukolla ilman että selitysvoima vähenisi lainkaan.

Ylipäänsä kuvio olisi huomattavasti kiinnostavampi, jos se näyttäisi muutakin kuin vain ääripäät. Kuvioon mahtuisivat helposti esimerkiksi kaikkien puolueiden kannattajien vastaukset sekä niiden keskiarvo. SK:n kunniaksi todettakoon, että lehti on julkaissut alkuperäisen kyselyn tulokset avoimena datana, joten kiinnostuneet voivat halutessaan tehdä parempaa grafiikkaa aiheesta. Timo Suvannon blogista löytyykin joitain kuvioita jotka avaavat mm. vastausten keskihajontaa.

* * *

Itse artikkelissa kyselyn tuloksia on käsitelty ihan fiksusti. Voi vain arvailla, miksi grafiikan kohdalla tällainen lapsus on kuitenkin päässyt tapahtumaan. Oma veikkaukseni on, että SK:n toimituksessa noudatetaan perinteistä ja valitettavan yleistä työnjakoa jossa toimitus ja graafikot elävät omissa bunkkereissaan. Graafikot eivät tässä mallissa ole osa toimitusta vaan ”resurssi” joka vain toteuttaa toimeksiantoja ottamatta kantaa sisältöön.

Asiaa 1990-luvun alussa tutkinut tanskalainen Ole Munk havaitsi, että tämä oli selvästi yleisin toimintatapa uutisgrafiikan tuotannossa sanomalehdissä. Kauimpana ”resurssimallista” oli The New York Times, joka ei-niin-yllättäen onkin mm. vuodesta toiseen siivonnut palkintopöydät alan kilpailuissa. Munk päätyykin tutkimuksensa johtopäätösosiossa suosittelemaan, että graafikot pitäisi organisaatiossa sijoittaa toimituksiin, tai ainakin fyysisesti sellaiseen paikkaan että he ovat konkreettisesti läsnä sisällöntuotannosta vastaavassa työyhteisössä. Lyhyesti sanoen graafisiin journalisteihin tulisi suhtautua kuten muihinkin journalisteihin, ei tilausten toteuttajina vaan tasaveroisena osana toimituskuntaa.

Korostan, että en tiedä miten työt Suomen Kuvalehdessä todellisuudessa on organisoitu. Lehden kustantaja on kuitenkin ilmaissut oman, varsin raadollisen näkemyksensä, joka tukee edellä mainittua oletusta: ”graafinen suunnittelu [on] lehdenteossa valmistusprosessin esivaihetta, ja –– voidaan ulkoistaa tai siirtää sisäiseen matriisiin.” Jos graafikot toimivat toimituksesta irrallaan ja toimeksiannot ovat tasoa ”tee tästä jotain kivan näköistä”, niin sitä yleensä saa mitä tilaakin: sivuntäytettä, joka ei palvele tiedonvälitystä juuri mitenkään.

Niin kauan kuin uutisgrafiikkaan suhtaudutaan vain taittopalana eikä journalistisena sisältönä jota koskevat samat laatuvaatimukset, sama huolellisuus faktojen tarkistamisessa ja samat eettiset periaatteet kuin muutakin lehden, televisio-ohjelman tai nettisivun sisältöä, tällaisia floppeja tullaan vastakin näkemään.