journalismi – Informaatiomuotoilu.fi

2022-02-202022-02-22

MTK:n ruokakassivertailu on tyylipuhdasta datavaikuttamista

Kirjoitus on yhteenveto alunperin Twitterissä julkaistusta viestiketjusta.

Opetan XAMKin data-analytiikan koulutusohjelmassa kurssia ”Ajankohtaiset kysymykset ja datavaikuttaminen”, joka käsittelee mm. sitä, miten valtiot, yritykset ja järjestöt käyttävät dataa mielipiteenmuokkauksen ja lobbauksen välineenä. MTK:n viime viikolla julkistama ruokakassivertailu on tyylipuhdas esimerkki tällaisesta datavaikuttamisesta ja toimi kurssillamme erinomaisena case-esimerkkinä. Samalla se osoittaa kuitenkin myös kiinnostavasti, että vaikuttaminen ei aina mene putkeen.

MTK julkisti keskiviikkona 9.2. selvityksen, jossa vertailtiin neljän S-ryhmän ostosdataan perustuvan ruokakassin sekä viidennen, suomalaisiin ravitsemussuosituksiin perustuvan kassin päästöjä niiden sisältämiin ravintoarvoihin suhteutettuna. Viestinnälliseksi kärjeksi oli nostettu, että ravitsemussuositusten mukainen sekasyöjän ruokakassi aiheutti ravintosisältöönsä verrattuna täpärästi pienemmät päästöt kuin kasvispainotteinen, alle 34-vuotiaiden kaupunkilaisten ostosten perusteella muodostettu kassi.

Tähän media tarttui hanakasti. STT:n juttu selvityksestä oli otsikoitu ”Selvitys: Sekasyöjän ruuasta vähiten päästöjä – jos päästöt suhteutetaan ravintoaineiden saantiin”. Jotkut lehdet, esimerkiksi Karjalainen, lyhensivät sen muotoon ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Sanomalehti Karjalaisen painetussa versiossa 10.2.2022 julkaistu artikkeli, joka on otsikoitu ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Selvityksen alkuperäinen, varsin maltillinen löydös paisui matkalla siis melkoisiin mittoihin. MTV3:n uutiset sai sen pyöräytettyä peräti muotoon ”Sekasyönti onkin ilmastoteko”.

Otsikoinnilla on suuri merkitys, sillä moni meistä ei vaivaudu lukemaan otsikkoa pitemmälle varsinkaan silloin, kun se tukee omia ennakokäsityksiä. Pelkän otsikon perusteella innostuivat twiittaamaan niin tavalliset pulliaiset kuin kansanedustajatkin.

Ruutukaappaus kansanedustaja Mikko Kärnän twiitistä. Teksti: "Kappas. Veganismi näyttää olevan ilmastolle haitallisempaa kuin sekasyönti. Ehkä tämä nyt vähentää vegaanista moraalisäteilyä ja lisää sekaruokavalion arvostusta.”

Jos selvityksen materiaalit lukee huolella, selviää kuitenkin, että yksikään vertailussa mukana olleista ruokakasseista ei ollut vegaaninen vaan myös 34-vuotiaiden kaupunkilaisten ostoksiin perustuvassa kassissa oli mukana kalaa ja kananmunia. Tämä huomattiin somessa nopeasti. Media joutuikin pian korjailemaan uutisointia. Varsinaisia oikaisuja ei ole omiin silmiini sattunut, mutta ainakin MTV3 ”tarkensi” uutistaan varsin näkyvästi. STT laati uuden, alkuperäistä selvästi laajemman jatkojutun, jonka monet lehdet julkaisivat. Tämä saattoi olla viestinnällisesti oma maali MTK:lle, sillä alkuperäisen uutisen väitteet kiistävä jatkojuttu tavoitti luultavasti alkuperäistä enemmän lukijoita. Myös somessa huomio oli voittopuolisesti negatiivista.

Korjatustakin uutisoinnista voi kuitenkin jäädä käsitys, että lihaton ja maidoton ruokakassi ei olisi ilmastovaikutuksiltaan lihaa ja maitotuotteita sisältävää, ravitsemussuositusten mukaan koottua kassia parempi. Tämä ei pidä paikkaansa. MTK:n käyttämä tapa laskea ruuan ravintoainetiheyttä on tarkoitushakuinen ja liioittelee eläinperäisten tuotteiden ravintoarvoja. Kuvaan seuraavassa, miten se toimii ja kuinka se tuottaa sopivilla valinnoilla absurdeja tuloksia.

Laskelman on MTK:lle tuottanut Envitecpolis-konsulttiyhtiön asiantuntija Senja Arffman. Se perustuu ilmeisesti alkujaan Arlan tilaamaan työhön, josta muokattiin MTK:n tarpeisiin sopiva alkujaan vuonna 2020, jolloin vertailtiin broileri- ja sushiaterian päästöjä. Jo tuolloin laskelma oli laadittu ilmeisen tarkoitushakuisesti ja se saikin osakseen laajaa kritiikkiä, jota on hyvin koottu yhteen Ruokamysteerit-blogissa. Kriittisiä kommentteja esittivät tuolloin mm. ravitsemusasiantuntija Mikael Fogelholm ja ilmastoasiantuntija Oras Tynkkynen.

Vuoden 2020 indeksi laskettiin vertaamalla annosten sisältämien vitamiinien ja kivennäisaineiden määrää per 100 g ravitsesuosituksen mukaiseen päivän saantisuositukseen. Energiaravintoaineiden osalta vertailukohtana oli se, mikä osuus ravinnosta saatavasta energiasta (E%) tulisi vähintään saada kustakin ravintoaineesta per 1 000 kcal. Kummassakin tapauksessa pudotettiin pois sellaiset ravintoaineet, joiden saanti oli alle 15 % suosituksesta. Raja on valittu mielivaltaisesti ja vaikuttaa tarkoitushakuiselta, sillä se suosii eläinperäisiä tuotteita kasviraaka-aineiden kustannuksella. Lisäksi laskutapaa kritisoitiin siitä, että energiaravintoaineista mukana oli vain proteiini ja välttämättömät rasvahapot. Suomalaiset saavat ruuasta THL:n FinRavinto 2017 -tutkimuksen mukaan liikaa proteiinia, kun taas hiilihydraatin ja kuidun saanti on riittämätöntä.

Taulukko, joka kuvaa suomalaisten ravintoaineiden saantia FinRavinto 2017 -tutkimuksen mukaan ja sitä, ovatko ne mukana MTK:n ravintotiheysvertailuissa. Proteiinia ruuasta saadaan liikaa, mutta se on vertailussa mukana, kun taas hiilihydraatit ja rasva eivät ole, vaikka hiilihydraatteja suomalaiset saavat ravinnosta liian vähän. Kuitu, jota saadaan liian vähän ei myöskään ollut mukana vuoden 2020 vertailussa, mutta on lisätty mukaan 2022 vertailuun. — *Ravintoaineet, niiden saanti FinRavinto 2017 -tutkimuksen mukaan sekä mukanaolo MTK:n ravintoainetiheysindeksissä.*

Uuteen laskelmaan on kriittisen palautteen myötä otettu kuitu mukaan ja huomioitu rasvahappojen saannin osalta myös rasvan laatu (kovat/pehmeät).

MTK:n viime viikolla julkistama laskelma vertaa siis viittä ostoskassia, joista neljä on muodostettu S-ryhmän ostosdatan ja viides ravitsemussuositusten perusteella. Kassien kooksi on vakiotu 15 kg, mutta niiden sisältämä energiamäärä vaihtelee huomattavasti, mikä tuntuu erikoiselta ratkaisulta.

Eri ruokavalioiden ilmastovaikutuksia on aiemmin tutkittu sekä kansainvälisesti (esim. Scarborough et al. 2014) sekä Suomessa, jossa Luke ja Suomen ympäristökeskus tuottivat valtioneuvoston selvitys- ja tutkimustoiminnan (VNTEAS) hankkeena, vuonna 2019 valmistuneen laajan aiheitta käsittelevän RuokaMinimi-tutkimuksen. Tutkimustietoa aiheesta siis on ja sen sanoma on jokseenkin yksiselitteinen. Kuten Luken vanhempi tutkija Juha-Matti Katajajuuri STT:n haastattelussa toteaa: kasvisruoka on yksiselitteisesti ilmastoystävällisin ravinnonlähde. Mitä uutta MTK:n selvitys kysymykseen siis tuo?

Senja Arffmanin mukaan tarkoituksena ei ole ollut vertailla ruokavalioita vaan ostoskäyttäytymistä, mutta tämä tuntuu selittelyltä, varsinkin kun koko tutkimuksen pihvi on ostoskassien sisällön suhteuttaminen ravitsemussuositusten ideaaliarvoihin. Vähintään tutkijan pitäisi pystyä perustelemaan, miksi hänen mentelmänsä tuottaa tieteellisen konsesuksen kanssa selvässä ristiriidassa olevia tuloksia. Tulokset pitäisi myös julkistaa niin, ettei tutkimuskohteesta jää epäselvyyttä.

Todellisuudessa kyse lienee pikemminkin siitä, että MTK haluaa eläintuottajien tukemiseksi hämmentää disinformaatiolla ruuan ympäristövaikutuksista käytävää keskustelua samaan tapaan kuin tupakkateollisuus aikanaan sotki keskustelua tupakan terveyshaitoista. Siksi pidän tarpeellisena nostaa esiin miten tarkoitushakuisella laskentamenetelmällä MTK:n kauppakassivertailu on toteutettu.

Käytetty laskutapa ei ilmene MTK:n omista materiaaleista, mutta Envitecpoliksen blogissa se kuvaillaan – ainakin jollain tarkkuudella.

Ruutukaappaus Envitecpoliksen esityksestä, jossa selitetään ravintotiheyspisteiden laskutapa. Selitys on hieman monitulkintainen.

Ymmärrän blogista löytyvän kuvailun perusteella menetelmän olevan seuraava:

Verrataan kunkin kassissa olevan ruoka-aineen jokaisen ravintotekijän määrää per 1 000 kcal kyseisen ravintotekijän ravitsemussuositusten mukaiseen minimiravintoaihetiheyteen per 1 000 kcal (Suomalaiset ravitsemussuositukset 2014, Liite 6, s. 51)
Jos ravintotekijän määrä ruoka-aineessa on vähintään ravitsemussuositusten mukaisen kynnysarvon verran, lisätään prosenttiluku (joka on aina vähintään 100 %) ”ravintoainetiheyspisteisiin”

Ongelmana vain on, että tällä tavoin lasketut ruokakassien pistemäärät ovat n. 50× suurempia kuin tutkimuksen julkistustilaisuuden esittelymateriaalien sivulla 7 kuvatut ravintotiheyspistemäärät!

Kokeilin miettiä muita mahdollisia tulkintoja blogissa kuvaillulle laskentamenetelmälle, mutta mikään keksimäni laskentatapa ei tuota julkistusmateriaalia vastaavia pisteitä, vaan kaikilla eri tavoilla lasketut pisteet ovat huomattavasti suurempia kuin esittelymateriaaleissa mainitut ravintotiheyspisteet.

Koska edellä kuvatulla tavalla lasketut pisteet ovat kuitenkin suunnilleen samassa suhteessa toisiinsa kuin selvityksen materiaaleissa ilmoitetut pisteluvut – tarkoittaen, että esimerkiksi alle 34-vuotiaiden kaupunkilaisten ostoskassin pisteet ovat suuruusluokkaa kaksinkertaiset yli 64-vuotiaiden maaseudulla asuvien ostoskassin pisteisiin – oletan, että selvityksessä käytetty laskentatapa on suunnilleen yllä kuvatun kaltainen ja tuo n. 50-kertainen ero johtuu jostakin pisteille laskemisen jälkeen tehdystä normalisoinnista, jota ei ole menetelmän kuvauksessa mainittu. Näin ollen oletan, että yllä kuvattu menetelmä tuottaa ainakin suhteellisesti oikean suuruisia lukemia, vaikka absoluuttiset pistemäärät poikkeavat huomattavasti ilmoitetuista. (Mikäli tämä oletus on väärä, myös osa kirjoituksen loppuosan johtopäätöksistä saattaa olla virheellisiä.)

Käytetyssä laskentatavassa on ainakin kaksi perustavanlaatuista ongelmaa:

Elintarvikkeen määrä ostoskassissa ei vaikuta mitenkään sen saamiin pisteisiin.
Menetelmä suosii elintarvikkeita, joissa on huomattavan suuria määriä yksittäisiä ravintoaineita monipuolisuuden kustannuksella ja ravintoaineen lisääminen parantaa aina tuloksia, vaikka sitä olisi kassissa entuudestaan jo riittävästi.

Koska vertailu perustuu ruoka-aineen ravintoainetiheyteen per 1 000 kcal, ei ole väliä onko sitä kassissa 50 g vai 5 kg – riittää että ruoka-aine on ylipäänsä mukana kassissa. Sen määrä vaikuttaa kuitenkin kassin ilmastopäästöihin, mikä antaa mahdollisuuden pelata luvuilla. Kassithan eivät perustu todellisiin ostoksiin, vaan ”eri ruoka-aineryhmien painottumiseen ostajaprofiileissa” ja ”profiilien suosituimpiin ruokavalintoihin ruoka-aineryhmittäin”. Tämä jättää liikkumavaraa kassin sisällön painottamiselle tarkoitushakuisesti.

(Jo vertailu kasvispainotteisen ja ravitsemussuositusten mukaisen kassin välillä perustuu tarkoitushakuisiin valintoihin, sillä kuten selvityksen taustamateriaaleissa todetaan myös alle 34-vuotiaiden kaupunkilaisten ostoksissa on todellisuudessa mukana paljon liha- ja maitotuotteita.)

Vaikuttaa tarkoitushakuiselta, että vaikka muiden kassien paino on 15 kg, ravitsemussuositusten mukaisen kassin sisältämien elintarvikkeiden kokonaispaino on vain 13,5 kg. Näin kassin ilmastopäästöt on saatu pienemmiksi ilman, että tämä vaikuttaisi ravitsemusarvoihin.

Vertailussa pisteitä saa korkeasta ravintoainetiheydestä, ei monipuolisuudesta. Elintarvike, jonka yhden ravintoaineen tiheys ylittää vertailuarvon moninkertaisesti tuottaa enemmän pisteitä kuin ruoka-aine, jossa monen tiheys jää täpärästi rajan alle. Esimerkiksi juustonaksujen ja perunalastujen ravintoainetiheys vastaa tällä laskutavalla ruisleipää ja vitaminoitu energiajuoma pieksee kalan ja lihan sekä monet vihannekset ja hedelmät. Kahvi ja aromisuola ovat varsinaisia superfoodeja.

Niinpä suunnilleen samaan ravintoainetiheyteen vertailussa mukana olleen lapsiperheen ostoskassin kanssa päästään esim. seuraavalla ”poikamiehen ostoskassilla”:

herkkusienipizza
soijanakki
tonnikalasäilyke
tumma makaroni
ranskanleipä
suklaa–mansikkamuro
suolapähkinä
perunalastu
juustonaksu
vähärasvainen kermaviili + dippijauhe
ketsuppi
hampurilaiskastike
soijakastike
sweet & sour -kastike
sipulirouhe
valkosipulimurska
aromisuola
energiapatukka
energiajuoma
kaakaojuoma
kahvi
I-olut

On selvää, että yllä kuvattu ruokakassi ei ole ravitsemuksellisesti laadukas. Se sisältää kuitenkin vain vähän eläintuotteita, joten mikäli kassille laskettaisiin myös ilmastopäästöt, se saattaisi saada suunnilleen yhtä hyvän ”CO2-ravintotiheysindeksin” kuin ravitsemussuositusten mukainen kassi.

Koska tutkimuksessa käytettyjä menetelmiä ei ole kuvattu läpinäkyvästi olen saattanut laskea edellä väärin. On kuitenkin selvää, että käytetty menetelmä on altis tietoiselle manipuloinnille ja vaikuttaa siltä, että sitä on myös harjoitettu halutun tuloksen saamiseksi.

MTK on lobbausjärjestö, joka puolustaa jäsentensä etuja tarvittaessa keinoja kaihtamatta (lain puitteissa tietenkin). Siksi heitä on mielestäni turha syyllistää tästä tutkimuksesta. Oma syyttävä sormeni osoittaa ennemminkin mediaan, joka uutisoi siitä kritiikittä. Kun etujärjestö julkaisee selvityksen, joka vaikuttaa haastavan koko vakiintuneen tieteellisen konsensuksen, olisi syytä muistaa Journalistin ohjeiden 12. kohta: ”Tietolähteisiin on suhtauduttava kriittisesti. Erityisen tärkeää se on kiistanalaisissa asioissa, koska tietolähteellä voi olla hyötymis- tai vahingoittamistarkoitus.” Toimittajien pitäisi yllättävän tutkimustuloksen kohdatessaan haastaa tiedontuottajaa enemmän. Miten tulokset on saatu? Miksi ne ovat ristiriidassa aiemman tiedon kanssa?

Mielestäni toimittajien pitäisi olla rohkeampia kyseenalaistamaan myös numerotietoja jos he mielivät toimia ”vallan vahtikoirana”. Olen kirjoittanut tästä aiheesta jutun myös Journalisti-lehteen, otsikolla ”Toimittajat pelkäävät numeroita, kirjoittaa datajournalisti Juuso Koponen”.

2019-04-122019-04-13

Näiden vaalien tuloksen ennustaminen on tavallistakin vaikeampaa

Sunnuntaina järjestettävien eduskuntavaalien tulosta on totuttuun tapaan spekuloitu ennakkoon ahkerasti. Ennustaminen on aina vaikeaa, erityisesti tulevaisuuden, mutta tällä kertaa vaalituloksen ennustaminen on tavallistakin hankalampaa.

Puolueiden kannatusta mittaavien mielipidekyselyiden tulokset antavat toki jonkinlaista osviittaa mahdollisesta vaalituloksesta. Yhdistämällä viimeisimpien Ylen, Helsingin Sanomien ja Alma Median gallupien tulokset saadaan seuraavanlainen tulos:

	Kannatus	Virhemarginaali
SDP	19,4 %	±1,3 %
kokoomus	16,8 %	±1,2 %
PS	14,9 %	±1,2 %
keskusta	14,5 %	±1,2 %
vihreät	12,5 %	±1,1 %
vasemmistoliitto	9,1 %	±0,9 %
RKP	4,4 %	±0,7 %
KD	4,2 %	±0,7 %
siniset	1,3 %	±0,4 %
muut	2,9 %	±0,6 %

(Mielipidemittausten tulosten yhdistämistä ja puoluekohtaisen virhemarginaalin laskemista käsitellään lähemmin tässä artikkelissa.)

Vaikka tulokseen liittyy epävarmuustekijöitä, uskon, että lopullinen valtakunnallinen tulos on luultavasti melko lähellä tätä.

Eduskunnan paikkajakoa ei kuitenkaan ratkaise puolueiden valtakunnallinen äänisaalis, vaan se, kuinka paljon ääniä niille kussakin vaalipiirissä kertyy. Tämän ennustaminen on aina vaikeaa, mutta erityisen hankalaa näissä vaaleissa, sillä mukana on suuri määrä uusia tai sitten viime vaalien kannatustaan kasvattaneita pienpuolueita, joiden vaikutusta on hyvin vaikea arvioida. Erityisen hankalaksi asian tekee se, että moni nykyinen kansanedustaja, mukana muutamia viime vaalien ääniharaviakin, on näissä vaaleissa valtakunnallisesti alle parin prosentin kannatuksen kellottavan puolueen ehdokkaana.

Yle ja Vihreä Lanka ovat molemmat laatineet omat ennusteensa paikkajaosta, mutta kumpikaan niistä ei ole metodologisesti tyydyttävä. Yle ei avaa lainkaan esimerkiksi sitä, millä perusteella kannatus on jyvitetty vaalipiireittäin ja miten puoluekentän muutokset on ennusteessa huomioitu – vai onko mitenkään. Vihreä Lanka on kiitettävän avoin käyttämästään mallista, mutta kuvauksen perusteella mallissa on ilmeisiä katvealueita.

Päätin yrittää itse kokeilla mallinnusta, joka huomioisi puolueiden valtakunnallisten kannatuslukujen lisäksi Turun Sanomien, Satakunnan Kansan, Kymen Sanomien, Karjalaisen, Savon Sanomien, Kalevan ja Lapin Kansan teettämät vaalipiirikohtaiset mielipidemittaukset ja vaaliliitot, ja ottaisi jollain tapaa huomioon myös kansanedustajien puolueenvaihdokset vaalikauden aikana.

Tehtävä osoittautui hankalaksi. Suurin ongelma on datan puute. Vaalipiirikohtaisia mielipidemittauksia ei ole tehty kaikissa vaalipiireissä, ja useimmissa paikallisissa gallupeissa otoskoko on joko naurettavan pieni tai sitä ei ole edes ilmoitettu.

Valtakunnallisen kannatuksen jyvittämisessä vaalipiireihin hyödynsin tietoa kansanedustajien vuoden 2015 vaaleissa saamista henkilökohtaisista äänimääristä, niin että esimerkiksi Harry Harkimon Uudellamaalla saama äänimäärä vähennettiin Uudenmaan kokoomuksen potista ja lisättiin Liike Nytille. Samoin toimittiin sinisen eduskuntaryhmän kansanedustajien kohdalla, joiden saamat äänet vähennettiin perussuomalaisten potista. Paavo Väyrynen on sen sijaan hankalampi tapaus, sillä hän on vaihtanut paitsi puoluetta, myös vaalipiiriä. Tein lopulta Lapin Kansan mielipidemittauksen perusteella – se ei ennusta järin suurta kannatusta eduskunnan ulkopuolisille puolueille Lapin vaalipiirissä – sellaisen melko mielivaltaisen päätöksen, että jyvitin vain kolmasosan Väyrysen saamista äänistä Seitsemän Tähden Liikkeelle.

Hyvin äkkiä huomasin, että kun dataa on vähän, erilaisia painokertoimia ja oletuksia tarvitaan paljon, eikä niille löydy kovin hyviä perusteluita, vaan ne jäävät tyypillisesti aika mielivaltaisiksi. Miten esimerkiksi pitäisi painottaa vaalipiirikohtaista mielipidemittauksen tulosta suhteessa valtakunnalliseen? (Pelkkiin vaalipiirikohtaisiin kyselyihin en halunnut luottaa silloinkaan kun sellainen oli saatavilla, sillä niiden otoskoot olivat yleensä varsin pieniä, ja monet on julkaistu ennen perussuomalaisten viimeaikaista gallupnousua.) Päädyin käyttämään paikallisen gallupin vastaajaluvun parina lukua, joka on muodostettu jakamalla valtakunnallisten gallupien yhteenlaskettu vastaajamäärä (3 554) kahdella sadalla ja kertomalla tämä sitten vaalipiirin kansanedustajapaikkojen määrällä. Esimerkiksi Oulun vaalipiirissä painotin siis Kalevan gallupia, jossa kantansa ilmaisi 368 vastaajaa suhdeluvulla 368 / 320, jossa 320 on saatu laskukaavalla 3 554 ÷ 200 × 18.

Näillä oletuksilla paikkaennuste on seuraava:

SDP	45	(+10)
kokoomus	35	(–3)
PS	32	(+15)
keskusta	32	(–16)
vihreät	24	(+9)
vasemmistoliitto	16	(+4)
RKP (sis. Ahvenanmaan edustajan)	9	(–1)
KD	6	(+1)
Liike Nyt	1	(–1)
siniset	0	(–17)
muut	0	(–1)

(Suluissa muutos suhteessa tämänhetkisen eduskunnan kokoonpanoon.)

Kuinka varma tämä tulos on? Hyvin epävarma.

Kokeilin simuloida vaalitulosta siten, että kunkin puolueen äänimäärä vaihtelisi vaihtelisi hieman lasketun keskiennusteen ympärillä. Tässä hankalaksi kysymykseksi muodostui se, mikä olisi oikea tapa määritellä satunnaismuuttujan hajonta, kun data ei ole yhteismitallista eikä kaikilta osin kovin laadukasta. Menemättä yksityiskohtiin, kokeilin runsaasti kaikenlaisia vaihtoehtoja saavuttamatta kovin tyydyttävää tulosta, tai kykenemättä esittämään hyviä perusteluita sille, miksi juuri tämä tai tuo painotus tai kerroin olisi sen perustellumpi kuin joku toinen.

Ohessa esimerkki yhden simulaation tuloksista. Tässä ”vaali” siis ajettiin 20 000 kertaa läpi hieman satunnaisesti varioiden kunkin puolueen kussakin vaalipiirissä saamaa äänimäärää:

Kuten kuvasta näkyy, hajonta on useimpien puolueiden osalta kuin haulikolla ammuttu. Kiinnostavasti juuri minkään puolueen kohdalla aiemmin laskettu todennäköisin arvo ei ole hajonnan keskellä, eivätkä useimmat käppyrät muutenkaan vaikuta normaalisti jakautuneilta. Kyse voi toki olla virheestä hätäisesti kyhätyssä koodissani – tämä ei yllättäisi minua lainkaan –, mutta datan lähempi tarkastelu viittaa toiseenkin mahdolliseen selitykseen: todella monessa vaalipiirissä viimeisestä 1–2 paikasta tullaan käytössä olevien lukujen valossa käymään todella kova kisa.

Oman analyysini pohjalta uskallan veikata sunnuntain vaalituloksesta vain, että se tulee sisältämään yllätyksiä. Millaisia, se jää nähtäväksi. Odotus ei onneksi ole enää pitkä.

Artikkelia muokattu 13.4.2019 klo 12:54: Korjattu ennustettujen kansanedustajapaikkojen määrää koskevassa taulukossa virheelliset muutos nykyiseen eduskunnan kokoonpanon -tiedot.

2017-03-312017-03-31

Some thoughts on interactivity and storytelling

Two somewhat intertwining themes in many of the presentations at this year’s Malofiej conference (and last year as well) were what role interactivity and storytelling should play in data visualization. I think these two issues are related, and both of them are extremely important for our profession.

New York Times’ Archie Tse memorably told the conference (in 2016) that “readers just want to scroll” and that “if you make the reader click or do anything other than scroll, something spectacular has to happen.” That is, most of the visitors on a newspaper’s site don’t deeply interact with the graphics on the site, but instead prefer to just scroll and treat the interactive visualizations as static pictures.

Gregor Aisch published today a blog post titled “In defense of interactive graphics” which adds more shades of gray. I found this a particularly salient point: “– – you should not hide important content behind interactions. If some information is crucial, don’t make the user click or hover to see it – –. But not everything is crucial and 15% of readers isn’t nobody.” Another good point he makes is that letting the readers explore the data in detail helps spot mistakes and correct them.

Not all users and all use cases are as important! A sizeable part of my own work consists of doing interactive visualizations for public sector clients. Although the broadly defined target audience might be “anyone interested in the issue” very often there is a much, much smaller core audience, sometimes only a handful of people, whose needs are very different from a random visitor. These might be e.g. MPs who write legislation on the issue my client has a stake in, or experts in the subject matter working in a different arm of government. Such users are often much more invested in the issue to begin with, more knowledgeable on the topic, and more willing to spend time exploring a dataset. These past two days we heard of many examples of projects which may not have been huge hits with readers, but which helped journalists working within the newsroom to find stories. All these are examples of cases where you shouldn’t decide whether the graphic was succesful based only on how the 85% or 99% or users interacted (or didn’t) with it, but also take into account that some users are more valuable to you than others.

This brings us to the issue of storytelling. Jon Schwabish’s presentation discussed the topic at length yesterday, and in response to Jon’s thoughts Chad Skelton made the point in his blog that a literary story is different from a news story. I think this is true and important, but I would still argue a news story is called a “story” for a reason.

A story is defined in the dictionary as “an account of imaginary or real people and events told for entertainment”, “a piece of gossip; a rumour” – or even “a false statement; a lie”. (In a Finnish newsroom, likewise, a news story is called juttu; literally an anecdote, a yarn, even a joke.) The common theme here is that “a story” includes at least a somewhat subjective point of view, and a narrative arc, with which the writer or speaker ties a bunch of disparate facts together as a coherent explanation of a part of the world, whether or not that explanation is true. (Nathaniel Lash also touched on this issue in his presentation today.) A table of numbers is not a story (though a data journalist might see a story in that table), nor should an entry in a dictionary or encyclopedia be.

I found Anna Flagg’s presentation today extremely relevant for very many reasons, but one issue she discussed I want to specifically mention here was the question of perceived bias in journalism and how to combat that perception. She mentioned a survey according to which in the U.S., a whopping 71% of Trump supporters and even 50% of Clinton supporters wanted the media to report just the facts without including any interpretation their own. As professionals, we understand that, if taken literally, such reporting would probably not be possible and certainly not very useful. Nevertheless, these numbers are indicative of mistrust in the capacity and willingness of the media to report the facts fairly.

I would argue that part of the problem here is that we think of what we are doing as storytelling. A story is a structure which helps to connect disparate pieces of information (factual or not) into a coherent whole, to better understand and remember it. But what if those pieces, even if true, do not objectively fit into a coherent whole? How do we guard against the temptation of seeing a story where there isn’t one in reality? The journalistic code of ethics helps in weeding out intentionally misleading and plain sloppy reporting. I’m not sure it helps as much when the problem is journalists seducing themselves with their own stories.

This brings us back to the issue of interactivity. A non-interactive story is just that, a story – a necessarily somewhat subjective narrative arc tying up the facts into a coherent whole. Such a story can be informative and useful, but it is not transparent.

To add transparency to a data-driven story, add interactivity. Instead of showing just the portion of the data the journalist thinks is most relevant for the readers, let them explore the rest as well – if they so prefer. It seems most readers won’t take up the offer; despite saying they want just the facts without interpretation, based on New York Times’ experience most people seem to prefer the journalist’s interpretation of the data to exploring it on their own. But the minority who is interested in and willing to explore the data exists. We should cater to them as well as the majority.

Not only to give them an engaging experience and a better understanding of the world, but also to keep ourselves honest.

2017-02-082017-02-09

Puoluekannatus ja virhemarginaalit

Alma Media ja Yle julkistivat joulukuun lopulla peräkkäisinä päivinä puolueiden kuntavaalikannatusta koskevat mielipidemittauksensa. Tietoykkönen Oy:n Almalle toteuttaman kyselyn haastattelut tehtiin 9.–18.12., Taloustutkimus taas toteutti Ylen kyselyn 7.–28.12. Puolueiden kannatusprosentit kummassakin kyselyssä on lueteltu alla olevassa taulukossa.

	Yle	Alma Media
SDP	21,2 %	20,1 %
keskusta	20,3 %	19,5 %
kokoomus	17,4 %	17,1 %
vihreät	13,3 %	11,2 %
PS	9,4 %	11,6 %
vasemmistoliitto	7,6 %	8,8 %
RKP	4,9 %	4,5 %
KD	3,6 %	3,7 %
muut	2,3 %	3,5 %

Puolueiden kannatuksissa on havaittavissa pieniä eroja kyselyiden välillä. Huolimatta siitä, että mielipidemittausten aikavälit poikkeavat hieman toisistaan, Alman kyselyn aikaväli mahtuu kokonaan Ylen kyselyn ”sisään”. Voisi kuvitella, että liki samaan aikaan tehdyt mielipidemittaukset antaisivat melko tarkalleen samat kannatuslukemat kullekin puolueelle. Näin ei kuitenkaan ole. Mistä se johtuu?

Vastaus kysymykseen löytyy tietenkin mielipidemittausten virhemarginaalista. Mutta mitä virhemarginaali oikeastaan tarkoittaa ja miten sitä pitäisi tulkita?

Virhemarginaali ja luottamusväli

Otetaan lähempään tarkasteluun ne kaksi puoluetta, joiden kannatuslukemissa ero Ylen ja Alma Median kyselyiden välillä on suurin: poliittisen spektrin vastakkaisilta laidoilta löytyvät vihreät ja perussuomalaiset.

Ylen kyselyssä vihreät on neljänneksi suurin puolue selvällä erolla viidenneksi suurimpaan puolueeseen perussuomalaisiin. Alma Median kyselyssä puolueet taas ovat lähes tasoissa, mutta perussuomalaiset johtaa vihreitä täpärästi.

Molempien kyselyiden ilmoitettu virhemarginaali on ±2,4 prosenttiyksikköä. Tarkoittaako tämä, että esimerkiksi vihreiden todellinen kannatus voi Ylen kyselyn mukaan olla yhtä hyvin mikä hyvänsä luku välillä 10,9–15,7 % ja Alma Median mukaan välillä 8,8–13,6 %? Ei tarkoita.

Ensin lienee hyvä hieman avata, mikä on virhemarginaalin määritelmä. Tilastotieteellisin termein ilmaistuna mielipidemittauksen virhemarginaali on sama asia kuin 95 prosentin luottamusvälin (engl. confidence interval) puolikas. Tämä tarkoittaa siis sitä, että mikäli tutkimuksen otos on harhaton (tästä lisää artikkelin loppupuolella) puolueen todellinen kannatus on 95 prosentin todennäköisyydellä jollain kohtaa vaihteluväliä, joka ulottuu virhemarginaalin verran ilmoitetusta prosenttiluvusta kumpaankin suuntaan.

Kyselyn virhemarginaali lasketaan seuraavalla kaavalla:

Kaavassa p merkitsee puoluekannatuksen tai muun mittauksen kohteena olevan asian suhteellista osuutta desimaalilukuna (esim. vihreiden kannatus Ylen kyselyssä = 0,133) ja n kyselyyn vastanneiden määrää eli otoskokoa. 1,96 tulee kaavaan taas siitä, että 95 prosentin vaihteluvälin äärirajat ovat ±1,96 keskihajonnan etäisyydellä keskiarvosta.

Suoraan kaavasta ilmenee kaksi merkittävää virhemarginaalia koskevaa seikkaa:

Populaation eli perusjoukon, siis koko tutkimuksen kohteena olevan ryhmän koko ei vaikuta virhemarginaaliin. Voi tuntua epäintuitiiviselta, että puolueiden kannatuksen selvittämiseksi koko Suomessa (5,5 milj. as.) tai pelkästään vaikkapa Lappeenrannassa (73 000 as.) tarvitaan yhtä suuri otos saman virhemarginaalin saamiseksi. Mikäli otoskoko on hyvin lähellä populaation kokoa, näin ei itse asiassa olekaan, mutta useimmissa käytännön tilanteissa sama otos tuottaa mielipidemittauksessa yhtä suuren virhemarginaalin, oli tutkimuksen kohteena sitten 50 miljoonan tai 50 000:n kokoinen ihmisjoukko.
Erisuuruisilla kannatusluvuilla on eri virhemarginaalit. Tämä merkitsee sitä, että mielipidemittauksen ilmoitettu virhemarginaali pätee sellaisenaan vain yhteen vertailussa mukana olevista puolueista (yleensä suurimpaan niistä). Luvun virhemarginaali on sitä suurempi, mitä lähempänä 50 prosenttia se on. Niinpä pienempien puolueiden kohdalla todellinen marginaali on ilmoitettua pienempi.

Ylen kyselyyn vastasi 1 946 henkilöä, joista 57,6 % eli 1 121 kertoi puoluekantansa. Alma Mediaa varten haastatelluista 1 500 henkilöstä kantansa ilmaisi 70,8 % eli 1 062. Näillä luvuilla saadaan yllä esitettyä kaavaa käyttäen laskettua seuraavat virhemarginaalit kullekin puolueelle:

	Yle (n = 1 121)	Alma Media (n = 1 062)
SDP	±2,4 %	±2,4 %
keskusta	±2,4 %	±2,4 %
kokoomus	±2,2 %	±2,3 %
vihreät	±2,0 %	±1,9 %
PS	±1,7 %	±1,9 %
vasemmistoliitto	±1,6 %	±1,7 %
RKP	±1,3 %	±1,2 %
KD	±1,1 %	±1,1 %
muut	±0,9 %	±1,1 %

Todellinen arvo voi olla myös virhemarginaalin ulkopuolella

On huomionarvoista, että virhemarginaalin laskemiseen käytetty luottamusväli on 95, ei suinkaan 100 prosenttia. Todellinen arvo voi siis löytyä myös virhemarginaalin ulkopuoleltakin. Yksittäisen puolueen kannatuksen tapauksessa tämän todennäköisyys on vain 5 %, mutta koska yhdestä mielipidemittauksesta ilmenee 9 eri numeroa – 8 puolueen kannatusprosentit sekä ryhmä ”muut” – todennäköisyys sille, että ainakin yksi niistä on pielessä virhemarginaalia enemmän on 37 %. Todennäköisyys sille, että ainakin yksi joko Ylen tai Alma Median luvuista on virhemarginaalia kauempana todellisuudesta on jo 60 %, ja on lähestulkoon varmaa (todennäköisyys 99,6 %), että ainakin yksi Ylen vuoden aikana julkaisemista 12 mielipidemittauksista sisältää vähintään yhden kannatuslukeman, jonka todellinen arvo on virhemarginaalin ulkopuolella.

Yllä olevassa kuviossa on kuvattu se vaihteluväli jolle vihreiden ja perussuomalaisten todellinen kannatus Ylen ja Alma Median kannatusmittausten mukaan sijoittuu. Tavallinen, 95 prosentin luottamusväliin perustuva virhemarginaali on kuvattu täytettynä laatikkona, lisäksi katkoviivalla on osoitettu 99,7 prosentin luottamusväli (±3,0 keskihajontaa), jonka sisältä oikea arvo löytyy jo lähes varmasti.

Parikin prosenttiyksikköä on aika iso heitto kun puhutaan kymmenen prosentin tietämissä pyörivistä luvuista. Kuten ylempänä kuvatusta laskukaavasta ilmenee, virhemarginaalia olisi mahdollista pienentää otoskokoa kasvattamalla. Miksi näin ei tehdä mielipidemittausten tulosten tarkentamiseksi? Syy on yksinkertainen: raha. Virhemarginaalin puolittaminen vaatisi otoskoon nelinkertaistamista ja kustannukset kasvaisivat samassa suhteessa. Noin tuhannen vastaajan otos on vuosikymmenten saatossa päätetty tarkkuudeltaan median käyttöön riittäväksi kun otetaan huomioon myös mittausten teettämisen kustannus.

Lisäksi on syytä huomioida, että kaikki arvot virhemarginaalin sisällä eivät ole yhtä todennäköisiä. Virhemarginaalin olessa ±2,0 prosenttiyksikköä todellinen arvo on 68 prosentin todennäköisyydellä korkeintaan yhden prosenttiyksikön päässä keskiarvosta.

Alla oleva kuvio esittää vihreiden ja perussuomalaisten kannatuslukujen todennäköisyysjakauman. Todennäköisyys sille, että todellinen kannatusluku osuu kuvion keskellä olevalle tummennetulle alueelle on kussakin tapauksessa n. 4 % ja pienenee siitä etäännyttäessä. Kuvioelementtien kärjet kuvaavat 99,7 prosentin luottamusväliä.

Tämäkään kuvio ei silti vielä anna kovin hyvää vastausta siihen, mikä puolueiden todellinen kannatus on. Ylen yhden puolueen kannatukselle antama, kuviossa tummennettu todennäköisin arvo on aivan Alma Median todennäköisyysjakauman äärilaidalla ja päinvastoin.

Useamman mielipidemittauksen tulosten yhdistäminen

Usein tarkin tulos saadaan kun kahden tai useamman mielipidemittausten sisältämä tieto yhdistetään ja muodostetaan aineistosta uusi kuvio. Tähän on olemassa erilaisia tapoja. Maailmalla toimii useita mielipidemittausten tulosten yhdistelyyn erikoistuneita verkkosivustoja, joita kutsutaan mielipideaggregaattoreiksi (engl. poll aggregator). Ne ovat kehittäneet monimutkaisia, erilaisia paino- ja korjauskertoimia hyödyntäviä menetelmiään tarkoitukseen. Tunnetuin aggregaattoreista lienee FiveThirtyEight, jonka käyttämä malli pyrkii huomioimaan mm. joidenkin tutkimuksia tuottavien organisaatioiden taipumuksen systemaattisesti liioitella republikaanien tai demokraattien kannatusta. (Suomessa julkaistaan mielipidemittauksia niin harvakseltaan, ettei niiden aggregoinnista ole kehittynyt omaa journalismin lajiaan kuten esimerkiksi USA:ssa.)

Yllä olevassa kuviossa mielipidemittausten tulokset on yhdistetty kyselyiden vastaajamäärällä painotettuna, ilman muita kertoimia ja laskettu lopuksi uudet virhemarginaalit yhdistetyn vastaajamäärän mukaan. Laskelman perusteella vihreät olisi siis perussuomalaisia suositumpi, joskaan ei aivan yhtä pitkällä kaulalla kuin Ylen kyselyn alkuperäisten lukujen valossa. Tässä kaikkien puolueiden yhdistetyt luvut:

SDP	20,7 %
keskusta	19,9 %
kokoomus	17,3 %
vihreät	12,5 %
PS	10,3 %
vasemmistoliitto	8,2 %
RKP	4,7 %
KD	3,6 %
muut	2,9 %

Yhdistämiseen käyttämäni laskukaavat ovat hyvin yksinkertaisia:

jne.

Tällaisia yksinkertaisia kaavoja käyttäen laskelman tekeminen on helppoa, ja vaikka sillä onkin puutteensa verrattuna mielipideaggregaattorien käyttämiin hienostuneempiin malleihin, laskelman tulos kertoo kuitenkin puoluekannatuksesta enemmän kuin yksittäinen mielipidemittaus. Kun tämä ei ole tämän vaikeampaa, ihmettelen kyllä vähän, miksi media ei Suomessa vaikuta yhtään kiinnostuneelta tekemään puoluekannatuslaskelmia jotka perustuisivat useampaan kuin yhteen mielipidemittaukseen!

Virhemarginaali antaa liian ruusuisen kuvan mielipidemittauksen luotettavuudesta

Edellä esitetyissä laskelmissa ja mielipidemittauksen tutkimuksen virhemarginaalista puhuttaessa ylipäänsäkin lähdetään implisiittisesti siitä oletuksesta, että tutkimuksen otos on harhaton (engl. unbiased) tai ainakin, että otoksen mahdollinen vinouma on pystytty jollain tavalla oikaisemaan. Näin harvemmin todellisuudessa on.

Harhattomuus tarkoittaa sitä, että ainut tekijä joka vaikuttaa siihen, kenet populaatiosta poimitaan mielipidemittauksen tutkimusotokseen on sattuma. Jos nostamme erivärisiä palloja sisältävästä valtavasta pussista 1 121 palloa ja niistä 133 on vihreitä, voidaan virhemarginaalin laskentakaavaa käyttäen helposti selvittää, että kaikista pussissa olevista palloista on 95 prosentin todennäköisyydellä vihreitä 11,3–15,3 % (13,3 ± 2,0). Virhemarginaali kuvaa siis otantavirhettä (engl. sampling error), eli sitä, että satunnaisotantaan osuu harvoin aivan täsmälleen populaation sisäistä jakaumaa kuvaava joukko kohteita.

Mielipidemittauksiin vastaavat ihmiset eivät kuitenkaan ole yhtä helppo tutkimuskohde kuin pallot, vaan otantavirheen lisäksi tulosta vääristävät erilaiset otosharhat (engl. sampling bias):

Tutkimukseen ei ole käytännössä mahdollista poimia satunnaista joukkoa kaikista äänestysikäisistä suomalaisista, vaan otanta joudutaan tekemään esimerkiksi arpomalla haastateltavat numeropalveluun rekisteröityjen puhelinnumeroiden joukosta. Tutkimuksen otantakehikko (engl. sampling frame) on tällöin ne suomalaiset, joilla on julkinen puhelinnumero. Se ei ole täsmälleen sama joukko kuin kaikki äänestysikäiset suomalaiset, mistä johtuen kyselyyn sisältyy peittovirhe (coverage error).

Osalla suomalaisista on käytössään useampi kuin yksi puhelinnumero, joten heidän valikoitumisensa puhelinnumeroista arpomalla muodostettuun otokseen on keskimääräistä todennäköisempää. Jotkut taas voivat esimerkiksi vuorotyön vuoksi olla tutkimuksentekoaikana huonosti tavoitettavissa puhelimitse, jolloin heidän valikoitumisensa otokseen on vähemmän todennäköistä. Tällaisten syiden vuoksi puhelimitse tehtävään mielipidemittaukseen sisältyy myös valikoitumisharha (engl. selection bias).

Kaikki tutkimukseen valitut eivät syystä tai toisesta halua vastata kyselyyn. Varsinkin verkkokyselyissä vastauskato on yleensä iso ongelma ja sen aiheuttama vinouma (engl. non-response bias) potentiaalisesti suuri.

Otantavirheen ja erilaisten otosharhojen lisäksi tulosta vääristää vielä vastausharha (engl. response bias), joka on kattotermi erilaisille syille, joiden vuoksi osallistujien antamat vastaukset kyselyyn eivät aina täysin vastaa sitä, miten he todellisuudessa ajattelevat tai toimivat. Kaikki eivät esimerkiksi halua myöntää haastattelijalle kannattavansa rasistiseksi väitettyä puoluetta. Toisaalta haastateltava saattaa vastata eri kysymykseen kuin mikä häneltä on kysytty, esimerkiksi kuntavaalikannatusta koskevassa kyselyssä siihen, mitä puoluetta hän äänestäisi eduskuntavaaleissa.

Otantavirhe aiheuttaa mielipidemittauksen tuloksiin epätarkkuutta, jota voi pienentää otoskokoa kasvattamalla. Vinoutunut otos ja vastausharha sen sijaan vääristävät tuloksia usein tavoilla, joiden korjaaminen ei ole näin yksinkertaista. Jos esimerkiksi jonkin puolueen kannattajissa on enemmän vuorotöissä käyviä kuin muiden, tämän puolueen kannattajista valikoituu otokseen helposti todellista kannatusta pienempi osuus ja tämä vääristää puolueen kannatuslukuja.

Mielipidemittausten tekijät pyrkivät korjaamaan otosharhan aiheuttamaa virhettä esimerkiksi käyttämällä yksinkertaisen satunnaisotannan sijaan ositettua otantaa eli kiintiöpoimintaa (engl. stratified sampling), jolla huolehditaan siitä, että kaikkiin merkittäviin sosioekonomisiin ryhmiin (esim. miehet ja naiset, suomen- ja ruotsinkieliset) kuuluvien määrä otoksessa vastaa heidän osuuttaan väestössä. Tällaisista korjaavista toimista huolimatta mielipidemittausten tuloksiin sisältyy aina ilmoitetun virhemarginaalin lisäksi edellä mainittujen tekijöiden yhteenlasketun vaikutuksen aiheuttama metodologinen virhemarginaali. Termin kehittäjä Nate Silver arvioi yhdysvaltalaisissa mielipidemittauksissa sen olevan tavallisesti samaa suuruusluokkaa kuin tavallisen otantavirhemarginaalinkin. Tämä tarkoittaa, että karkeasti arvioiden yksittäisen mielipidemittauksen todellinen virhemarginaali voi olla kaksinkertainen ilmoitettuun nähden.

Tarinan opetus

Mielipidemittausten tuloksiin sisältyy runsaasti epävarmuutta. Todellinen virhemarginaali voi metodologiset tekijät huomioonottaen isoimpien puolueiden osalta olla kaksinkertainen tutkimuksen tekijän ilmoittamaan verrattuna ja osa todellisista kannatusluvuista voi löytyä jopa tämän laajemman virhemarginaalin ulkopuolelta. Niinpä reilusti virhemarginaalin sisään mahtuvat muutokset puolueiden kannatuksessa tai erot niiden keskinäisessä suosiossa ovat todennäköisemmin sattuman aiheuttamaa kuin merkki mistään todellisesta ilmiöstä, eikä niillä ole juurikaan uutisarvoa. Parempi käsitys puolueiden kannatuksesta saadaan, kun useampien mielipidemittausten tulokset yhdistetään.

Maarten Lambrechtsin mainio Rock ’n Poll -sivusto auttaa hahmottamaan, miten paljon otantavirhe vaikuttaa mielipidemittausten tuloksiin. Jokaisen politiikan toimittajan kannattaisi vilkaista sitä ennen kuin kirjoittaa uutisena, miten jonkin puolueen kannatus on muuttunut 0,4 prosenttiyksikköä edellisestä vertailusta.

2013-10-15

Kiitokset taas seminaarivieraille!

Tieto näkyväksi -seminaarimme järjestettiin 20.9. toisen kerran. Paikka oli jälleen Kauppakorkeakoulun suuri juhlasali. Kuten viime vuonna käyneet muistavat, ensimmäinen seminaari oli satelliittitapahtuma OKFestivalille, jossa osa järjestäjistä oli myös pitämässä ohjelmaa. Tämänvuotinen pidettiin itsenäisenä tapahtumana, joka järjestettiin Aallon ja sponsorien voimin. Osa viimevuotisista kävijöistämme saapui festivaalin lippuvaihtojärjestelyn kautta, ja muistan kesällä miettineeni, saammeko tällä kertaa vastaavasti yleisöä ilman suuremman tapahtuman tuomaa vetoa. Huoli oli turha, sillä tapahtuma myytiin loppuun.
Koska ohjelmaa oli kahdella kielellä, päätimme tänäkin vuonna jakaa tapahtuman aamu- ja iltapäivän osioihin, joista ensimmäinen oli suomeksi ja toinen englanniksi. Tapahtuman videotaltioinnista ja striimauksesta kiitämme Aleksi Mustosta, joka laittoi ohjelman nähtäväksi Bambuser-palveluun.

Kyyriainen_7646

Kun vieraat olivat istuutuneet, seurasi avajaispuheenvuoro. John Nurmisen säätiön hallituksen puheenjohtaja, merenkulkuneuvos Juha Nurminen osoittautui todelliseksi asiantuntijaksi puheessaan karttojen ja visualisointien yhteiskunnallisesta vaikuttavuudesta. Esityksessä oli uutta ja kiinnostavaa tietoa kartografian historiaakin tunteville. Nykyajan esimerkki oli kuva Itämeren levätilanteesta, joka tekee selväksi ympäristöongelman laajuuden. Puhdas Itämeri -hankkeeseen voi tutustua projektin sivuilla.

Hannu Kyyriäinen on infografiikkaan erikoistunut graafinen suunnittelija. Hänen työnsä Suomen Kuvalehdessä on maamme mittapuulla poikkeuksellisen korkeatasoista ja monimuotoista. Hänen visualisointinsa Palestiinan aluemenetyksistä sijoittui pronssisijalle arvostetussa Malofiej-kilpailussa aiemmin tänä vuonna, ja esityksessään hän kävi läpi monia muitakin mielenkiintoisia töitään. Niihin voi perehtyä tarkemmin hänen Flickr-sivuillaan.

Vaajakallio_7711 — Kirsikka Vaajakallio esittelee haastatteluaineistoa

Kirsikka Vaajakallio on palvelumuotoilija, jonka työtapa on yhteissuunnittelu. Siihen kuuluu tuotteen tai palvelun varsinaisen käyttäjän mukaan ottaminen jo suunnitteluprosessin alkuvaiheissa. Saman tavan soisi yleistyvän myös tiedon esittämisessä, sillä kokeneinkin suunnittelija ei vain tule ajatelleeksi kaikkia yleisön tarpeita. Esityksessään Vaajakallio kertoi joistakin käyttämistään työskentelymenetelmistä, joista ehkä kiinnostavimpia olivat suunnittelupelit. Ne ovat tilanteeseen räätälöityjä seurapelejä, joiden avulla suunnitelutyöhön tottumattomat voivat jakaa ideoitaan helpommin.

Markku Mikkola-Roos on Suomen ympäristökeskuksen biodiversiteettiyksikön vanhempi tutkija, joka on erikoistunut lintujen suojeluun. Hänen puheenvuoronsa käsitteli tunnistusoppaita perinpohjaisella tavalla. Olin itse yllättynyt, kuinka vanhoja monet alan konventiot ovat. Historialliseen läpikäyntiin kuului tietenkin myös arvio nykytilanteesta. Siinä kävi ilmi, kuinka valokuvia käyttävillä oppailla on omat rajoituksensa piirrettyihin havainnekuviin verrattuna.

Peltomaki_7867 — Tuomas Peltomäki kertoo verkostojen hienoudesta

Datajournalisti Tuomas Peltomäki esitteli puheenvuorossaan seikkaperäisesti suomalaista lobbausverkostoa esittävää visualisointityötään. Twitterissä esitystä luonnehdittiin stand-upiksi, ja siinä oli myös omasta mielestäni terävää ja mukaansatempaavaa huumoria. Työhön vaadittu datamäärä oli päätähuimaava ja sen käsittely vaati uusien työtapojen kehittämistä ja vanhojen soveltamista. Visualisointiin ja sen materiaaleihin voi tutustua Peltomäen verkkosivuilla.

Ohjelman viimeinen suomenkielinen puhuja oli valokuvaaja ja filosofian tohtori Leena Saraste. Hänen aiheensa koski valokuvan totuusarvoa ja sen mielikuvia muokkaavaa voimaa. Ajatus valokuvasta todisteena ja ilmaisuvälineenä on ristiriitainen ja siksi kiinnostava. Monet ajatukset ja lainaukset olivat provosoivia, kuten väittämä ”ihmiset haluavat tulla petetyiksi”. Näiden tukena oli mielenkiintoisia esimerkkejä ikonisista ja myös vähemmän tunnetuista valokuvista, joiden aihe ja ilmaisutapa olivat tarkkaan harkittuja. Kuvista ei näe, mitä on todella tapahtunut, sillä totuus ei löydy niistä itsestään.

Tauon jälkeen alkoi englanninkielinen osuus, jonka avasi Svenska Dagbladetin graafinen journalisti Thomas Molén. Hänen kuuluisin työnsä lienee Malofiej-kilpailussa pääpalkinnon saanut grafiikka euroviisujen äänestyskäyttäytymisestä. Molén on infografiikkanörtti ja ylpeä siitä. Esityksessä näkyi helposti nörttimäisten piirteiden etu hyvän infografiikan tekemisessä. Kun mielenkiinto syttyy helposti ja tekijällä on luontainen kyky syventyä sekä kiinnostusta teknologiaan, lopputulos on myös lukijalle syvempi ja mielenkiintoisempi.

Ensimmäinen Keynote-puhujamme oli yhdysvaltalaisen Periscopic-suunnittelutoimiston perustaja Kim Rees. Toimisto on tunnettu visuaalisista datatarinoistaan, joita yritykset, järjestöt ja julkinen sektori tilaavat esittämään toimintaansa ja tavoitteitaan.
Periscopicin tunnuslause on do good with data. Töiden aiheet ovat yhteiskuntaan, terveyteen ja ympäristöön liittyviä ja ne herättävät voimakkaita tunteita. Etenkin asekuolemien takia varastetuista vuosista kertova esitys oli vähäeleisyydestään huolimatta (tai ehkä juuri sen takia) koskettava. Kerronnallisesta ja tunteita herättävästä puolestaan huolimatta hyvän visualisoinnin on pohjattava todellisuuteen, ja mieleenpainuvien esitysten vahvuus on niiden rehellisyydessä. Läpinäkyvä data tekee esittäjän haavoittuvaksi, mutta rakentaa luottamusta.

Lounastauko oli tänä vuonna erityisen pitkä, sillä sali piti antaa hetkeksi valmistujaistilaisuuden käyttöön. Toisaalta tämä oli hyväkin asia, sillä tiiviit esitykset herättivät ajatuksia ja niitä oli mukava sulatella muiden kävijöiden kanssa.

Ohjelma jatkui toisella keynote-puheenvuoroistamme, jonka piti espanjalainen Alberto Cairo. Hän on pitkän linjan graafinen journalisti ja valistaja, jonka kirja The Functional Art on luultavasti tämän hetken paras teos informaatiomuotoilun tekemisestä. Cairon esitys oli perusteellinen läpikäynti siitä, mitä todella laadukkaan visualisointityön tekeminen vaatii. Eräs hänen keskeisistä viesteistään on, että kuvallisen esityksen tekijä ei ole tietoa koristeleva käsityöläinen vaan sisältöön paneutuva viestinnän ammattilainen, jolla on journalistinen vastuu. Lukijan ymmärrys voi olla seurausta ainoastaan tekijän ymmärryksestä.
Graafisen journalistin työ on suuressa määrin myös ryhmätyötä muiden viestinnän tekijöiden sekä asiantuntijoiden kanssa. Tapausesimerkeissä tuli esille, kuinka asiantuntijan kuuleminen lisää uusia ulottuvuuksia ja syvyyttä esitykseen. Toivoisin, että meillä Suomessa annettaisiin useammin puitteet tehdä tällä tasolla datalöhtöistä kuvallista journalismia.

Päivän viimeinen puhuja oli alankomaalainen informaatiomuotoilija Frédérik Ruys. Cairon tavoin hän painotti ymmärryksestä syntyvän oivalluksen merkitystä työssään (lainaamallaan termillä infogasm). Ruys esitteli vaikuttavan ja työlään hankkeen Nederland van Boven (Alankomaat ilmasta), joka on televisioon tuotettu dokumenttisarja. Siinä yhdistetään taitavasti kuvattua ilmakuvaa huolellisesti tutkittuun informaatiomuotoiluun tavalla, joka antaa arkielämän ilmiöistä uuden kuvan. Visualisoinneissa esitettiin hälytysajoneuvojen liikettä päivän aikana ja valtamerialusten liikennettä Euroopan vilkkaimpaan satamaan. Kiehtovin esimerkki oli kuitenkin haikaran päivän aikana tekemä lentoreitti, jossa näkyy kuinka lintu käyttää ihmisen toimintaa ja rakennettua ympäristöä hyväkseen.
Hiottu lopputulos vaati runsaasti taustatyötä ja useita ideoita oli hylättävä, koska visualisointi ei sopinut välineen kerronnallisiin vaatimuksiin. Visualisointien tekijänä oli mielenkiintoista seurata, kuinka usean osa-alueen pallottelu nopean työprosessin aikana onnistui näinkin sujuvasti.

Haluamme kiittää kaikkia seminaarivieraitamme kiinnostuksestanne ja hyvistä kysymyksistä. Lisäksi kiitos kuuluu myös muille järjestelyssä auttaneille sekä sponsoreille. Oli jälleen haastavaa ja palkitsevaa suunnitella ohjelma, joka olisi yhtä monipuolinen kuin yleisömme.

Valokuvat: Pekka Niittyvirta

2013-08-282013-09-03

Infografiikan tarkoitus ei ole koristeleminen, Yle

Syyskuussa Tieto näkyväksi -seminaariin puhujaksi tuleva Miamin yliopiston infografiikan professori ja erinomaisen The Functional Art -kirjan kirjoittaja Alberto Cairo on sanonut osuvasti:

”Grafiikan tarkoitus ei ole tehdä luvuista ’kiinnostavia’ vaan muuttaa kuvattava aihe visuaaliseen muotoon, josta ihmisaivot pystyvät löytämään merkityksiä.”

Vaikuttaa, ettei Ylen grafiikkatoimituksessa ole aivan sisäistetty tätä ajatusta. Tuorein esimerkki aiheesta on tämä julkisen velan kehitystä Suomessa ja Ruotsissa 2012–30 käsittelevä A-studion grafiikka:

Jutun aihe on kiinnostava ja grafiikka on teknisesti ihan kelvollisesti toteutettu, mutta se ei auta lainkaan asian ymmärtämisessä. Jos nyt unohdetaan se miltä Suomi ja Ruotsi erilleen Euroopan kartasta poimittuna joidenkin silmissä näyttävät, myös puhtaasti sisällöllisesti ajatellen grafiikka on epäonnistunut.

Ensinnäkin vertailu maiden välillä on tehty tarpeettoman hankalaksi, koska Ruotsin eteläkärki on huomattavasti etelämpänä kuin Suomen eteläisin kohta eli kuvion ”perusviiva” vaihtelee. Nyt Suomen velka vuonna 2012 näyttää ensi vilkaisulla yli kaksinkertaiselta Ruotsiin nähden vaikka oikeasti se on vain puolitoistakertainen. Ja koska maat ovat maantieteeltään erilaisia, sama prosenttiluku on Ruotsissa kauempana maan eteläkärjestä kuin Suomessa.

Kartassa taitaa myös olla suoranainen virhe. Suomen 2012 velkaprosenttia 57,7 % kuvaa alue jonka pohjoisraja on vedetty vain hieman yli maan puolivälin. (Koska Suomi ei ole itä–länsisuunnassa tasavahva pötkö vaan maan eteläinen osa on pohjoista suurempi, viivan eteläpuolelle jää jopa kaksi kolmasosaa Suomen pinta-alasta, mutta se on toinen juttu.)

Visuaalinen metafora on myös pielessä. Julkisen velan ja BKT:n suhde ilmaistaan toki yleensä prosentteina, mutta julkinen velka ei ole osa BKT:tä ja niinpä suhdeluku voi hyvinkin olla yli sata prosenttia, kuten on asian laita esimerkiksi Kreikassa ja Japanissa. Grafiikka on laadittu tavalla joka antaa ymmärtää vallan muuta.

Saman asian olisi huomattavasti selkeämmin kertonut yksinkertainen pylväskuvio, jollaisen pyöräyttää taulukkolaskentaohjelmassa parissa minuutissa:

Screen Shot 2013-08-28 at 21.09.40

Infografiikan tarkoitus ei ole koristeleminen. Jos grafiikasta yritetään tehdä ”hauskaa” ja ”oivaltavaa” niin ankarasti että itse pääasia, viestintä, kärsii, silloin mennään pahasti metsään.

2013-03-22

Hesarin pysäköintigrafiikka ja maailman alkeellisin virhe

Helsingin Sanomat kirjoittaa tärkeästä aiheesta, Helsingin pysäköintipolitiikasta. Artikkelin saatteena on ”interaktiivinen grafiikka” joka yrittää auttaa hahmottamaan tilannetta. Menemättä nyt siihen että minusta grafiikka ei ole kovin interaktiivinen (ainut interaktiomahdollisuus on Seuraava-napin klikkaaminen) ja että se on muutenkin hieman sekava, Hesari sortuu maailman alkeellisimpaan virheeseen eli pinta-alojen esittämiseen väärin.

Yllä on ruutukaappaus esityksen kohdasta, jossa yritetään havainnollistaa parkkipaikkojen viemää osuutta katutilasta (14 %). Pienen P-merkin pinta-ala on kuitenkin 1,4 %, ei suinkaan 14 % isomman ruudun pinta-alasta. Jos kokosuhde olisi oikein, grafiikka näyttäisi pikemminkin tältä:

Sama mittakaavavirhe toistuu esityksessä toisessakin kohtaa. Varsin kiusallista.

2013-03-082013-03-08

A misleading chart about Chávez’s legacy

FAIR has an entertaining piece critizising AP’s treatment of the late Venezuelan president Hugo Chávez. While I have some serious misgivings about the tendency of some left-leaning writers to skate over the awful human rights record of the Chavéz regime just because he was seen as a counterweight to the United States’ economic and foreign policy, it is certainly true that spending oil revenues on social programs instead of skyskrapers or museums is a sensible choice for a country like Venezuela. However, I take issue with the use of graphics in the FAIR article.

Accompanying the story is a graphic comparing the number of people living in poverty (defined here as a daily income of less than $ 2 at purchasing power parity) in Venezuela and Brazil:

Why is the vertical scale truncated at 10 %? And more importantly, why does the x-axis start at 2003? President Chávez took office in 1999 so wouldn’t that be a more relevant starting point? (I know the short answer to these questions that the graphic is a screenshot from World Bank’s website, but I still think it’s sloppy journalism to cut corners like this when it would have taken 5 minutes to download the relevant data and do the graphic in Excel.)

I downloaded the same World Bank data and did the graphic below, starting from 1998, a year before Chávez took office. I also added the data for Colombia and Mexico. I also added the data about U.S. oil price in real (inflation-adjusted) dollars per barrel as an inverted bar chart on the background to give context.

The World Bank data is somehat patchy, but by connecting the data points we have an interesting picture appears. In 1998 Brazil, Mexico and Venezuela had the same share of population living in poverty at roughly 20 %. In Colombia the share was some 7 percentage points higher. In the newest available data Brazil and Venezuela are roughly on par and Colombia is still trailing the two by the same amount as in 1998, whereas Mexico clearly has broken off the pack. Venezuela’s progress seems to be tracking the oil price curve whereas Mexico and Brazil show steadier, if less dramatic progress towards lower poverty rates.

The moral of the story is that it’s often possible to frame the data so that it supports your claim, whether true or not. Stepping back and showing more gives the audience the chance to judge for themselves. In this case it would seem that Venezuela did indeed make significant progress in reducing poverty during Chávez’s reign, but so did other oil exporting Latin American countries. Venezuela no more looks exceptional when showing a more complete set of data.

2012-09-192012-09-19

Suomen Kuvalehti, vaihtuvat asteikot ja graafisen journalismin työprosessi

Tieto Näkyväksi -seminaari on vihdoin paketissa, joten nyt meilläkin on taas aikaa tarttua muihin päivänpolttaviin aiheisiin. (Myös kattava raportti seminaarista on tulossa, mutta sen koostamiseen menee pieni tovi.) Ja mikäpä sen luontevampi aihe kuin toisten tekemisten kritisoiminen! :)

* * *

Ainakin Katleena Kortesuo ja Timo Suvanto ovat blogeissaan kirjoittaneet Suomen Kuvalehden julkaisemasta grafiikasta, jonka perusteella eri puolueiden kannattajilla näkyy olevan hurjat näkemyserot eri kysymysten tärkeydestä kuntavaaleissa:

Jokaisen kuvion taustalla on samanlainen hilaviivoitus, joka antaa ymmärtää, että ne hyödyntäisivät samaa asteikkoa. Lähempi tarkastelu paljastaa kuitenkin, että eri kysymysten visualisoinnissa on käytetty eri mittakaavaa!

Pyöräytin kuvion nopeasti Photoshopissa ja siirsin grafiikan sellaiseen muotoon, että siinä käytetään johdonmukaisesti samaa asteikkoa. Pahoittelen hieman rosoista jälkeä:

Suurin ongelma SK:n alkuperäisessä grafiikassa ei mielestäni ole erojen liioittelu, vaan että todellinen tarina jää kertomatta. Kun kyse ei ole määrä- vaan välimatka-asteikosta, ei asteikon katkaisu sinänsä ole välttämättä suurikaan synti. Todellinen ongelma on pikemminkin, ettei kuvio kerro oikeastaan yhtään mitään koska eri asteikkojen käytön vuoksi vertailtavuus puuttuu. Esimerkiksi terveyspalvelut näyttäisivät olevan melko lailla kaikkien mielestä tärkeä kysymys vaaleissa, kun taas hallituksen linja eurokriisissä ja kuntaliitokset ovat kysymyksiä, joiden tärkeydestä on isoja näkemyseroja eri puolueiden kannattajien välillä. Tämä ei kuitenkaan ilmene alkuperäisestä grafiikasta kuin numeroarvoja katsomalla, jolloin sen voisi aivan hyvin korvata tekstillä tai taulukolla ilman että selitysvoima vähenisi lainkaan.

Ylipäänsä kuvio olisi huomattavasti kiinnostavampi, jos se näyttäisi muutakin kuin vain ääripäät. Kuvioon mahtuisivat helposti esimerkiksi kaikkien puolueiden kannattajien vastaukset sekä niiden keskiarvo. SK:n kunniaksi todettakoon, että lehti on julkaissut alkuperäisen kyselyn tulokset avoimena datana, joten kiinnostuneet voivat halutessaan tehdä parempaa grafiikkaa aiheesta. Timo Suvannon blogista löytyykin joitain kuvioita jotka avaavat mm. vastausten keskihajontaa.

* * *

Itse artikkelissa kyselyn tuloksia on käsitelty ihan fiksusti. Voi vain arvailla, miksi grafiikan kohdalla tällainen lapsus on kuitenkin päässyt tapahtumaan. Oma veikkaukseni on, että SK:n toimituksessa noudatetaan perinteistä ja valitettavan yleistä työnjakoa jossa toimitus ja graafikot elävät omissa bunkkereissaan. Graafikot eivät tässä mallissa ole osa toimitusta vaan ”resurssi” joka vain toteuttaa toimeksiantoja ottamatta kantaa sisältöön.

Asiaa 1990-luvun alussa tutkinut tanskalainen Ole Munk havaitsi, että tämä oli selvästi yleisin toimintatapa uutisgrafiikan tuotannossa sanomalehdissä. Kauimpana ”resurssimallista” oli The New York Times, joka ei-niin-yllättäen onkin mm. vuodesta toiseen siivonnut palkintopöydät alan kilpailuissa. Munk päätyykin tutkimuksensa johtopäätösosiossa suosittelemaan, että graafikot pitäisi organisaatiossa sijoittaa toimituksiin, tai ainakin fyysisesti sellaiseen paikkaan että he ovat konkreettisesti läsnä sisällöntuotannosta vastaavassa työyhteisössä. Lyhyesti sanoen graafisiin journalisteihin tulisi suhtautua kuten muihinkin journalisteihin, ei tilausten toteuttajina vaan tasaveroisena osana toimituskuntaa.

Korostan, että en tiedä miten työt Suomen Kuvalehdessä todellisuudessa on organisoitu. Lehden kustantaja on kuitenkin ilmaissut oman, varsin raadollisen näkemyksensä, joka tukee edellä mainittua oletusta: ”graafinen suunnittelu [on] lehdenteossa valmistusprosessin esivaihetta, ja –– voidaan ulkoistaa tai siirtää sisäiseen matriisiin.” Jos graafikot toimivat toimituksesta irrallaan ja toimeksiannot ovat tasoa ”tee tästä jotain kivan näköistä”, niin sitä yleensä saa mitä tilaakin: sivuntäytettä, joka ei palvele tiedonvälitystä juuri mitenkään.

Niin kauan kuin uutisgrafiikkaan suhtaudutaan vain taittopalana eikä journalistisena sisältönä jota koskevat samat laatuvaatimukset, sama huolellisuus faktojen tarkistamisessa ja samat eettiset periaatteet kuin muutakin lehden, televisio-ohjelman tai nettisivun sisältöä, tällaisia floppeja tullaan vastakin näkemään.

2012-07-102012-07-10

Informaatiomuotoilun monet käyttökohteet

Espanjalaissyntyinen, nykyisin Miamin yliopistossa infografiikan opettajana toimiva Alberto Cairo kirjoittaa tulevan kirjansa markkinoimiseksi perustetussa mainiossa The Functional Art -blogissaan infografiikan tekijöiden työtilanteesta. Talouskriisin kanssa painivassa Espanjassa suuri joukko uutisgraafikoita on saanut potkut tai oma-aloitteisesti ottanut lopputilin ja vaihtanut alaa. Espanjalaisten lehtien ahdinko ei johdu pelkästään taloustaantumasta vaan on osa laajempaa median myllerrystä, jonka laineet ulottuvat suomalaiseenkin lehdistöön, vaikka meillä yleinen talous- ja työllisyystilanne ei ole alkuunkaan niin huono kuin Espanjassa. Mutta siinä missä espanjalainen lehdistö laittaa infografiikan tekijöitä kilometritehtaalle, meillä trendi vaikuttaisi olevan päinvastainen. Huolimatta meikäläisenkin median ahdingosta laskevien tilaajamäärien ja alv-korotusten paineessa lehdet ja sähköinenkin media etsivät uusia infografiikan tekijöitä ja kouluttavat omaa väkeään tiedon visualisoinnin saloihin. (Full disclosure -hengessä pitää tässä kohdin muistuttaa lukijaa siitä, että allekirjoittaneenkin tuloista merkittävä osa tulee informaatiomuotoiluun liittyvästä koulutuksesta.)

Eroa selittänee paitsi taloustilanne, myös historia. Espanjassa uutisgrafiikalla on pitkät perinteet ja kaikilla vakavasti otettavilla lehdillä on ollut jo vuosikausia kunnolliset grafiikkatoimitukset, kun taas Suomessa oikeastaan vain Helsingin Sanomat on panostanut grafiikkaan jo pitempään johdonmukaisesti. Muut suomalaiset mediat ovat vasta aivan viime vuosina alkaneet herätä infografiikan journalistisiin mahdollisuuksiin ja nyt tilanne vaikuttaisi olevan se, että hyvien tekijöiden löytäminen on jopa pieni haaste monille lehdille. Suomessa siis myös journalistisesta infografiikasta kiinnostuneen opiskelijan työllistymismahdollisuudet alalle näyttävät valoisilta kun taas Espanjassa alan työmarkkinat vaikuttavat lehdistön ahdingon huomioonottaen ylisaturoituneilta.

Mielenkiintoisinta Cairon kirjoituksessa ovat kuitenkin informaatiomuotoilun käyttökohteet journalismin ulkopuolella. Hän käsittelee erikseen esimerkkejä sekä yrityselämän että tieteen parista. Varsinkin tieteen piirissä onkin ollut kasvavana trendinä eksploratiivisten visualisointien hyödyntäminen tutkimusmenetelmänä. (Eksploratiivisen ja tietoa välittävän grafiikan erosta on kirjoitettu tässä blogissa pari viikkoa sitten.) Suomen Kuvalehden mainio juttu tutkija Markus Jokelasta avaa hyvin sitä suoranaista datatulvaa jonka keskelle tutkijat ovat teknisen kehityksen ja avoimen datan ideologian yleistymisen ansiosta päässeet. Visualisoiminen on mainio tapa lähteä hakemaan tolkkua valtaviin tietoaineistoihin. Kuten esimerkiksi Anscomben kvartetiksi kutsuttu esimerkki osoittaa, visualisoinnin avulla on mahdollista saada datasta selkoa usein jopa paremmin kuin monilla yleisesti käytetyillä matemaattisen analyysin menetelmillä.

Aasinsillalla pääsenkin tästä vielä mainostamaan tulevaa tapahtumaamme. :) Juuri tämä sama havainto informaatiomuotoilun käyttökelpoisuudesta hyvin moninaisilla elämänaloilla on nimittäin ollut johtoajatuksenamme 17.9. järjestettävän Tieto näkyväksi -seminaarin suunnittelussa. Olemme pyrkineet rakentamaan kokonaisuuden, joka sisällöllisesti puhuttelisi paitsi informaatiomuotoilun ammattilaisia myös esimerkiksi kirjoittavia toimittajia, viestintäihmisiä, poliitikkoja ja aktivisteja, business intelligence -asiantuntijoita, virkamiehiä, tieteentekijöitä, opettajia, arkkitehteja, insinöörejä, juristeja ja monia muita tietotyöläisiä jotka voisivat omassa työssään hyötyä erilaisista tiedon visualisoinnin menetelmistä. Seminaarin ohjelmistoon on tulossa myöhemmin vielä reilusti täydennystä, mutta jo nyt voi varmaankin hahmottaa että olemme yrittäneet pitää alan sisäisen neppailun osuuden minimissään ja rakentaa laajan ja yleistajuisen kattauksen erilaisista tiedon kuvallisisen esittämisen menetelmistä. Myös liput on pyritty pitämään hyvin edullisina, ettei kiinnostuneiden osallistuminen jäisi ainakaan rahasta kiinni. Opiskelijat pääsevät tapahtumaan ilmaiseksi ja toivon lämpimästi, että myös muidenkin alojen kuin designin ja viestinnän/journalismin opiskelijat löytävät tapahtuman.