Helsingin kantakaupungin katutilasta ylivoimaisesti suurin osa on varattu autoilijoiden käyttöön

Rengaskuvio katutilan jakautumisesta Helsingin kantakaupungissa. Jakauma on: Autoilu 54 %, pysäköinti 9 %, pyöräily 4 %, yhdistetty pyöräily ja jalankulku 6 %, jalankulku 22 %, joukkoliikenne 5% (arvio).
Rengaskuvio katutilan jakautumisesta Helsingissä, koko kaupunki. Jakauma on: Autoilu 72 %, pysäköinti yli 3 %, pyöräily 2 %, yhdistetty pyöräily ja jalankulku 8 %,  jalankulku 7 %, joukkoliikenne 2 %.

Koko Helsingin katutilasta (ylempi grafiikka) noin 75 % ja kantakaupungin katutilasta noin 63 % on varattu autoille (alempi grafiikka). Luvut eivät ole täysin tarkkoja, koska joukkoliikenteen käytössä olevan osuuden suuruudesta ei ole käytettävissä tietoja. Autoilun osuus on siis se osa katualueesta (ei ajoradasta), joka ei ole varattu muuhun käyttöön. Katualueeseen kuuluu ajoradan lisäksi esim. kaistojen välinen alue moottoriliikenneteillä.

Rengaskuvio katutilan jakautumisesta Helsingin kantakaupungissa. Jakauma on: Autoilu 54 %, pysäköinti 9 %, pyöräily 4 %, yhdistetty pyöräily ja jalankulku 6 %,  jalankulku 22 %, joukkoliikenne 5% (arvio).

Tämä teksti on hiukan muokattu ja korjattu versio entisessä Twitterissä toukokuussa 2023 julkaistusta langasta. Helsinkiä koskevan analyysin rinnalle tehtiin myös vastaava Tampereen katutilasta.

Ylipäänsä katutilan määrittely rekisteriaineistojen perusteella on yllättävän vaikeaa! Olemme käyttäneet seuraavaa rajausta: mukana ovat kaikki katualueeksi yleisten alueiden rekisterissä määritellyt alueet sekä kevyen liikenteen väylistä ne, jotka eivät kulje puistoissa. Joukkoliikenteen käytössä olevaksi on arvioitu HKL:n, HSL:n tai Liikenneviraston huoltovastuulla olevat katuosat, joka sisältää mm. muusta liikenteestä erotellut raitiovaunukiskot ja raitiovaunupysäkit. Tämän lisäksi on arvioitu bussikaistojen ja -pysäkkien viemä tila.

Bussikaistojen kokonaismääräksi Helsingissä on Jere Laineen kandidaatintyöstä saatu 44 km, mutta ei ole tietoa, miten tämä jakautuu kantakaupungin ja esikaupunkien välillä. Olemme olettaneet, että bussikaistoista 1/3 on kantakaupungissa ja että niiden leveys on keskimäärin 3,5 metriä. Bussipysäkkien kokonaismäärä ja jakautuminen on tiedossa, mutta niiden viemä tarkka pinta-ala ei tiedetä. Tässä on arvioitu, että kukin bussipysäkki vie keskimäärin 50 m² ajoradalta ja 10 m² jalkakäytävältä. Pysäköintipaikkojen viemän tilan osuus on tässä arviossa koko kaupungin osalta liian pieni, sillä käytettävissä olevassa aineistossa ei ole mukana asukaspysäköintivyöhykkeen ulkopuolella sijaitsevia kadunvarsipaikkoja.

Autoilulle varattu osuus katutilasta on sekä kantakaupungissa että koko Helsingissä selvästi suurempi kuin autoilun osuus kaupungissa tehdyistä matkoista, kuten alla olevasta grafiikasta ilmenee.

Varattu osuus katutilasta verrattuna matkojen kulkutapajakaumaan, prosenttipylväskuvio.

Koko Helsinki:
Katutila 72 % autoilu plus 3 % pysäköinti – kulkutapaosuus 21 %. Joukkoliikenne 2 %, kulkutapaosuus 24 %. Jalankulku 12 % plus 8 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 47 %. Pyöräily 2 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %.

Vain kantakaupunki:
Katutila 54 % autoilu plus 9 % pysäköinti – kulkutapaosuus 12 %. Joukkoliikenne 5 %, kulkutapaosuus 25 %. Jalankulku 22 % plus 6 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 53 %. Pyöräily 4 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %.
Aineistona yllä olevassa grafiikassa on Helsinkiläisten liikkumistottumukset 2022 -selvitys, jossa ovat mukana helsinkiläisten Helsingin sisällä tekemät matkat.
Varattu osuus katutilasta verrattuna matkasuoritteeseen, prosenttipylväskuvio.

Koko Helsinki:
Katutila 72 % autoilu plus 3 % pysäköinti – matkasuorite 63 %. Joukkoliikenne 2 %, suorite 21 %. Jalankulku 12 % plus 8 % yhdistettyä pyöräilyn kanssa, suorite 7 %. Pyöräily 2 % ja suorite 3 %. Muu suorite 6 %.

Vain kantakaupunki:
Katutila 54 % autoilu plus 9 % pysäköinti – kulkutapaosuus 12 %. Joukkoliikenne 5 %, kulkutapaosuus 25 %. Jalankulku 22 % plus 6 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 53 %. Pyöräily 4 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %.

Suhteutettuna matkasuoritteeseen eli kullakin kulkuneuvolla tehtyjen matkojen pituuteen jakauma vaikuttaa tasaisemmalta. On kuitenkin huomioitava, että tässä käytetyssä aineistossa (Henkilöliikennetutkimus 2021) matkat on eroteltu vain vastaajan kotipaikan mukaan.

Toisin sanoen mukana ovat kaikki helsinkiläisten tai kantakaupungissa asuvien tekemät matkat, tapahtuivat ne missä päin Suomea hyvänsä. Mukana ovat myös pitkät lomamatkat, mikä näkyy esim. kategorian ”muu” (joka sisältää moottoripyörät ja matkailuautot) suuruutena. Kuten Henkilöliikennetutkimuksesta selviää, suomalaiset tekevätkin varsin paljon pitkiä matkoja autolla. Koko maassa 20–150 km mittaisilla matkoilla henkilöauto on täysin dominova kulkutapa, osuus on 93 % – 94 %. Aineistoa matkasuoritteen jakautumisesta kulkutavoittain Helsingin sisällä ei valitettavasti ole saatavilla.

Post scriptum

Muutama sananen siitä, miksi tämä laskelma antaa varsin erilaisen lopputuloksen kuin aiemmin tekemässämme grafiikassa katutilan jakautumisesta Helsingin kantakaupungissa. Uuden laskelman tekemiseen ryhdyttiin, jotta saataisiin lukuja, jotka ovat vertailukelpoisia muihin Suomen kaupunkeihin. Sitä tehdessä pyrittiin huomioimaan Twitterissä laskelmaa kohtaan esitetty kritiikki ja huomioimaan aiempaa paremmin joukkoliikenteen osuus.

Laskelma tehtiin alusta asti uusiksi ja siinä hyödynnettiin dataa aiempaa hienojakoisemmin. Alueiden pinta-alat laskettiin yhteen jo paikkatieto-ohjelmistossa kuin aikaisemmassa versiossa lopullinen yhteenlasku tapahtui Python-koodin avulla. Alkuperäinen laskelma ei ole säilynyt aivan kokonaisuudessaan, mutta säilyneiden tietojen perusteella siinä vaikuttaa olevan kaksi keskeistä virhettä.

  1. Tekemämme Python-koodi laski kevyen liikenteen väylistä virheellisesti yhteen vain puhtaanapitovyöhyke 1:een (ydinkeskusta ja turistikohteet) kuuluvat alueet. Tämä alue on pienempi kuin koko kantakaupunki, joten kevyen liikenteen väylien pinta-ala jää näin liian pieneksi
  2. Kadunvarsipysäköinnin vaatima tila perustuu ilmeisesti arvioon, joka on selvästi liian suuri. (Tämä laskelma ei valitettavasti ole säilynyt.) Tämä virhe ei vaikuta autoille varatun tilan suuruuteen, vaan ainoastaan siihen miten se jakautuu ajoradan ja pysäköinnin kesken.

Laskelmien tuloksissa on muitakin pieniä eroja, jotka selittyvät lähinnä datan hienojakoisempien tietojen tarkemmalla hyödyntämisellä ja todellisilla muutoksilla katutilassa (esim. uudet pyöräväylät), mutta nämä kaksi virhettä selittävät suurimman osan eroista.

MTK:n ruokakassivertailu on tyylipuhdasta datavaikuttamista

Kirjoitus on yhteenveto alunperin Twitterissä julkaistusta viestiketjusta.

Opetan XAMKin data-analytiikan koulutusohjelmassa kurssia ”Ajankohtaiset kysymykset ja datavaikuttaminen”, joka käsittelee mm. sitä, miten valtiot, yritykset ja järjestöt käyttävät dataa mielipiteenmuokkauksen ja lobbauksen välineenä. MTK:n viime viikolla julkistama ruokakassivertailu on tyylipuhdas esimerkki tällaisesta datavaikuttamisesta ja toimi kurssillamme erinomaisena case-esimerkkinä. Samalla se osoittaa kuitenkin myös kiinnostavasti, että vaikuttaminen ei aina mene putkeen.

MTK julkisti keskiviikkona 9.2. selvityksen, jossa vertailtiin neljän S-ryhmän ostosdataan perustuvan ruokakassin sekä viidennen, suomalaisiin ravitsemussuosituksiin perustuvan kassin päästöjä niiden sisältämiin ravintoarvoihin suhteutettuna. Viestinnälliseksi kärjeksi oli nostettu, että ravitsemussuositusten mukainen sekasyöjän ruokakassi aiheutti ravintosisältöönsä verrattuna täpärästi pienemmät päästöt kuin kasvispainotteinen, alle 34-vuotiaiden kaupunkilaisten ostosten perusteella muodostettu kassi.

Tähän media tarttui hanakasti. STT:n juttu selvityksestä oli otsikoitu ”Selvitys: Sekasyöjän ruuasta vähiten päästöjä – jos päästöt suhteutetaan ravintoaineiden saantiin”. Jotkut lehdet, esimerkiksi Karjalainen, lyhensivät sen muotoon ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Sanomalehti Karjalaisen painetussa versiossa 10.2.2022 julkaistu artikkeli, joka on otsikoitu ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Selvityksen alkuperäinen, varsin maltillinen löydös paisui matkalla siis melkoisiin mittoihin. MTV3:n uutiset sai sen pyöräytettyä peräti muotoon ”Sekasyönti onkin ilmastoteko”.

Otsikoinnilla on suuri merkitys, sillä moni meistä ei vaivaudu lukemaan otsikkoa pitemmälle varsinkaan silloin, kun se tukee omia ennakokäsityksiä. Pelkän otsikon perusteella innostuivat twiittaamaan niin tavalliset pulliaiset kuin kansanedustajatkin.

Ruutukaappaus kansanedustaja Mikko Kärnän twiitistä. Teksti: "Kappas. Veganismi näyttää olevan ilmastolle haitallisempaa kuin sekasyönti. Ehkä tämä nyt vähentää vegaanista moraalisäteilyä ja lisää sekaruokavalion arvostusta.”

Jos selvityksen materiaalit lukee huolella, selviää kuitenkin, että yksikään vertailussa mukana olleista ruokakasseista ei ollut vegaaninen vaan myös 34-vuotiaiden kaupunkilaisten ostoksiin perustuvassa kassissa oli mukana kalaa ja kananmunia. Tämä huomattiin somessa nopeasti. Media joutuikin pian korjailemaan uutisointia. Varsinaisia oikaisuja ei ole omiin silmiini sattunut, mutta ainakin MTV3 ”tarkensi” uutistaan varsin näkyvästi. STT laati uuden, alkuperäistä selvästi laajemman jatkojutun, jonka monet lehdet julkaisivat. Tämä saattoi olla viestinnällisesti oma maali MTK:lle, sillä alkuperäisen uutisen väitteet kiistävä jatkojuttu tavoitti luultavasti alkuperäistä enemmän lukijoita. Myös somessa huomio oli voittopuolisesti negatiivista.

Korjatustakin uutisoinnista voi kuitenkin jäädä käsitys, että lihaton ja maidoton ruokakassi ei olisi ilmastovaikutuksiltaan lihaa ja maitotuotteita sisältävää, ravitsemussuositusten mukaan koottua kassia parempi. Tämä ei pidä paikkaansa. MTK:n käyttämä tapa laskea ruuan ravintoainetiheyttä on tarkoitushakuinen ja liioittelee eläinperäisten tuotteiden ravintoarvoja. Kuvaan seuraavassa, miten se toimii ja kuinka se tuottaa sopivilla valinnoilla absurdeja tuloksia.

Laskelman on MTK:lle tuottanut Envitecpolis-konsulttiyhtiön asiantuntija Senja Arffman. Se perustuu ilmeisesti alkujaan Arlan tilaamaan työhön, josta muokattiin MTK:n tarpeisiin sopiva alkujaan vuonna 2020, jolloin vertailtiin broileri- ja sushiaterian päästöjä. Jo tuolloin laskelma oli laadittu ilmeisen tarkoitushakuisesti ja se saikin osakseen laajaa kritiikkiä, jota on hyvin koottu yhteen Ruokamysteerit-blogissa. Kriittisiä kommentteja esittivät tuolloin mm. ravitsemusasiantuntija Mikael Fogelholm ja ilmastoasiantuntija Oras Tynkkynen.

Vuoden 2020 indeksi laskettiin vertaamalla annosten sisältämien vitamiinien ja kivennäisaineiden määrää per 100 g ravitsesuosituksen mukaiseen päivän saantisuositukseen. Energiaravintoaineiden osalta vertailukohtana oli se, mikä osuus ravinnosta saatavasta energiasta (E%) tulisi vähintään saada kustakin ravintoaineesta per 1 000 kcal. Kummassakin tapauksessa pudotettiin pois sellaiset ravintoaineet, joiden saanti oli alle 15 % suosituksesta. Raja on valittu mielivaltaisesti ja vaikuttaa tarkoitushakuiselta, sillä se suosii eläinperäisiä tuotteita kasviraaka-aineiden kustannuksella. Lisäksi laskutapaa kritisoitiin siitä, että energiaravintoaineista mukana oli vain proteiini ja välttämättömät rasvahapot. Suomalaiset saavat ruuasta THL:n FinRavinto 2017 -tutkimuksen mukaan liikaa proteiinia, kun taas hiilihydraatin ja kuidun saanti on riittämätöntä.

Taulukko, joka kuvaa suomalaisten ravintoaineiden saantia FinRavinto 2017 -tutkimuksen mukaan ja sitä, ovatko ne mukana MTK:n ravintotiheysvertailuissa. Proteiinia ruuasta saadaan liikaa, mutta se on vertailussa mukana, kun taas hiilihydraatit ja rasva eivät ole, vaikka hiilihydraatteja suomalaiset saavat ravinnosta liian vähän. Kuitu, jota saadaan liian vähän ei myöskään ollut mukana vuoden 2020 vertailussa, mutta on lisätty mukaan 2022 vertailuun.
Ravintoaineet, niiden saanti FinRavinto 2017 -tutkimuksen mukaan sekä mukanaolo MTK:n ravintoainetiheysindeksissä.

Uuteen laskelmaan on kriittisen palautteen myötä otettu kuitu mukaan ja huomioitu rasvahappojen saannin osalta myös rasvan laatu (kovat/pehmeät).

MTK:n viime viikolla julkistama laskelma vertaa siis viittä ostoskassia, joista neljä on muodostettu S-ryhmän ostosdatan ja viides ravitsemussuositusten perusteella. Kassien kooksi on vakiotu 15 kg, mutta niiden sisältämä energiamäärä vaihtelee huomattavasti, mikä tuntuu erikoiselta ratkaisulta.

Eri ruokavalioiden ilmastovaikutuksia on aiemmin tutkittu sekä kansainvälisesti (esim. Scarborough et al. 2014) sekä Suomessa, jossa Luke ja Suomen ympäristökeskus tuottivat valtioneuvoston selvitys- ja tutkimustoiminnan (VNTEAS) hankkeena, vuonna 2019 valmistuneen laajan aiheitta käsittelevän RuokaMinimi-tutkimuksen. Tutkimustietoa aiheesta siis on ja sen sanoma on jokseenkin yksiselitteinen. Kuten Luken vanhempi tutkija Juha-Matti Katajajuuri STT:n haastattelussa toteaa: kasvisruoka on yksiselitteisesti ilmastoystävällisin ravinnonlähde. Mitä uutta MTK:n selvitys kysymykseen siis tuo?

Senja Arffmanin mukaan tarkoituksena ei ole ollut vertailla ruokavalioita vaan ostoskäyttäytymistä, mutta tämä tuntuu selittelyltä, varsinkin kun koko tutkimuksen pihvi on ostoskassien sisällön suhteuttaminen ravitsemussuositusten ideaaliarvoihin. Vähintään tutkijan pitäisi pystyä perustelemaan, miksi hänen mentelmänsä tuottaa tieteellisen konsesuksen kanssa selvässä ristiriidassa olevia tuloksia. Tulokset pitäisi myös julkistaa niin, ettei tutkimuskohteesta jää epäselvyyttä.

Todellisuudessa kyse lienee pikemminkin siitä, että MTK haluaa eläintuottajien tukemiseksi hämmentää disinformaatiolla ruuan ympäristövaikutuksista käytävää keskustelua samaan tapaan kuin tupakkateollisuus aikanaan sotki keskustelua tupakan terveyshaitoista. Siksi pidän tarpeellisena nostaa esiin miten tarkoitushakuisella laskentamenetelmällä MTK:n kauppakassivertailu on toteutettu.

Käytetty laskutapa ei ilmene MTK:n omista materiaaleista, mutta Envitecpoliksen blogissa se kuvaillaan – ainakin jollain tarkkuudella.

Ruutukaappaus Envitecpoliksen esityksestä, jossa selitetään ravintotiheyspisteiden laskutapa. Selitys on hieman monitulkintainen.

Ymmärrän blogista löytyvän kuvailun perusteella menetelmän olevan seuraava:

  • Verrataan kunkin kassissa olevan ruoka-aineen jokaisen ravintotekijän määrää per 1 000 kcal kyseisen ravintotekijän ravitsemussuositusten mukaiseen minimiravintoaihetiheyteen per 1 000 kcal (Suomalaiset ravitsemussuositukset 2014, Liite 6, s. 51)
  • Jos ravintotekijän määrä ruoka-aineessa on vähintään ravitsemussuositusten mukaisen kynnysarvon verran, lisätään prosenttiluku (joka on aina vähintään 100 %) ”ravintoainetiheyspisteisiin”

Ongelmana vain on, että tällä tavoin lasketut ruokakassien pistemäärät ovat n. 50× suurempia kuin tutkimuksen julkistustilaisuuden esittelymateriaalien sivulla 7 kuvatut ravintotiheyspistemäärät!

Kokeilin miettiä muita mahdollisia tulkintoja blogissa kuvaillulle laskentamenetelmälle, mutta mikään keksimäni laskentatapa ei tuota julkistusmateriaalia vastaavia pisteitä, vaan kaikilla eri tavoilla lasketut pisteet ovat huomattavasti suurempia kuin esittelymateriaaleissa mainitut ravintotiheyspisteet.

Koska edellä kuvatulla tavalla lasketut pisteet ovat kuitenkin suunnilleen samassa suhteessa toisiinsa kuin selvityksen materiaaleissa ilmoitetut pisteluvut – tarkoittaen, että esimerkiksi alle 34-vuotiaiden kaupunkilaisten ostoskassin pisteet ovat suuruusluokkaa kaksinkertaiset yli 64-vuotiaiden maaseudulla asuvien ostoskassin pisteisiin – oletan, että selvityksessä käytetty laskentatapa on suunnilleen yllä kuvatun kaltainen ja tuo n. 50-kertainen ero johtuu jostakin pisteille laskemisen jälkeen tehdystä normalisoinnista, jota ei ole menetelmän kuvauksessa mainittu. Näin ollen oletan, että yllä kuvattu menetelmä tuottaa ainakin suhteellisesti oikean suuruisia lukemia, vaikka absoluuttiset pistemäärät poikkeavat huomattavasti ilmoitetuista. (Mikäli tämä oletus on väärä, myös osa kirjoituksen loppuosan johtopäätöksistä saattaa olla virheellisiä.)

Käytetyssä laskentatavassa on ainakin kaksi perustavanlaatuista ongelmaa:

  1. Elintarvikkeen määrä ostoskassissa ei vaikuta mitenkään sen saamiin pisteisiin.
  2. Menetelmä suosii elintarvikkeita, joissa on huomattavan suuria määriä yksittäisiä ravintoaineita monipuolisuuden kustannuksella ja ravintoaineen lisääminen parantaa aina tuloksia, vaikka sitä olisi kassissa entuudestaan jo riittävästi.

Koska vertailu perustuu ruoka-aineen ravintoainetiheyteen per 1 000 kcal, ei ole väliä onko sitä kassissa 50 g vai 5 kg – riittää että ruoka-aine on ylipäänsä mukana kassissa. Sen määrä vaikuttaa kuitenkin kassin ilmastopäästöihin, mikä antaa mahdollisuuden pelata luvuilla. Kassithan eivät perustu todellisiin ostoksiin, vaan ”eri ruoka-aineryhmien painottumiseen ostajaprofiileissa” ja ”profiilien suosituimpiin ruokavalintoihin ruoka-aineryhmittäin”. Tämä jättää liikkumavaraa kassin sisällön painottamiselle tarkoitushakuisesti.

(Jo vertailu kasvispainotteisen ja ravitsemussuositusten mukaisen kassin välillä perustuu tarkoitushakuisiin valintoihin, sillä kuten selvityksen taustamateriaaleissa todetaan myös alle 34-vuotiaiden kaupunkilaisten ostoksissa on todellisuudessa mukana paljon liha- ja maitotuotteita.)

Vaikuttaa tarkoitushakuiselta, että vaikka muiden kassien paino on 15 kg, ravitsemussuositusten mukaisen kassin sisältämien elintarvikkeiden kokonaispaino on vain 13,5 kg. Näin kassin ilmastopäästöt on saatu pienemmiksi ilman, että tämä vaikuttaisi ravitsemusarvoihin.

Vertailussa pisteitä saa korkeasta ravintoainetiheydestä, ei monipuolisuudesta. Elintarvike, jonka yhden ravintoaineen tiheys ylittää vertailuarvon moninkertaisesti tuottaa enemmän pisteitä kuin ruoka-aine, jossa monen tiheys jää täpärästi rajan alle. Esimerkiksi juustonaksujen ja perunalastujen ravintoainetiheys vastaa tällä laskutavalla ruisleipää ja vitaminoitu energiajuoma pieksee kalan ja lihan sekä monet vihannekset ja hedelmät. Kahvi ja aromisuola ovat varsinaisia superfoodeja.

Niinpä suunnilleen samaan ravintoainetiheyteen vertailussa mukana olleen lapsiperheen ostoskassin kanssa päästään esim. seuraavalla ”poikamiehen ostoskassilla”:

  • herkkusienipizza
  • soijanakki
  • tonnikalasäilyke
  • tumma makaroni
  • ranskanleipä
  • suklaa–mansikkamuro
  • suolapähkinä
  • perunalastu
  • juustonaksu
  • vähärasvainen kermaviili + dippijauhe
  • ketsuppi
  • hampurilaiskastike
  • soijakastike
  • sweet & sour -kastike
  • sipulirouhe
  • valkosipulimurska
  • aromisuola
  • energiapatukka
  • energiajuoma
  • kaakaojuoma
  • kahvi
  • I-olut

On selvää, että yllä kuvattu ruokakassi ei ole ravitsemuksellisesti laadukas. Se sisältää kuitenkin vain vähän eläintuotteita, joten mikäli kassille laskettaisiin myös ilmastopäästöt, se saattaisi saada suunnilleen yhtä hyvän ”CO2-ravintotiheysindeksin” kuin ravitsemussuositusten mukainen kassi.

Koska tutkimuksessa käytettyjä menetelmiä ei ole kuvattu läpinäkyvästi olen saattanut laskea edellä väärin. On kuitenkin selvää, että käytetty menetelmä on altis tietoiselle manipuloinnille ja vaikuttaa siltä, että sitä on myös harjoitettu halutun tuloksen saamiseksi.

MTK on lobbausjärjestö, joka puolustaa jäsentensä etuja tarvittaessa keinoja kaihtamatta (lain puitteissa tietenkin). Siksi heitä on mielestäni turha syyllistää tästä tutkimuksesta. Oma syyttävä sormeni osoittaa ennemminkin mediaan, joka uutisoi siitä kritiikittä. Kun etujärjestö julkaisee selvityksen, joka vaikuttaa haastavan koko vakiintuneen tieteellisen konsensuksen, olisi syytä muistaa Journalistin ohjeiden 12. kohta: ”Tietolähteisiin on suhtauduttava kriittisesti. Erityisen tärkeää se on kiistanalaisissa asioissa, koska tietolähteellä voi olla hyötymis- tai vahingoittamistarkoitus.” Toimittajien pitäisi yllättävän tutkimustuloksen kohdatessaan haastaa tiedontuottajaa enemmän. Miten tulokset on saatu? Miksi ne ovat ristiriidassa aiemman tiedon kanssa?

Mielestäni toimittajien pitäisi olla rohkeampia kyseenalaistamaan myös numerotietoja jos he mielivät toimia ”vallan vahtikoirana”. Olen kirjoittanut tästä aiheesta jutun myös Journalisti-lehteen, otsikolla ”Toimittajat pelkäävät numeroita, kirjoittaa datajournalisti Juuso Koponen”.

Näiden vaalien tuloksen ennustaminen on tavallistakin vaikeampaa

Sunnuntaina järjestettävien eduskuntavaalien tulosta on totuttuun tapaan spekuloitu ennakkoon ahkerasti. Ennustaminen on aina vaikeaa, erityisesti tulevaisuuden, mutta tällä kertaa vaalituloksen ennustaminen on tavallistakin hankalampaa.

Puolueiden kannatusta mittaavien mielipidekyselyiden tulokset antavat toki jonkinlaista osviittaa mahdollisesta vaalituloksesta. Yhdistämällä viimeisimpien Ylen, Helsingin Sanomien ja Alma Median gallupien tulokset saadaan seuraavanlainen tulos:


KannatusVirhemarginaali
SDP19,4 %±1,3 %
kokoomus16,8 %±1,2 %
PS14,9 %±1,2 %
keskusta14,5 %±1,2 %
vihreät12,5 %±1,1 %
vasemmistoliitto9,1 %±0,9 %
RKP4,4 %±0,7 %
KD4,2 %±0,7 %
siniset1,3 %±0,4 %
muut2,9 %±0,6 %

(Mielipidemittausten tulosten yhdistämistä ja puoluekohtaisen virhemarginaalin laskemista käsitellään lähemmin tässä artikkelissa.)

Vaikka tulokseen liittyy epävarmuustekijöitä, uskon, että lopullinen valtakunnallinen tulos on luultavasti melko lähellä tätä.

Eduskunnan paikkajakoa ei kuitenkaan ratkaise puolueiden valtakunnallinen äänisaalis, vaan se, kuinka paljon ääniä niille kussakin vaalipiirissä kertyy. Tämän ennustaminen on aina vaikeaa, mutta erityisen hankalaa näissä vaaleissa, sillä mukana on suuri määrä uusia tai sitten viime vaalien kannatustaan kasvattaneita pienpuolueita, joiden vaikutusta on hyvin vaikea arvioida. Erityisen hankalaksi asian tekee se, että moni nykyinen kansanedustaja, mukana muutamia viime vaalien ääniharaviakin, on näissä vaaleissa valtakunnallisesti alle parin prosentin kannatuksen kellottavan puolueen ehdokkaana.

Yle ja Vihreä Lanka ovat molemmat laatineet omat ennusteensa paikkajaosta, mutta kumpikaan niistä ei ole metodologisesti tyydyttävä. Yle ei avaa lainkaan esimerkiksi sitä, millä perusteella kannatus on jyvitetty vaalipiireittäin ja miten puoluekentän muutokset on ennusteessa huomioitu – vai onko mitenkään. Vihreä Lanka on kiitettävän avoin käyttämästään mallista, mutta kuvauksen perusteella mallissa on ilmeisiä katvealueita.

Päätin yrittää itse kokeilla mallinnusta, joka huomioisi puolueiden valtakunnallisten kannatuslukujen lisäksi Turun Sanomien, Satakunnan Kansan, Kymen Sanomien, Karjalaisen, Savon Sanomien, Kalevan ja Lapin Kansan teettämät vaalipiirikohtaiset mielipidemittaukset ja vaaliliitot, ja ottaisi jollain tapaa huomioon myös kansanedustajien puolueenvaihdokset vaalikauden aikana.

Tehtävä osoittautui hankalaksi. Suurin ongelma on datan puute. Vaalipiirikohtaisia mielipidemittauksia ei ole tehty kaikissa vaalipiireissä, ja useimmissa paikallisissa gallupeissa otoskoko on joko naurettavan pieni tai sitä ei ole edes ilmoitettu.

Valtakunnallisen kannatuksen jyvittämisessä vaalipiireihin hyödynsin tietoa kansanedustajien vuoden 2015 vaaleissa saamista henkilökohtaisista äänimääristä, niin että esimerkiksi Harry Harkimon Uudellamaalla saama äänimäärä vähennettiin Uudenmaan kokoomuksen potista ja lisättiin Liike Nytille. Samoin toimittiin sinisen eduskuntaryhmän kansanedustajien kohdalla, joiden saamat äänet vähennettiin perussuomalaisten potista. Paavo Väyrynen on sen sijaan hankalampi tapaus, sillä hän on vaihtanut paitsi puoluetta, myös vaalipiiriä. Tein lopulta Lapin Kansan mielipidemittauksen perusteella – se ei ennusta järin suurta kannatusta eduskunnan ulkopuolisille puolueille Lapin vaalipiirissä – sellaisen melko mielivaltaisen päätöksen, että jyvitin vain kolmasosan Väyrysen saamista äänistä Seitsemän Tähden Liikkeelle.

Hyvin äkkiä huomasin, että kun dataa on vähän, erilaisia painokertoimia ja oletuksia tarvitaan paljon, eikä niille löydy kovin hyviä perusteluita, vaan ne jäävät tyypillisesti aika mielivaltaisiksi. Miten esimerkiksi pitäisi painottaa vaalipiirikohtaista mielipidemittauksen tulosta suhteessa valtakunnalliseen? (Pelkkiin vaalipiirikohtaisiin kyselyihin en halunnut luottaa silloinkaan kun sellainen oli saatavilla, sillä niiden otoskoot olivat yleensä varsin pieniä, ja monet on julkaistu ennen perussuomalaisten viimeaikaista gallupnousua.) Päädyin käyttämään paikallisen gallupin vastaajaluvun parina lukua, joka on muodostettu jakamalla valtakunnallisten gallupien yhteenlaskettu vastaajamäärä (3 554) kahdella sadalla ja kertomalla tämä sitten vaalipiirin kansanedustajapaikkojen määrällä. Esimerkiksi Oulun vaalipiirissä painotin siis Kalevan gallupia, jossa kantansa ilmaisi 368 vastaajaa suhdeluvulla 368 / 320, jossa 320 on saatu laskukaavalla 3 554 ÷ 200 × 18.

Näillä oletuksilla paikkaennuste on seuraava:

SDP45(+10)
kokoomus35(–3)
PS32(+15)
keskusta32(–16)
vihreät24(+9)
vasemmistoliitto16(+4)
RKP (sis. Ahvenanmaan edustajan)9(–1)
KD6(+1)
Liike Nyt1(–1)
siniset0(–17)
muut0(–1)

(Suluissa muutos suhteessa tämänhetkisen eduskunnan kokoonpanoon.)

Kuinka varma tämä tulos on? Hyvin epävarma.

Kokeilin simuloida vaalitulosta siten, että kunkin puolueen äänimäärä vaihtelisi vaihtelisi hieman lasketun keskiennusteen ympärillä. Tässä hankalaksi kysymykseksi muodostui se, mikä olisi oikea tapa määritellä satunnaismuuttujan hajonta, kun data ei ole yhteismitallista eikä kaikilta osin kovin laadukasta. Menemättä yksityiskohtiin, kokeilin runsaasti kaikenlaisia vaihtoehtoja saavuttamatta kovin tyydyttävää tulosta, tai kykenemättä esittämään hyviä perusteluita sille, miksi juuri tämä tai tuo painotus tai kerroin olisi sen perustellumpi kuin joku toinen.

Ohessa esimerkki yhden simulaation tuloksista. Tässä ”vaali” siis ajettiin 20 000 kertaa läpi hieman satunnaisesti varioiden kunkin puolueen kussakin vaalipiirissä saamaa äänimäärää:

Kuten kuvasta näkyy, hajonta on useimpien puolueiden osalta kuin haulikolla ammuttu. Kiinnostavasti juuri minkään puolueen kohdalla aiemmin laskettu todennäköisin arvo ei ole hajonnan keskellä, eivätkä useimmat käppyrät muutenkaan vaikuta normaalisti jakautuneilta. Kyse voi toki olla virheestä hätäisesti kyhätyssä koodissani – tämä ei yllättäisi minua lainkaan –, mutta datan lähempi tarkastelu viittaa toiseenkin mahdolliseen selitykseen: todella monessa vaalipiirissä viimeisestä 1–2 paikasta tullaan käytössä olevien lukujen valossa käymään todella kova kisa.

Oman analyysini pohjalta uskallan veikata sunnuntain vaalituloksesta vain, että se tulee sisältämään yllätyksiä. Millaisia, se jää nähtäväksi. Odotus ei onneksi ole enää pitkä.

Artikkelia muokattu 13.4.2019 klo 12:54: Korjattu ennustettujen kansanedustajapaikkojen määrää koskevassa taulukossa virheelliset muutos nykyiseen eduskunnan kokoonpanon -tiedot.

Vihreiden hyvä gallup-kannatus ei välttämättä käänny eduskuntapaikoiksi

Eilisen iso uutinen Suomen politiikassa oli Ylen julkaisema kannatusmittaus, joka nosti vihreät jo maan toiseksi suosituimmaksi puolueeksi huimalla 17,6 prosentin kannatuksella. On monia hyviä syitä olettaa, että puolueen suosio tulee seuraavassa mittauksessa olemaan tätä pienempi, eikä mielipidemittaus kerro välttämättä paljoakaan lopullisesta vaalituloksesta – ei vähiten siksi, että seuraaviin eduskuntavaaleihin on aikaa vielä kaksi vuotta (mikäli sitä ennen ei jouduta ennenaikaisiin vaaleihin) . Tulos on silti niin poikkeuksellinen, että on herkullista leikitellä hetki mitä jos -tyyppisellä pohdiskelulla ja kysyä, miten näiden lukujen mukainen vaalitulos kääntyisi eduskuntapaikoiksi.

Missään maailman maassa puolueiden parlamenttiin saamien paikkojen määrä ei perustu täysin suoraan saatujen äänten määrään – siis niin, että vaikkapa 10 prosenttia äänistä kerännyt puolue saisi aina 10 prosenttia parlamenttipaikoista. Tähän on erilaisia syitä. Joissain maissa suurimpien puolueiden asemaa on tietoisesti pönkitetty äänikynnyksen tai vaalien voittajalle jaettavien ”bonuspaikkojen” muodossa. Myös halu turvata maan eri osien tasapuolinen edustus parlamentissa vaalipiirien avulla aiheuttaa tällaista epäsuhtaa ääni- ja paikkamäärien välille. Mm. angloamerikkalaisissa maissa yleisesti käytetty enemmistövaalitapa voi johtaa todella räikeisiinkin poikkeamiin suhteellisuudessa. Kansainvälisessä vertailussa Suomen vaalijärjestelmä on toteutuneiden vaalitulosten valossa kohtuullisen edustava, mutta esimerkiksi Tanskassa, Israelissa ja Uudessa-Seelannissa ääni- ja paikkamäärien suhteellisuus toteutuu vielä paremmin.

Laskin, miten Ylen mielipidemittauksen mukainen vaalitulos kääntyisi eduskuntapaikoiksi, jos kunkin puolueen saamat äänet jakautuisivat eri vaalipiireihin samassa suhteessa kuin vuoden 2015 eduskuntavaaleissa. Tämä tarkoittaisi esimerkiksi, että vihreiden koko maassa saamista äänistä noin 27 % annettaisiin Helsingissä, kun taas RKP:n äänistä 35 % tulisi Vaasan vaalipiiristä. Lisäksi oletan yksinkertaisuuden vuoksi, että yksikään tällä hetkellä eduskunnan ulkopuolella oleva puolue ei saisi haalittua riittävästi ääniä yhdenkään ehdokkaan läpimenoon.

Lopputulos ei näytä optimaaliselta vihreiden kannalta, vaikka toki näillä luvuilla puolue olisi vaalien suurin voittaja. 17,6 % äänistä toisi vihreille vain 16,5 % paikoista, ja maan toiseksi suosituin puolue jäisi kansanedustajapaikoissa vasta neljännelle sijalle johtuen kannatuksen epäedullisesta jakautumisesta.

Vaalipiirijako näyttää näillä luvuilla suosivan erityisesti keskustaa ja SDP:tä, joista kumpikin haalisi selvästi ääniosuuttaan suuremman määrän kansanedustajapaikkoja. Myös kokoomuksen paikkamäärä on suhteellisesti suurempi kuin ääniosuus. Kaikki pienemmät puolueet saisivat taas hieman ääniosuuttaan pienemmän osuuden paikoista. (RKP:n hieman tutkimuksessa mitattua ääniosuutta suurempi edustajanpaikkojen määrä johtuu siitä, että Ahvenanmaa eli ole mukana mielipidemittauksessa. Maakunnan edustaja istuu kuitenkin perinteisesti aina RKP:n eduskuntaryhmässä, eli puolue saa tavallaan yhden lisäpaikan.)

Suurten ja pienten puolueiden suhteellinen menestys selittyy pitkälti suomalaisissa vaaleissa käytetyllä laskentatavalla, joka normaalisti suosii suuria puolueita – vihreiden suurella kannatuksella kellottama matala edustajanpaikkojen määrä on tässä mielessä hyvin poikkeuksellinen.

Alla vielä vaalipiirikohtaiset tulokset. Vaikka on epätodennäköistä, että lopullinen vaalitulos olisi kovin täsmällisesti lähellä Ylen eilisen mielipidemittauksen tulosta, on taulukosta silti helppo huomata, että viherjytkyn materialisoituminen vaatisi vihreiden tuloksen parantumista varsinkin suurten kaupunkien ulkopuolella.

 

Lisäys 18.8. klo 14:51: Sosiaalisen median puolella esitettiin hyvä kysymys: miltä tulos näyttäisi, jos eri puolueiden saamien äänten alueellinen jakautuminen muistuttaisi pikemminkin kuntavaalien 2017 kuin eduskuntavaalien 2015 tulosta. Alla oleva taulukko näyttää paikkaennusteen kunnallisvaalien tuloksen pohjalta. 

Tulos näyttää vihreiden kannalta paremmalta kuin ylempää löytyvä, eduskuntavaalien tulosta pohjana käyttävä ennuste. Keskusta ja SDP pärjäävät edelleen suhteellisesti paremmin, mutta asetelma on vihreille hieman vähemmän epäedullinen, ja näillä luvuilla vihreät nousisi eduskunnan kolmanneksi suurimmaksi puolueeksi. Voidaan siis todeta, että vihreät on jo kevään kuntavaaleissa onnistunut levittämään kannatustaan maantieteellisesti laajemmalle alueelle viime eduskuntavaaleihin nähden. Jos suunta jatkuu samana, tämä lupaa hyvää vihreiden paikkamäärälle seuraavissa vaaleissa.

Muidenkin puolueiden paikkamäärissä on pieniä muutoksia. Erityisen mielenkiintoinen yksityiskohta on, että kristillisdemokraattien paikkamäärä putoaisi puoleen eduskuntavaaleihin pohjautuvaan skenaarioon verrattuna. 

Mercatorin projektio ei sovi maailmankarttoihin. Gall-Peters on lähes yhtä surkea vaihtoehto

Ilta-Sanomat kirjoitti karttaprojektioista ja The True Size -sivustosta, jonka avulla voi vertailla visuaalisesti maailman valtioiden pinta-aloja. Jutun pihvi on, että kaikille tuttu Mercatorin projektio antaa harhaanjohtavan kuvan maailmasta, koska se näyttää mm. Euroopan ja Pohjois-Amerikan paljon todellista kokoaan suurempina.

Aihe on tärkeä ja kiinnostava, mutta IS:n juttu vahvistaa jälleen kerran lähes kaikkia kartografiaan perehtyneitä suunnattomasti ärsyttävää myyttiä, että vasta Arno Petersin 1960- ja 70-lukujen taitteessa ”keksimä” Gall-Peters-projektio olisi ensi kertaa antanut totuudenmukaisen kuvan siitä, miltä maailma ”oikeasti” näyttää. Tosiasiassa oikeapintaisia, siis maantieteellisten alueiden pinta-alojen suhteet oikein näyttäviä karttoja on tehty jo vuosisatoja – jopa ennen kuin Gerardus Mercator julkisti keksimäänsä karttaprojektiota hyödyntävän maailmankartan vuonna 1569.  Kaiken lisäksi Gall-Peters on nykyisin tunnetuista oikeapintaisista projektioista selvästi huonommasta päästä.

Mercatorilla on käyttökohteensa

Kolmiulotteisen maapallon pintaa ei ole mahdollista esittää kaksiulotteisesti paperilla tai tietokoneen näytöllä ilman, että lopputulos vääristäisi maantieteellistä todellisuutta tavalla tai toisella (ks. tarkemmin esim. Koponen, Hildén & Vapaasalo 2016. Tieto näkyväksi, s. 180–181). Se, millaiset vääristymät ovat ongelmallisia ja mitkä voidaan hyväksyä riippuu suuresti kartan käyttökohteesta. Kuten Vox.comin julkaisema erinomainen selitysvideo hyvin osoittaa, ei ole sattumaa, että Mercatorin projektiosta on tullut niin suosittu. Ennen satelliittipaikannuksen yleistymistä Mercatorin projektioon tehdyt kartat olivat korvaamaton apuväline merenkulkijoille, ja esimerkiksi suomalaiset merikartat tehdään edelleen Mercator-projektioon. Myös pienten alueiden, kuten yksittäisen kaupungin kuvaamiseen Mercator sopii mainiosti.

Ongelmia tulee, kun Mercatorin projektiota käytetään pinta-alaltaan kohtalaisen suurta aluetta kuten Suomea kuvaavissa kartoissa. Projektio vääristää alueiden pinta-aloja sitä enemmän, mitä kauempana päiväntasaajasta ollaan ja vääristymän suuruus kasvaa eksponentiaalisesti. Niinpä Suomea kuvaavassa Mercator-projektiota käyttävässä kartassa Lappi näyttää kohtuuttoman suurelta eteläiseen Suomeen verrattuna. Maailmankartoissa ongelma on luonnollisesti vieläkin pahempi.

Tissot’n indikaattorit helpottavat karttaprojektioiden vertailua

Yksittäisten maiden ja maanosien kuvaamiseen hyvin sopivia projektioita on kehitetty vuosisatojen mittaan runsaasti (ks. esim. Tieto näkyväksi, s. 345–347). Suomalaissa kartoissa käytetään yleensä jotain Mercatorin poikittaissuuntaista muunnosta, uusissa kartoissa tavallisimmin ETRS-TM35FIN-projektiota (s. 347–348). Maailmankartat ovat kuitenkin hankalampi tapaus ja kaikki tarjolla olevat vaihtoehdot ovat jollain tavalla puutteellisia. Mercatorin ongelma on se, että se vääristää alueiden pinta-aloja, kun taas oikeapintaiset projektiot kuten Gall-Peters vääristävät niiden muotoja.

Karttaprojektioiden aiheuttamaa vääristymää voidaan havainnollistaa nk. Tissot’n indikaattoreilla. Ne ovat kartalle piirrettyjä soikioita, jotka kuvaavat karttaprojektion aiheuttamaa vääristymää. Teoreettisessa täydellisessä karttaprojektiossa indikaattorit olisivat kaikki samankokoisia ympyröitä, jotka asettuisivat kartalle tasaisin välein suoriin riveihin. Koska tällaista karttaprojektiota ei ole olemassa, soikioiden muodot, pinta-ala ja/tai sijainti poikkeavat aina tästä ideaalista ja niiden avulla eri projektioiden aiheuttamia vääristymiä voi vertailla.

(Alla olevat kuvat ovat mainiolta Map-projections.net-sivulta, jossa karttaprojektioita voi helposti vertailla toisiinsa.)

Mercatorin projektiossa soikiot säilyvät ympyröinä, mutta niiden pinta-ala vaihtelee suuresti.

Gall-Petersin projektiossa taas soikioiden pinta-alat pysyvät samoina, muta niiden muodot ovat pahasti vääristyneitä. Sama ongelma koskee periaatteessa kaikkia oikeapintaisia projektioita, mutta on olemassa useita vaihtoehtoja, joissa vääristymä on pienempi kuin Gall-Petersissä.

Gall-Petersin suosio perustuu lobbaukseen, ei kartografisiin ansioihin

Gall-Petersin nousu nykyiseen asemaansa liittyy enemmän taitavaan lobbaukseen kuin projektion kartografisiin ansioihin. Saksalainen elokuvaohjaaja Arno Peters julkaisi vuonna 1973 itse kehittämänsä ”uudenlaisen” maailmankartan, jonka hän väitti ensi kertaa kuvaavan maailman sellaisena kuin se on, ilman mitään vääristymiä. Nämä väitteet eivät pidä paikkaansa. Täysin vääristämätöntä projektiota ei ole mahdollista kehittää, eikä varsinkaan Petersin projektio sellainen ole. Oikeapintaisia, alueiden pinta-alat oikein näyttäviä projektioita taas on käytetty satoja vuosia ja keskustelua Mercatorin aiheuttamasta vääristymästä oli kartografian piirissä käyty pitkälti yli sata ellei useita satoja vuosia siinä vaiheessa kun Peters toi oman karttansa  suurieleisesti julkisuuteen. Esimerkiksi nykyisin Bonnen projektiona tunnettu oikeapintainen projektio, joka tuottaa sydämenmuotoisen maailmankartan on keksitty jo vuonna 1511. Peters ei edes keksinyt käyttämäänsä projektiota ensimmäisenä, vaan skotlantilainen James Gall oli keksinyt täsmälleen saman projektion jo vuonna 1855 (siitä nykyisin käytetty Gall-Peters-nimitys).

Kaiken lisäksi Peters-projektio ei ole lähellekään paras oikeapintainen projektio koko maapallon kuvaamiseen. Esimerkiksi vuonna 1906 kehitetty Eckert IV soveltuu tarkoitukseen paremmin ja oli yleisessä käytössä jo vuosikymmeniä ennen kuin Peters alkoi rummutaa ”keksimänsä” projektion erinomaisuutta. Vuonna 1973 julkistettiin myös Toblerin oikeapintainen projektio, joka aiheuttaa Tissot’n indikaattoreihin vieläkin vähemmän vääristymiä kuin Eckert.

Oikeapintainen Eckert IV -projektio

Oikeapintainen Toblerin hyperelliptinen projektio

Peters ei ollut ensimmäinen, joka yritti suistaa Mercatorin projektion sen kiistatta ansiottomasta asemasta maailmankarttojen perusvaihtoehtona. Hän onnistui paremmin kuin lukuisat edeltäjänsä ennen kaikkea siksi, että hän suuntasi lobbaustyönsä karttojen tekijöiden ja julkaisijoiden sijaan poliittisiin ja yhteiskunnallisiin toimijoihin ja onnistui määrittelemään ”keksintöönsä” kriittisesti suhtautuvat ammattilaiset eurosentrisiksi imperialisteiksi.

On surullista, että Petersin kartografisesti heikkotasoinen projektio nauttii edelleenkin mainetta ainoana Mercatorin haastajana, vaikka parempia vaihtoehtoja olisi tarjolla runsaasti. Edellä mainittujen oikeapintaisten vaihtoehtojen lisäksi voisi mainita myös ns. kompromissiprojektiot kuten Robinson ja Winkel-Tripel, jotka eivät pyri pääsemään täysin eroon vääristymissä sen enempää alueiden muodoissa kuin pinta-aloissakaan vaan hakemaan hyvän kompromissin, jossa mikään kartan osatekijöiistä ei vääristy liian pahoin.

Robinsonin projektio

Winkel-Tripel (W3) -projektio

On epäilemättä totta, että Mercatorin projektion vuosisatoja jatkunut dominanssi on vääristänyt kuvaamme ”etelän” ja ”pohjoisen” keskinäisestä maantieteellisestä painoarvosta. Ilta-Sanomienkin esiin nostamat esimerkit ovat kiinnostavia ja merkityksellisiä. Voi kuitenkin kysyä, onko pinta-ala silti lopultakaan se tekijä, joka parhaiten kuvaa valtion paikkaa maailmassa. Mauritanian pinta-ala on yli miljoona neliökilometriä, kun taas asukasluvultaan suurempi Singapore mahtuu reilun 700:n neliökilometrin alueelle. Sitä, että Mauritania saa kartassa kuin kartassa selvästi Singaporea suuremman visuaalisen painoarvon on vaikea karttaprojektiota vaihtamalla korjata.

Yhtenä ratkaisuna on käyttää kartan sijaan kartogrammia, jossa alueiden pinta-alat eivät perustu niiden todelliseen maantieteelliseen pinta-alaan vaan jonkin muun muuttujan, vaikkapa asukasluvun saamaan arvoon. Juuri tällä tavoin ratkaisimme itse äskettäisten kuntavaalien tuloksen kuvaamisen Aamulehdelle tekemässämme visualisoinnissa. Verrattuna vaalituloksen esittämiseen perinteisellä koropleettikartalla kartogrammi näyttää paremmin suurissa kaupungeissa hyvin menestyneiden kokoomuksen ja SDP:n suosion, kun perinteinen kartta ylikorostaa maaseudulla hyvin pärjäävän keskustan menestystä.

Joissain tapauksissa oikea karttaprojektio on siis ei karttaprojektiota laisinkaan. Mutta silloinkin kun kartta pidetään karttana, on projektioksi lähes aina tarjolla parempiakin vaihtoehtoja kuin Gall-Peters.

Some thoughts on interactivity and storytelling

Two somewhat intertwining themes in many of the presentations at this year’s Malofiej conference (and last year as well) were what role interactivity and storytelling should play in data visualization. I think these two issues are related, and both of them are extremely important for our profession.

New York Times’ Archie Tse memorably told the conference (in 2016) that “readers just want to scroll” and that “if you make the reader click or do anything other than scroll, something spectacular has to happen.” That is, most of the visitors on a newspaper’s site don’t deeply interact with the graphics on the site, but instead prefer to just scroll and treat the interactive visualizations as static pictures.

Gregor Aisch published today a blog post titled “In defense of interactive graphics” which adds more shades of gray. I found this a particularly salient point: “– – you should not hide important content behind interactions. If some information is crucial, don’t make the user click or hover to see it – –. But not everything is crucial and 15% of readers isn’t nobody.” Another good point he makes is that letting the readers explore the data in detail helps spot mistakes and correct them.

Not all users and all use cases are as important! A sizeable part of my own work consists of doing interactive visualizations for public sector clients. Although the broadly defined target audience might be “anyone interested in the issue” very often there is a much, much smaller core audience, sometimes only a handful of people, whose needs are very different from a random visitor. These might be e.g. MPs who write legislation on the issue my client has a stake in, or experts in the subject matter working in a different arm of government. Such users are often much more invested in the issue to begin with, more knowledgeable on the topic, and more willing to spend time exploring a dataset. These past two days we heard of many examples of projects which may not have been huge hits with readers, but which helped journalists working within the newsroom to find stories. All these are examples of cases where you shouldn’t decide whether the graphic was succesful based only on how the 85% or 99% or users interacted (or didn’t) with it, but also take into account that some users are more valuable to you than others.

This brings us to the issue of storytelling. Jon Schwabish’s presentation discussed the topic at length yesterday, and in response to Jon’s thoughts Chad Skelton made the point in his blog that a literary story is different from a news story. I think this is true and important, but I would still  argue a news story is called a “story” for a reason.

A story is defined in the dictionary as “an account of imaginary or real people and events told for entertainment”, “a piece of gossip; a rumour” – or even “a false statement; a lie”. (In a Finnish newsroom, likewise, a news story is called juttu; literally an anecdote, a yarn, even a joke.) The common theme here is that “a story” includes at least a somewhat subjective point of view, and a narrative arc, with which the writer or speaker ties a bunch of disparate facts together as a coherent explanation of a part of the world, whether or not that explanation is true. (Nathaniel Lash also touched on this issue in his presentation today.) A table of numbers is not a story (though a data journalist might see a story in that table), nor should an entry in a dictionary or encyclopedia be.

I found Anna Flagg’s presentation today extremely relevant for very many reasons, but one issue she discussed I want to specifically mention here was the question of perceived bias in journalism and how to combat that perception. She mentioned a survey according to which in the U.S., a whopping 71% of Trump supporters and even 50% of Clinton supporters wanted the media to report just the facts without including any interpretation their own. As professionals, we understand that, if taken literally, such reporting would probably not be possible and certainly not very useful. Nevertheless, these numbers are indicative of mistrust in the capacity and willingness of the media to report the facts fairly.

I would argue that part of the problem here is that we think of what we are doing as storytelling. A story is a structure which helps to connect disparate pieces of information (factual or not) into a coherent whole, to better understand and remember it. But what if those pieces, even if true, do not objectively fit into a coherent whole? How do we guard against the temptation of seeing a story where there isn’t one in reality? The journalistic code of ethics helps in weeding out intentionally misleading and plain sloppy reporting. I’m not sure it helps as much when the problem is journalists seducing themselves with their own stories.

This brings us back to the issue of interactivity. A non-interactive story is just that, a story – a necessarily somewhat subjective narrative arc tying up the facts into a coherent whole. Such a story can be informative and useful, but it is not transparent.

To add transparency to a data-driven story, add interactivity. Instead of showing just the portion of the data the journalist thinks is most relevant for the readers, let them explore the rest as well – if they so prefer. It seems most readers won’t take up the offer; despite saying they want just the facts without interpretation, based on New York Times’ experience most people seem to prefer the journalist’s interpretation of the data to exploring it on their own. But the minority who is interested in and willing to explore the data exists. We should cater to them as well as the majority.

Not only to give them an engaging experience and a better understanding of the world, but also to keep ourselves honest.

Parannusehdotuksia HSL:n pysäkkinäyttöihin

Helsingin Sanomat kirjoittaa, että HSL reagoi vihdoin asiakaspalautteeseen uuden matkakortinlukijan hankalakäyttöisyydestä. Itse en pidä laitteen käyttöliittymää välttämättä kokonaisuutena arvioiden edeltäjäänsä huonompana, mutta se voisi olla paljon parempikin. On hyvä, että HSL ottaa saamansa palautteen vakavasti ja jatkaa käyttöliittymän kehitystyötä.

Uutinen toi mieleeni toisen HSL:n sinänsä hyödyllisen ”käyttöliittymän”, jossa on muutama ärsyttävä mutta helposti korjattavissa oleva puute. Tarkoitan tietysti pysäkkinäyttöjä.

HSL-alueen vilkkaimmilla pysäkeillä on käytössä näytöt, jotka kertovat seuraavien bussien ja/tai raitiovaunujen saapumisajat. Nykyinen näyttö näyttää suunnilleen tältä:

(Kuva on silmämääräisesti tehty mukaelma nykyisestä näytöstä. En löytänyt HSL:n sivuilta tai muualtakaan tarkkaa mallia, jonka perusteella typografian ja värit olisi voinut hioa täsmällisesti vastaamaan käytössä olevia näyttöjä.)

Näyttö on hyödyllinen, mutta siinä on yksi iso puute: teksti on niin pientä, että esimerkiksi kadun toiselta puolelta on turha yrittää saada selvää seuraavan kulkuvälineen lähtöajasta.

Itseäni häiritsee myös, että jos pysäkille sattuu ilta-aikaan, jolloin päivän lähtöjä on jäljellä enää muutamia, aamun ensimmäiset vuorot on kuvattu visuaalisesti aivan samalla tavalla kuin muutkin. Illan viimeisen ja aamun ensimmäisen kulkupelin välillä voi kuitenkin olla tuntien mittainen katkos. Viikonloppuiltana kun ympäristön havainnointi ei aina muutenkaan ole terävimmillään tämä johtaa joskus pitkäänkin turhaan odotteluun pysäkillä ennen kuin huomaa, että seuraava sporahan tulee vasta monen tunnin päästä.

Molemmat puutteet olisi helppo korjata varsin pienin muutoksin nykyiseen käyttöliittymään:

    1. Varataan seuraavaksi saapuvalle vuorolle isompi tila, jolloin tekstit voi laittaa niin isolla, että ne näkyvät kauemmaskin.
    2. Näytetään ne vuorot, joiden lähtöön on esimerkiksi yli 30 minuuttia sekä nykyhetkestä että edeltävästä vuorosta eri värillä kuin muut.

Jo näillä muutoksilla pysäkkinäyttöjen käytettävyys paranisi huomattavasti. Mutta käyttöliittymää voisi parantaa tästäkin. Tein nopean kokeilun siitä, miltä näyttö voisi näyttää, jos siinä hyödynnettäisiin vähän nykyistä paremmin typografisia hierarkioita:

Värimaailma ja kirjaintyypit on myös muutettu paremmin HSL:n ilmeen mukaiseksi. (Kellonaikoihin on tosin käytetty HSL:n Gotham-fontin sijaan tässä karkeassa luonnoksessa Neuzeit Groteskia, sillä Gothamista puuttuvat taulukkokäyttöön tarkoitetut versaalinumerot. Ks. tarkemmin Koponen, Hildén & Vapaasalo 2016, s. 286.)

Yllä oleva on vain nopea ja väistämättä karkea luonnos siitä, miten itseäni häiritsevät ongelmakohdat pysäkkinäytöissä voisi helposti fiksata. Todellisessa suunnittelutyössä pitäisi tietenkin huomioida iso määrä teknisiä reunaehtoja, joita tuskin olen osannut ottaa huomioon. Eri vaihtoehtoja pitäisi myös ennen käyttöönottoa testata oikeilla käyttäjillä eikä vain luottaa suunnittelijan suvereeniin osaamiseen. Käyttäjätestaus on kallista ja tilaajalla on usein kiusaus ajatella, että kyllä muotoilija osaa muotoilla. Paraskaan käyttöliittymäsuunnittelija ei kuitenkaan pysty ennakolta aavistamaan kaikkea, mitä todellisissa käyttötilanteissa tulee esiin.

HSL:n nykyisiä pysäkkinäyttöjä on ”testatttu” käytännössä jo pitkään ja meillä kaikilla on niistä omakohtaisia käyttökokemuksia. Olenkin varma, että monella muullakin on paljon lisää ideoita siitä, miten näytöistä saisi selkämpiä ja matkustajille hyödyllisempiä. On aika avata keskustelu paremmista pysäkkinäytöistä! Toivotaan, että esiin nousevat ideat päätyvät myös HSL:n tietoon ja osaltaan edesauttavat yhä parempien pysäkkinäyttöjen syntyä.

Lisäys klo 21:10: Tässä vielä some-keskusteluissa esiin nousseiden kommenttien perusteella muokattu ja Tero Juutin tekemän luonnoksen innoittama uusi versio.

Huomionarvoista on, että bussien linjatunnisteet ovat pitempiä kuin raitiovaunuilla, joten tämä sama asettelu ei välttämättä toimi bussipysäkeillä.

Oikean Median puoluekannatusanalyysi on huonosti tehtyä ja laiskaa datajournalismia

Arvokonservatiiviseksi vaihtoehtomediaksi itsensä määrittelevä Oikea Media julkaisi lauantaina Marko Hamilon kirjoittaman puolueiden kannatusta ja vieraskielisten osuutta Helsingin eri alueilla vertailevan datajournalismijutun otsikolla ”Maahanmuuton kannattajat asuvat kaukana monikulttuurisesta arjesta”.

Analyysin keskeinen sisältö tiivistetään Hamilon jutussa näin:

– – Sdp ja Perussuomalaiset saavat paljon ääniä monikulttuurisilta alueilta, sen sijaan Kokoomuksen ja Vihreiden kannatus on heikompaa siellä missä monikulttuurisuus on voimakasta. Vasemmistoliiton kannatus ei riipu äänestysalueen monikulttuurisuuden asteesta.

On ilahduttavaa, että konservatiivitkin yrittävät vaihteeksi käydä yhteiskunnallista keskustelua asia-argumentein. Valitettavasti artikkeli perustuu virheellisesti käsiteltyyn dataan eikä edes tämä virheellinen aineisto lähemmin tarkasteltuna täysin tue Hamilon sanallisesti esittämää tulkintaa.

Käytetty aineisto soveltuu tarkoitukseen huonosti ja käytetty menetelmä on kuvattu puutteellisesti

Puolueiden kannatuksen ja ”monikulttuurisuuden”, joka Hamilon artikkelissa määritellään vieraiden kielten puhujien osuudeksi, vertailu on lähtökohtaisesti hankalaa, sillä näistä teemoista saatavilla olevat tilastot käyttävät erilaista aluejakoa. Äänestysalueita ei käytetä väestötilastojen aluejakona, joten vieraiden kielten puhujien osuus on saatavilla vain niiden kanssa yhteensopimattomalla aluejaolla, esimerkiksi kaupunginosittain (Helsingin seudun aluesarjat -sivustolta) tai postinumeroalueittain (Tilastokeskuksen PAAVO-tietokannasta). Hamilo ilmoittaa käyttäneensä lähteenä aluesarjojen aiheistoa.

Alla oleva Helsingin kartta kuvaa sitä, miksi tämä on ongelma. Äänestysalueiden rajat eivät vastaa yksi yhteen kaupunginosien (tai postinumeroalueiden) rajoja. Kartassa mustalla näkyvät ne rajat, jotka ovat sekä kaupunginosien että äänestysalueiden rajoja, vihreällä vuoden 2012 kuntavaalien äänestysalueiden rajat ja oranssilla kaupunginosien rajat. Lisäksi vihreänharmaalla on merkitty ne äänestysalueiden rajat, jotka muuttuivat vuonna 2013.

(Kuva aukeaa klikkaamalla suuremmaksi.)

Sellaisissa tapauksissa, joissa kaikki kaupunginosaan kuuluvat äänestysalueet mahtuvat kokonaan sen rajojen sisäpuolelle ongelmaa ei synny, koska tällöin tulokset voidaan laskea yhteen ja muodostaa näin kaupunginosakohtaiset luvut. Ongelmia tuottavat sellaiset äänestysalueet, jotka ulottuvat kahden tai useamman kaupunginosan puolelle.

Yllä olevalla kartalla oranssina näkyvät kaupunginosien rajat ovat sellaisia kohtia, joissa äänestysalue ulottuu useamman kaupunginosan alueelle. Esimerkiksi äänestysalue 003A Kaartinkaupunki pitää sisällään Kaartinkaupungin kaupunginosan lisäksi myös Kaivopuiston sekä ison siivun Ullanlinnasta.

Hamilo ei selitä miten hän on ratkaissut aluejakojen yhteensovittamiseen liittyvät ongelmat. Asian selvittämistä hankaloittaa, että hän käyttää kaupunginosista pääosin muita kuin niiden virallisia nimiä. Joissain kohdin tämä on sisällöllisesti perusteltua: harva esimerkiksi tietää, että Itäkeskus ja Myllypuro kuuluvat molemmat virallisesti Vartiokylä-nimiseen kaupunginosaan (numero 45), joten nimitys Itäkeskus–Myllypuro on virallista nimeä havainnollisempi. Monet Hamilon valitsemat nimitykset ovat kuitenkin harhaanjohtavia: hän kutsuu esimerkiksi Länsisataman kaupunginosaa (20) Ruoholahdeksi, vaikka kaupunginosaan kuuluvat Ruoholahden lisäksi myös Jätkäsaari, Lapinlahti ja Hernesaari.

Hamilo vaikuttaa myös jättäneen viisi kaupunginosaa kokonaan pois analyysistään perustelematta ratkaisua mitenkään. Puuttuvat kaupunginosat ovat Kaivopuisto (09), Laakso (18), Vanhakaupunki (27), Viikki (36) ja Vartiosaari (48). Varsinkin n. 15 000 asukkaan Viikin jättäminen pois on erikoinen veto, joka kaipaisi jonkin perustelun tuekseen. Uskoisin tämän liittyvän jollain tavalla äänestysalueiden ja kaupunginosien yhteensovitusongelmaan, mutta kun metodologiaa ei ole tekstissä avattu, asia jää mysteeriksi.

Olen koonnut alla olevaan taulukkoon käsitykseni siitä, mitä virallisen aluejaon kaupunginosaa mikin Hamilon käyttämä nimitys tarkoittaa:

Hamilon käyttämä kaupunginosan nimi kaupunginosan virallinen nimi ja numero asukasluku 1.1.2016
Alppila 12 Alppiharju 11 937
Etu-Töölö 13 Etu-Töölö 14 559
Haaga 29 Haaga 26 771
Hermanni 21 Hermanni 6 325
Herttoniemi-Roihuvuori 43 Herttoniemi 26 216
Itäkeskus-Myllypuro 45 Vartiokylä 33 956
Jakomäki 41 Suurmetsä 16 209
Kaartinkaupunki 03 Kaartinkaupunki 1 050
Kallio 11 Kallio 19 434
Kamppi-Hietalahti 04 Kamppi 11 709
Kannelmäki-Malminkartano 33 Kaarela 27 357
Käpylä 25 Käpylä 8 114
Katajanokka 08 Katajanokka 4 470
Kluuvi 02 Kluuvi 636
Konala 32 Konala 6 197
Kontula-Mellunmäki 47 Mellunkylä 37 600
Koskela 26 Koskela 3 336
Kruununhaka 01 Kruununhaka 7 376
Kulosaari 42 Kulosaari 3 806
Kumpula 24 Kumpula 3 838
Laajasalo 49 Laajasalo 16 630
Lauttasaari 31 Lauttasaari 22 617
Malmi 38 Malmi 24 664
Maunula 28 Oulunkylä 23 333
Meilahti 15 Meilahti 5 091
Munkkiniemi 30 Munkkiniemi 17 629
Pakila 34 Pakila 10 399
Paloheinä 35 Tuomarinkylä 8 982
Pasila 17 Pasila 9 219
Pitäjänmäki 46 Pitäjänmäki 11 726
Pukinmäki 37 Pukinmäki 8 383
Punavuori-Eira 05 Punavuori + 06 Eira 10 163
Ruoholahti 20 Länsisatama 10 350
Ruskeasuo 16 Ruskeasuo 10 373
Santahamina 51 Santahamina 423
Sörnäinen 10 Sörnäinen 9 634
Suomenlinna 52 Suomenlinna 790
Taka-Töölö 14 Taka-Töölö 15 244
Tammisalo 44 Tammisalo 2 247
Tapanila 39 Tapaninkylä 14 159
Tapulikaupunki 40 Suutarila 19 901
Toukola 23 Toukola 8 777
Ullanlinna 07 Ullanlinna 10 629
Vallila 22 Vallila 9 326
Vuosaari 54 Vuosaari 37 834
Östersundom 55 Östersundom +
58 Karhusaari +
59 Ultuna
1 961
puuttuvat kokonaan 09 Kaivopuisto
18 Laakso
27 Vanhakaupunki
36 Viikki
48 Vartiosaari
yht. 17 901

Taulukosta ilmenee eräs muukin käytetyn aluejaon ongelma. Äänestysalueet ovat asukasluvultaan likimain samankokoisia, useimmiten noin 2 000–4 000 henkeä, joten niiden suora vertailu on vielä kohtalaisen mielekästä ilman sen kummempia painokertoimia. Hamilon vertailemien kaupunginosien asukasluvut kuitenkin vaihtelevat 423 asukkaan Santahaminasta 37 800 asukkaan Vuosaareen. On kyseenalaista, millaisia johtopäätöksiä näin erilaisia alueita suoraan vertailemalla voi ylipäänsä tehdä.

Hamilo on päätynyt yhdistämään vuosien 2008, 2011, 2012 ja 2015 vaalien tulokset yhdeksi luvuksi. Niin puolueiden kannatus kuin vieraskielisten määräkin on vaihdellut eri alueilla tällä ajanjaksolla paljon, eikä Hamilo selitä, miten hän on ottanut vaihtelun huomioon. Runsas vieraskielisten määrä vuonna 2015 tuskin on voinut vaikuttaa takautuvasti puolueiden kannatukseen vuonna 2008. (Pieniä lisähankaluuksia saattaa joissain kohdin tuottaa myös, että äänestysalueiden rajoja on muutettu vuosina 2010 ja 2013.)

Minulle jää myös epäselväksi, miten Hamilon ilmoittama vieraskielisten osuus eri kaupunginosissa on laskettu. Se ei aluesarjojen luvuilla nopeasti testailtuna vaikuttaisi olevan ainakaan vaalivuosien painotettu tai painottamaton keskiarvo, minkään yksittäisen vaalivuoden luku eikä myöskään tuorein Aluesarjat-sivustolta löytyvä luku eli tilanne vuoden 2016 alussa.

Jos analyysin olisi tehnyt jokin luotettava, journalistin ohjeisiin sitoutunut media, tai vielä parempaa, yliopistossa tai vaikkapa sektoritutkimuslaitoksessa työskentelevä ammattitutkija, saattaisin ehkä olla valmis uskomaan, että kaikille yllä mainitsemilleni erikoisille ratkaisuille löytyy hyvä perustelu ja ongelmakohdat on pystytty tavalla tai toisella taklaamaan. Hamilon ja Oikean Median uskottavuus ei kuitenkaan ole sillä tasolla, että ilman yksityiskohtaisia perusteluja voisi noin vain olettaa tekijän tietävän mitä tekee – varsinkin kun aineiston lähempi tarkastelu tuntuu pikemminkin lisäävän kysymyksiä kuin vastaavan niihin.

Edes Hamilon käyttämä data ei tue hänen johtopäätöksiään

Kelpuuttakaamme kuitenkin keskustelun vuoksi Hamilon käyttämä data kaikkine epäselvyyksineenkin. Tukeeko käytetty aineisto kirjoittajan sanallista tulkintaa? Hamilo toteaa kuvioiden lukuohjeessa mm. näin:

Jos puolueen kannatus korreloi positiivisesti monikulttuurisuuden kanssa, on trendi nouseva oikealle mentäessä.

Hamilo on siis kiinnostunut siitä, miten puolueen kannataus korreloi ”monikulttuurisuuden” (eli vieraskielisten osuuden kanssa). Tässä kohdin on hyvä muistuttaa siitä, mitä korrelaatio oikeastaan tarkoittaa. Tiivis määritelmä löytyy esimerkiksi Tieto näkyväksi -kirjasta (s. 195):

Korrelaatio eli yhteisvaihtelu on suure, joka kuvaa kahden muuttujan keskinäistä riippuvuussuhdetta. Tiedämme esimerkiksi, että ihmisen tulotasolla ja eliniänodotteella on yhteys toisiinsa: suurituloiset elävät keskimäärin pienituloisia vanhemmiksi. Havainto pätee tilastollisella tasolla, vaikka yksilötasolla tästä esiintyykin runsaasti poikkeuksia.

Voimakas korrelaatio viittaa siihen, että muuttujien välillä on jonkinlainen syy­-yhteys, mutta ei kerro sitä, kumpi muuttujista on syy ja kumpi seuraus tai löytyykö keskinäisen riippuvuuden takaa kenties jokin kolmas selittävä tekijä. Tämä ei käy ilmi pelkästään tilastollisesta analyysistä, vaan syy–seuraussuhteen selvittäminen vaatii syvällisempää tietoa aiheesta.

Korrelaation laskemiseen on useita matemaattisia menetelmiä, joista käytetyin on Pearsonin korrelaatiokerroin eli r. Se voi saada arvoja välillä –1 … 1. Korrelaatio on sitä voimakkaampi, mitä enemmän r:n arvo poikkeaa nollasta. Negatiiviset arvot kuvaavat käänteistä riippuvuussuhdetta, jossa toisen muut­tujan arvo kasvaa toisen pienentyessä.

– –

Tilanteet, joissa r olisi tasan 0, 1 tai –1 ovat varsin harvinaisia. Useimmin korrelaatiokertoimen arvo asettuu jonnekin niiden välimaastoon. Mikä silloin on voimakas tai heikko korrelaatio? Ohessa suuntaa antava jaottelu:

r = 0–0,2 ei korrelaatiota
r = 0,2–0,4 heikko korrelaatio
r = 0,4–0,6 kohtalainen korrelaatio
r = 0,6–0,8 voimakas korrelaatio
r = 0,8–1 erittäin voimakas korrelaatio

Korrelaatio on siis matemaattinen suure, jonka suuruus voidaan visualisoinnista arvioida silmämääräisesti vain karkeasti, mutta jonka laskemiseen on olemassa vakiintunut ja helppo menetelmä.

Jostain syystä Hamilo ei ole laskenut puolueiden kannatuslukujen ja ”monikulttuurisuuden” asteen välisiä korrelaatiokertoimia, vaan nojaa pelkästään laatimiinsa visuaalisiin esityksiin, joita hän tulkitsee lukijalle sanallisesti.

Alla olevaa kuviota tulkitaan mm. näin: ”Vihreiden vankin kannatus löytyy kantasuomalaisten asuttamilta alueilta ja kannatus laskee monikulttuurin lisääntyessä.”

Seuraavaa grafiikkaa kuvaillaan vuorostaan näin: ”Vasemmistoliiton kannatus näyttää olevan tasaista kautta linjan, eikä siis riipu alueen monikulttuurisuusasteesta.”

Minun täytyy sanoa, etten näe kuvioissa Hamilon kuvailemaa eroa. Minun silmiini kumpikaan niistä ei paljasta selkeää yhteyttä puolueen kannatuksen ja ”monikulttuurisuuden” välillä, vaan kaupunginosia kuvaavat pallot ovat kummassakin kuviossa melko lailla hajallaan ympäri koordinaatistoa.

Onneksi asiassa ei tarvitse luottaa pelkkään silmämääriseen arvioon, vaan voimme laskea puolueen kannatuksen ja vieraitten kielten puhujien osuuden korrelaation kullekin puolueelle:

puolue korrelaatio
SDP 0,72
kokoomus −0,55
perussuomalaiset 0,51
vihreät −0,18
vasemmistoliitto 0,15

SDP:n ja monikulttuurisuuden väillä näkyy Hamilon keräämän datan perusteella olevan voimakas (r = 0,72) positiivinen korrelaatio. Myös kokoomuksen ja perussuomalaisten kohdalla korrelaatio on kohtalainen, kuten Hamilo jutussaan kuvaileekin.

Mutta kas vain! Vihreiden ja vasemmistoliiton korrelaatiokertoimet ovat käytännössä samansuuruisia, vaikkakin toki vastakkais­suuntaisia. Toista näistä Hamilo kuvailee siis sanomalla, että ”kannatus laskee monikulttuurin lisääntyessä”, toista taas, ettei kannatus ”riipu alueen monikulttuurisuusasteesta”.

Alle 0,2:n korrelaatiota kuvaillaan yleensä sanoilla ”ei korrelaatiota”. Toisin sanoen, Hamilon väite siitä, että vihreiden kannatus olisi kääntäen verrannollinen ”monikulttuurisuuden” määrään ei kestä lähempää tarkastelua edes hänen omaa dataansa käyttäen. Hamilo on päättänyt analyysinsä tuloksen etukäteen ja näkee kuviossa mitä haluaa, vaikka yksinkertainen tilastollinen analyysi olisi paljastanut, ettei aineisto tue tehtyä johtopäätöstä. Tämä siis sen lisäksi, ettei käytetty aineisto sovi tällaisen analyysin tekemiseen ja sitä on käsitelty virheellisesti ja läpinäkymättömästi.

Näiden puutteiden lisäksi voisin listata vielä lisääkin. Esimerkiksi: Miksi tarkastelu on rajattu vain Helsinkiin? Eikö vähintään muut pk-seudun kunnat ja kenties muutkin suuret kaupunkiseudut olisi syytä ottaa mukaan isomman otoksen ja siten robustimman analyysin aikaansaamiseksi?

Entäpä miksi jutussa ei ole lainkaan käsitelty vaihtoehtoisia selityksiä havaituille puoluekannatuksen alueellisille eroille? Uskaltaisin veikata, että sekä asuinpaikka että puoluekannatus korreloivat voimakkaammin tulotason kanssa kuin puolekannatus alueen vieraskielisten määrän kanssa. Varsinkin kun Hamilon implikoitu väite – että maahanmuuttajien lähellä asuminen lisäisi maahan­muutto­vastaisia asenteita ja siten perussuomalaisten suosiota – on ristiriidassa olemassaolevan tutkimustiedon kanssa, vaadittaisiin vähän kattavampaa vaihtoehtoisten selitysmallien poissulkemista, jotta analyysi olisi uskottava.

Datajournalismin tarkoitus ei ole väännellä ja käännellä aineistoa halutun lopputuloksen saamiseksi. Oikean Median ja Hamilon kannattanee vastaisuudessa jättää tämä laji osaavampien heiniksi.

Olen kerännyt kaikki käytetyt datat yhteen CSV-muotoiseen taulukkoon, jonka halukkaat voivat ladata omien analyysien tekemistä varten.

Valtiovarainministeriön työllisyysgrafiikka ei johda tarkoituksella harhaan

Valtiovarainministeriö julkaisi eilen Twitter-tilillään grafiikan avoimien työpaikkojen ja työttömyyden määrän kehityksestä 2007–2016:

Kuvajournalisti Antti Yrjönen syytti VM:n grafiikkaa tarkoituksellisen harhaanjohtavaksi Twitterissä ja Facebookissa ja laati grafiikasta oman versionsa:

Yrjösen kriitiikki lähti leviämään vauhdilla ja lopulta myös valtamedia nosti sen esiin. MTV3 kirjoitti tapauksesta varsin lennokkalla otsikolla ”Työttömyysgrafiikka oli vinksallaan – kansan kritiikki oikaisi valtiovarainministeriön käppyrät”.

Pintapuolisella vilkaisulla VM:n grafiikka saattaa tosiaan antaa lukijalle sellaisen mielikuvan, että avoimia työpaikkoja olisi suunnilleen yhtä paljon kuin työttömiä työnhakijoita. Tästä on vedetty sellaisia johtopäätöksiä, että grafiikalla yritettäisiin väittää, että jokaiselle halukkalle kyllä löytyy töitä. Tämä ei kuitenkaan ole aiottu viesti.

Mistäkö tiedän? Grafiikka on minun tekemäni.

Valtiovarainministeriö otti minuun yhteyttä joulukuun loppupuolella aiheena muutaman työllisyystilanteen kehitystä kuvaavan grafiikan sommittelu ministeriön käyttöön. Nyt julkaistu viivakuvio on osa tätä kokonaisuutta.

Kuviossa vertaillaan työttömien työnhakijoiden määrän kehitystä vuosina 2007–2016 suhteessa avoimien työpaikkojen määrään. Kiinnostavaa ja olennaista kuviossa on, että 2013–2016 sekä avointen työpaikkojen että työttömien määrä on kasvanut, kun normaalisti nämä muuttujat kulkevat vastakkaisiin suuntiin. Tämä on huolestuttavaa ja kertoo mahdollisesti siitä, että työnhakijoiden osaaminen vastaa aiempaa huonommin työantajien tarpeisiin.

Sain melko vapaat kädet ehdottaa aineistolle soveltuvaa esitystapaa. Kokeilimme useita kuviotyyppejä, myös esim. Olli Kärkkäisen Twitterissä ehdottamaa, työllisyys- ja työttömyysasteen keskinäistä suhdetta taloustieteellisissä tutkimusjulkaisuissa perinteisesti kuvaamaan käytettyä ns. Beveridge-kuviota:

(Kuvion teksti on minun kirjoittamani alustava hahmotelma, ei VM:n tuottama tai hyväksymä.)

Vaikka grafiikan aiottu kohdeyleisö oli erityisesti virkamiehet, toimittajat ja muut työllisyyskysymyksiin ainakin jonkin verran perehtyneet ihmiset, Beveridge-kuvio on tottumattomalle hankalasti hahmotettava. Niinpä päädyimme lopulta käyttämään tutumpaa viivakuviota. Kahden asteikon käyttöön päädyttiin minun ehdotuksestani, ei asiakkaan pyynnöstä.

Kuvion tarkoituksena ei ole antaa ymmärtää, että avoimia työpaikkoja olisi tarjolla riittävästi kaikille halukkaille työnhakijoille, kuten Antti Yrjönen ja moni hänen laatimaansa ”vähemmän harhaanjohtavaa” versiota kommentoinut tuntuu ajattelevan. Minua ei pyydetty laatimaan kuviota, jonka tarkoitus olisi antaa tällainen vaikutelma, enkä olisi tällaiseen pyyntöön suostunutkaan, koska aineisto ei sellaista väitettä tue. Minun on vaikea myöskään uskoa, että kukaan olisi niin typerä, että kuvittelisi noin kömpelön vedätyksen menevän läpi.

Työmarkkinoiden toimintaa tunteville on selvää, että työnhakijoita on käytännössä aina moninkertainen määrä avoimiin työpaikkoihin nähden. Valittuun visuaaliseen ratkaisuun päädyttiin siksi, että kiinnostuksen kohteena oli se, miten tämä suhdeluku on kehittynyt. Grafiikassa käytetään kahta asteikkoa, jotta avointen työpaikkojen ja työttömien määrän vertailu ylipäänsä olisi visuaalisesti mahdollista. Yrjösen ehdottamassa ”vähemmän harhaanjohtavassa” versiossa tällainen vertailu ei onnistu. Siinä avointen työpaikkojen määrä näyttää pysyneen lähes ennallaan, vaikka todellisuudessa niiden määrä on vuoden 2009 aallonpohjasta kasvanut vuoteen 2016 mennessä noin 50 % ja lyhyemmälläkin jaksolla 2013–2016 lähes 20 %. Yrjösen ehdottama esitystapa hukkaa siis erittäin olennaista tietoa.

Lisäksi yhtenäistä asteikkoa käytettäessä jää huomaamatta, että vuodesta 2013 alkaen sekä työttömien että avointen työpaikkojen määrä on kasvanut, kun yleensä avointen työpaikkojen määrän kasvaessa työttömien määrä laskee ja päin vastoin. Tämä ongelma on myös esimerkiksi Juho Mikkosen ehdottamassa, muutoin sinänsä toimivassa ratkaisussa, jossa visualisoidaan vain työpaikkojen ja työnhakijoiden suhdeluvun kehitys. Tätäkin ehdotusta muistuttavaa versiota kokeilimme ennen nyt julkaistuun vaihtoehtoon päätymistä:

(Kuvion otsikointi on minun kirjoittamani ehdotus, ei VM:n tuottama tai hyväksymä.)

Kahden asteikon käyttö tilastokuviossa on aivan normaali käytäntö kun halutaan vertailla kahden eri muuttujan suhteellista kehitystä. (Ks. esim. Koponen, Hildén & Vapaasalo 2016, s. 219; Kuusela 2000, s. 34–36.) Kun asteikkoväli on valittu oikein ja käytetyt asteikot on merkitty selvästi, tässä ei lähtökohtaisesti ole mitään harhaanjohtavaa. Toki tehtyjä ratkaisuja pitää arvioida tapauskohtaisesti, eikä se, että kuvio on teknisesti oikein laadittu vielä takaa sitä, ettei se johda lukijaa harhaan.

On selvää, että grafiikka, joka saa sadat ihmiset sosiaalisessa mediassa epäilemään valtiovarainministeriötä tarkoituksellisesta harhaanjohtamisesta on epäonnistunut viestinnällisissä tavoitteissaan. Vastuu epäonnistumisesta on viime kädessä suunnittelijalla, tässä tapauksessa siis minulla. En osaa sanoa onko ongelma itse grafiikassa, siihen liittyvissä teksteissä, julkaisukontekstissa vai kenties jossain niiden yhdistelmässä. Tarkoituksena ei kuitenkaan ole ollut huijata ketään vaan mahdollistaa avointen työpaikkojen ja työttömien määrän kehityksen visuaalinen vertailu, joka ei ehdotetuissa ”paremmissa” vaihtoehdoissa onnistu. (Poikkeuksena tästä Beveridge-kuvio, joka sekin käyttää kahta eri asteikkoa.)

* * *

Itselleni yksi tarinan opetuksista on, että grafiikan ”freimauksella”, eli sillä, missä kontekstissa ja minkälaisen saatteen kanssa se on esitetty, on suuri merkitys sen tulkinnalle. Kun valtiovarainministeriölle laatimani kuvio lähti elämään omaa elämäänsä vihaisella saatetekstillä varustettuna, moni ihminen kansanedustajia myöten oli valmis uskomaan ministeriön pyrkineen tarkoituksella johtamaan kansalaisia harhaan.

Olen tietenkin jäävi arvioimaan, miten kuvioon olisi reagoitu ilman tätä ”lukuohjetta”, mutta uskon vakaasti, että läheskään yhtä moni ei olisi tullut samaan lopputulokseen jos olisi nähnyt grafiikan ilman tätä kriittistä saatetekstiä. Ja kääntäen: jos kuvion yhteydessä olisi jo alkajaisiksi ollut selkeämmin alleviivattuna se, mikä sen tekijän ja tilaajan mielestä on sen olennainen sanoma, grafiikan keskeinen viesti olisi kenties helpommin tulkittu samoin kuin itse sitä tulkitsimme.

Alan ammattilaisten keskuudessa yleinen ajatus ”älä selitä vaan anna datan puhua puolestaan” ei tämän kokemuksen perusteella ole hyvä periaate visualisointien suunnitteluun silloin, kun julkaisuympäristönä on draamaa ja vastakkainasettelua rakastava sosiaalinen media.

Puoluekannatus ja virhemarginaalit

Alma Media ja Yle julkistivat joulukuun lopulla peräkkäisinä päivinä puolueiden kuntavaalikannatusta koskevat mielipidemittauksensa. Tietoykkönen Oy:n Almalle toteuttaman kyselyn haastattelut tehtiin 9.–18.12., Taloustutkimus taas toteutti Ylen kyselyn 7.–28.12. Puolueiden kannatusprosentit kummassakin kyselyssä on lueteltu alla olevassa taulukossa.

Yle Alma Media
SDP 21,2 % 20,1 %
keskusta 20,3 % 19,5 %
kokoomus 17,4 % 17,1 %
vihreät 13,3 % 11,2 %
PS 9,4 % 11,6 %
vasemmistoliitto 7,6 % 8,8 %
RKP 4,9 % 4,5 %
KD 3,6 % 3,7 %
muut 2,3 % 3,5 %

Puolueiden kannatuksissa on havaittavissa pieniä eroja kyselyiden välillä. Huolimatta siitä, että mielipidemittausten aikavälit poikkeavat hieman toisistaan, Alman kyselyn aikaväli mahtuu kokonaan Ylen kyselyn ”sisään”. Voisi kuvitella, että liki samaan aikaan tehdyt mielipidemittaukset antaisivat melko tarkalleen samat kannatuslukemat kullekin puolueelle. Näin ei kuitenkaan ole. Mistä se johtuu?

Vastaus kysymykseen löytyy tietenkin mielipidemittausten virhemarginaalista. Mutta mitä virhemarginaali oikeastaan tarkoittaa ja miten sitä pitäisi tulkita?

Virhemarginaali ja luottamusväli

Otetaan lähempään tarkasteluun ne kaksi puoluetta, joiden kannatuslukemissa ero Ylen ja Alma Median kyselyiden välillä on suurin: poliittisen spektrin vastakkaisilta laidoilta löytyvät vihreät ja perussuomalaiset.

Ylen kyselyssä vihreät on neljänneksi suurin puolue selvällä erolla viidenneksi suurimpaan puolueeseen perussuomalaisiin. Alma Median kyselyssä puolueet taas ovat lähes tasoissa, mutta perussuomalaiset johtaa vihreitä täpärästi.

Molempien kyselyiden ilmoitettu virhemarginaali on ±2,4 prosenttiyksikköä. Tarkoittaako tämä, että esimerkiksi vihreiden todellinen kannatus voi Ylen kyselyn mukaan olla yhtä hyvin mikä hyvänsä luku välillä 10,9–15,7 % ja Alma Median mukaan välillä 8,8–13,6 %? Ei tarkoita.

Ensin lienee hyvä hieman avata, mikä on virhemarginaalin määritelmä. Tilastotieteellisin termein ilmaistuna mielipidemittauksen virhemarginaali on sama asia kuin 95 prosentin luottamusvälin (engl. confidence interval) puolikas. Tämä tarkoittaa siis sitä, että mikäli tutkimuksen otos on harhaton (tästä lisää artikkelin loppupuolella) puolueen todellinen kannatus on 95 prosentin todennäköisyydellä jollain kohtaa vaihteluväliä, joka ulottuu virhemarginaalin verran ilmoitetusta prosenttiluvusta kumpaankin suuntaan.

Kyselyn virhemarginaali lasketaan seuraavalla kaavalla:

Kaavassa p merkitsee puoluekannatuksen tai muun mittauksen kohteena olevan asian suhteellista osuutta desimaalilukuna (esim. vihreiden kannatus Ylen kyselyssä = 0,133) ja n kyselyyn vastanneiden määrää eli otoskokoa. 1,96 tulee kaavaan taas siitä, että 95 prosentin vaihteluvälin äärirajat ovat ±1,96 keskihajonnan etäisyydellä keskiarvosta.

Suoraan kaavasta ilmenee kaksi merkittävää virhemarginaalia koskevaa seikkaa:

  1. Populaation eli perusjoukon, siis koko tutkimuksen kohteena olevan ryhmän koko ei vaikuta virhemarginaaliin. Voi tuntua epäintuitiiviselta, että puolueiden kannatuksen selvittämiseksi koko Suomessa (5,5 milj. as.) tai pelkästään vaikkapa Lappeenrannassa (73 000 as.) tarvitaan yhtä suuri otos saman virhemarginaalin saamiseksi. Mikäli otoskoko on hyvin lähellä populaation kokoa, näin ei itse asiassa olekaan, mutta useimmissa käytännön tilanteissa sama otos tuottaa mielipidemittauksessa yhtä suuren virhemarginaalin, oli tutkimuksen kohteena sitten 50 miljoonan tai 50 000:n kokoinen ihmisjoukko.
     
  2. Erisuuruisilla kannatusluvuilla on eri virhemarginaalit. Tämä merkitsee sitä, että mielipidemittauksen ilmoitettu virhemarginaali pätee sellaisenaan vain yhteen vertailussa mukana olevista puolueista (yleensä suurimpaan niistä). Luvun virhemarginaali on sitä suurempi, mitä lähempänä 50 prosenttia se on. Niinpä pienempien puolueiden kohdalla todellinen marginaali on ilmoitettua pienempi.

Ylen kyselyyn vastasi 1 946 henkilöä, joista 57,6 % eli 1 121 kertoi puoluekantansa. Alma Mediaa varten haastatelluista 1 500 henkilöstä kantansa ilmaisi 70,8 % eli 1 062. Näillä luvuilla saadaan yllä esitettyä kaavaa käyttäen laskettua seuraavat virhemarginaalit kullekin puolueelle:

Yle (n = 1 121) Alma Media (n = 1 062)
SDP ±2,4 % ±2,4 %
keskusta ±2,4 % ±2,4 %
kokoomus ±2,2 % ±2,3 %
vihreät ±2,0 % ±1,9 %
PS ±1,7 % ±1,9 %
vasemmistoliitto ±1,6 % ±1,7 %
RKP ±1,3 % ±1,2 %
KD ±1,1 % ±1,1 %
muut ±0,9 % ±1,1 %

Todellinen arvo voi olla myös virhemarginaalin ulkopuolella

On huomionarvoista, että virhemarginaalin laskemiseen käytetty luottamusväli on 95, ei suinkaan 100 prosenttia. Todellinen arvo voi siis löytyä myös virhemarginaalin ulkopuoleltakin. Yksittäisen puolueen kannatuksen tapauksessa tämän todennäköisyys on vain 5 %, mutta koska yhdestä mielipidemittauksesta ilmenee 9 eri numeroa  – 8 puolueen kannatusprosentit sekä ryhmä ”muut” – todennäköisyys sille, että ainakin yksi niistä on pielessä virhemarginaalia enemmän on 37 %. Todennäköisyys sille, että ainakin yksi joko Ylen tai Alma Median luvuista on virhemarginaalia kauempana todellisuudesta on jo 60 %, ja on lähestulkoon varmaa (todennäköisyys 99,6 %), että ainakin yksi Ylen vuoden aikana julkaisemista 12 mielipidemittauksista sisältää vähintään yhden kannatuslukeman, jonka todellinen arvo on virhemarginaalin ulkopuolella.

Yllä olevassa kuviossa on kuvattu se vaihteluväli jolle vihreiden ja perussuomalaisten todellinen kannatus Ylen ja Alma Median kannatusmittausten mukaan sijoittuu. Tavallinen, 95 prosentin luottamusväliin perustuva virhemarginaali on kuvattu täytettynä laatikkona, lisäksi katkoviivalla on osoitettu 99,7 prosentin luottamusväli (±3,0 keskihajontaa), jonka sisältä oikea arvo löytyy jo lähes varmasti.

Parikin prosenttiyksikköä on aika iso heitto kun puhutaan kymmenen prosentin tietämissä pyörivistä luvuista. Kuten ylempänä kuvatusta laskukaavasta ilmenee, virhemarginaalia olisi mahdollista pienentää otoskokoa kasvattamalla. Miksi näin ei tehdä mielipidemittausten tulosten tarkentamiseksi? Syy on yksinkertainen: raha. Virhemarginaalin puolittaminen vaatisi otoskoon nelinkertaistamista ja kustannukset kasvaisivat samassa suhteessa. Noin tuhannen vastaajan otos on vuosikymmenten saatossa päätetty tarkkuudeltaan median käyttöön riittäväksi kun otetaan huomioon myös mittausten teettämisen kustannus.

Lisäksi on syytä huomioida, että kaikki arvot virhemarginaalin sisällä eivät ole yhtä todennäköisiä. Virhemarginaalin olessa ±2,0 prosenttiyksikköä todellinen arvo on 68 prosentin todennäköisyydellä korkeintaan yhden prosenttiyksikön päässä keskiarvosta.

Alla oleva kuvio esittää vihreiden ja perussuomalaisten kannatuslukujen todennäköisyysjakauman. Todennäköisyys sille, että todellinen kannatusluku osuu kuvion keskellä olevalle tummennetulle alueelle on kussakin tapauksessa n. 4 % ja pienenee siitä etäännyttäessä. Kuvioelementtien kärjet kuvaavat 99,7 prosentin luottamusväliä.

Tämäkään kuvio ei silti vielä anna kovin hyvää vastausta siihen, mikä puolueiden todellinen kannatus on. Ylen yhden puolueen kannatukselle antama, kuviossa tummennettu todennäköisin arvo on aivan Alma Median todennäköisyysjakauman äärilaidalla ja päinvastoin.

Useamman mielipidemittauksen tulosten yhdistäminen

Usein tarkin tulos saadaan kun kahden tai useamman mielipidemittausten sisältämä tieto yhdistetään ja muodostetaan aineistosta uusi kuvio. Tähän on olemassa erilaisia tapoja. Maailmalla toimii useita mielipidemittausten tulosten yhdistelyyn erikoistuneita verkkosivustoja, joita kutsutaan mielipideaggregaattoreiksi (engl. poll aggregator). Ne ovat kehittäneet monimutkaisia, erilaisia paino- ja korjauskertoimia hyödyntäviä menetelmiään tarkoitukseen. Tunnetuin aggregaattoreista lienee FiveThirtyEight, jonka käyttämä malli pyrkii huomioimaan mm. joidenkin tutkimuksia tuottavien organisaatioiden taipumuksen systemaattisesti liioitella republikaanien tai demokraattien kannatusta. (Suomessa julkaistaan mielipidemittauksia niin harvakseltaan, ettei niiden aggregoinnista ole kehittynyt omaa journalismin lajiaan kuten esimerkiksi USA:ssa.)

Yllä olevassa kuviossa mielipidemittausten tulokset on yhdistetty kyselyiden vastaajamäärällä painotettuna, ilman muita kertoimia ja laskettu lopuksi uudet virhemarginaalit yhdistetyn vastaajamäärän mukaan. Laskelman perusteella vihreät olisi siis perussuomalaisia suositumpi, joskaan ei aivan yhtä pitkällä kaulalla kuin Ylen kyselyn alkuperäisten lukujen valossa. Tässä kaikkien puolueiden yhdistetyt luvut:

SDP 20,7 %
keskusta 19,9 %
kokoomus 17,3 %
vihreät 12,5 %
PS 10,3 %
vasemmistoliitto 8,2 %
RKP 4,7 %
KD 3,6 %
muut 2,9 %

Yhdistämiseen käyttämäni laskukaavat ovat hyvin yksinkertaisia:

jne.

Tällaisia yksinkertaisia kaavoja käyttäen laskelman tekeminen on helppoa, ja vaikka sillä onkin puutteensa verrattuna mielipideaggregaattorien käyttämiin hienostuneempiin malleihin, laskelman tulos kertoo kuitenkin puoluekannatuksesta enemmän kuin yksittäinen mielipidemittaus. Kun tämä ei ole tämän vaikeampaa, ihmettelen kyllä vähän, miksi media ei Suomessa vaikuta yhtään kiinnostuneelta tekemään puoluekannatuslaskelmia jotka perustuisivat useampaan kuin yhteen mielipidemittaukseen!

Virhemarginaali antaa liian ruusuisen kuvan mielipidemittauksen luotettavuudesta

Edellä esitetyissä laskelmissa ja mielipidemittauksen tutkimuksen virhemarginaalista puhuttaessa ylipäänsäkin lähdetään implisiittisesti siitä oletuksesta, että tutkimuksen otos on harhaton (engl. unbiased) tai ainakin, että otoksen mahdollinen vinouma on pystytty jollain tavalla oikaisemaan. Näin harvemmin todellisuudessa on.

Harhattomuus tarkoittaa sitä, että ainut tekijä joka vaikuttaa siihen, kenet populaatiosta poimitaan mielipidemittauksen tutkimusotokseen on sattuma. Jos nostamme erivärisiä palloja sisältävästä valtavasta pussista 1 121 palloa ja niistä 133 on vihreitä, voidaan virhemarginaalin laskentakaavaa käyttäen helposti selvittää, että kaikista pussissa olevista palloista on 95 prosentin todennäköisyydellä vihreitä 11,3–15,3 % (13,3 ± 2,0). Virhemarginaali kuvaa siis otantavirhettä (engl. sampling error), eli sitä, että satunnaisotantaan osuu harvoin aivan täsmälleen populaation sisäistä jakaumaa kuvaava joukko kohteita.

Mielipidemittauksiin vastaavat ihmiset eivät kuitenkaan ole yhtä helppo tutkimuskohde kuin pallot, vaan otantavirheen lisäksi tulosta vääristävät erilaiset otosharhat (engl. sampling bias):

  • Tutkimukseen ei ole käytännössä mahdollista poimia satunnaista joukkoa kaikista äänestysikäisistä suomalaisista, vaan otanta joudutaan tekemään esimerkiksi arpomalla haastateltavat numeropalveluun rekisteröityjen puhelinnumeroiden joukosta. Tutkimuksen otantakehikko (engl. sampling frame) on tällöin ne suomalaiset, joilla on julkinen puhelinnumero. Se ei ole täsmälleen sama joukko kuin kaikki äänestysikäiset suomalaiset, mistä johtuen kyselyyn sisältyy peittovirhe (coverage error).
  • Osalla suomalaisista on käytössään useampi kuin yksi puhelinnumero, joten heidän valikoitumisensa puhelinnumeroista arpomalla muodostettuun otokseen on keskimääräistä todennäköisempää. Jotkut taas voivat esimerkiksi vuorotyön vuoksi olla tutkimuksentekoaikana huonosti tavoitettavissa puhelimitse, jolloin heidän valikoitumisensa otokseen on vähemmän todennäköistä. Tällaisten syiden vuoksi puhelimitse tehtävään mielipidemittaukseen sisältyy myös valikoitumisharha (engl. selection bias).
  • Kaikki tutkimukseen valitut eivät syystä tai toisesta halua vastata kyselyyn. Varsinkin verkkokyselyissä vastauskato on yleensä iso ongelma ja sen aiheuttama vinouma (engl. non-response bias) potentiaalisesti suuri.

Otantavirheen ja erilaisten otosharhojen lisäksi tulosta vääristää vielä vastausharha (engl. response bias), joka on kattotermi erilaisille syille, joiden vuoksi osallistujien antamat vastaukset kyselyyn eivät aina täysin vastaa sitä, miten he todellisuudessa ajattelevat tai toimivat. Kaikki eivät esimerkiksi halua myöntää haastattelijalle kannattavansa rasistiseksi väitettyä puoluetta. Toisaalta haastateltava saattaa vastata eri kysymykseen kuin mikä häneltä on kysytty, esimerkiksi kuntavaalikannatusta koskevassa kyselyssä siihen, mitä puoluetta hän äänestäisi eduskuntavaaleissa.

Otantavirhe aiheuttaa mielipidemittauksen tuloksiin epätarkkuutta, jota voi pienentää otoskokoa kasvattamalla. Vinoutunut otos ja vastausharha sen sijaan vääristävät tuloksia usein tavoilla, joiden korjaaminen ei ole näin yksinkertaista. Jos esimerkiksi jonkin puolueen kannattajissa on enemmän vuorotöissä käyviä kuin muiden, tämän puolueen kannattajista valikoituu otokseen helposti todellista kannatusta pienempi osuus ja tämä vääristää puolueen kannatuslukuja.

Mielipidemittausten tekijät pyrkivät korjaamaan otosharhan aiheuttamaa virhettä esimerkiksi käyttämällä yksinkertaisen satunnaisotannan sijaan ositettua otantaa eli kiintiöpoimintaa (engl. stratified sampling), jolla huolehditaan siitä, että kaikkiin merkittäviin sosioekonomisiin ryhmiin (esim. miehet ja naiset, suomen- ja ruotsinkieliset) kuuluvien määrä otoksessa vastaa heidän osuuttaan väestössä. Tällaisista korjaavista toimista huolimatta mielipidemittausten tuloksiin sisältyy aina ilmoitetun virhemarginaalin lisäksi edellä mainittujen tekijöiden yhteenlasketun vaikutuksen aiheuttama metodologinen virhemarginaali. Termin kehittäjä Nate Silver arvioi yhdysvaltalaisissa mielipidemittauksissa sen olevan tavallisesti samaa suuruusluokkaa kuin tavallisen otantavirhemarginaalinkin. Tämä tarkoittaa, että karkeasti arvioiden yksittäisen mielipidemittauksen todellinen virhemarginaali voi olla kaksinkertainen ilmoitettuun nähden.

Tarinan opetus

Mielipidemittausten tuloksiin sisältyy runsaasti epävarmuutta. Todellinen virhemarginaali voi metodologiset tekijät huomioonottaen isoimpien puolueiden osalta olla kaksinkertainen tutkimuksen tekijän ilmoittamaan verrattuna ja osa todellisista kannatusluvuista voi löytyä jopa tämän laajemman virhemarginaalin ulkopuolelta. Niinpä reilusti virhemarginaalin sisään mahtuvat muutokset puolueiden kannatuksessa tai erot niiden keskinäisessä suosiossa ovat todennäköisemmin sattuman aiheuttamaa kuin merkki mistään todellisesta ilmiöstä, eikä niillä ole juurikaan uutisarvoa. Parempi käsitys puolueiden kannatuksesta saadaan, kun useampien mielipidemittausten tulokset yhdistetään.

Maarten Lambrechtsin mainio Rock ’n Poll -sivusto auttaa hahmottamaan, miten paljon otantavirhe vaikuttaa mielipidemittausten tuloksiin. Jokaisen politiikan toimittajan kannattaisi vilkaista sitä ennen kuin kirjoittaa uutisena, miten jonkin puolueen kannatus on muuttunut 0,4 prosenttiyksikköä edellisestä vertailusta.