yhteiskunta – Informaatiomuotoilu.fi

2023-12-20

Myös Tampereen katutilasta enin osa on varattu autoille

Rengaskuvio katutilan jakautumisesta Tampereella, koko kaupunki:
Autoilu 69 %, pysäköinti 4 %, joukkoliikenne 3 %, Jalankulku 8 %, pyöräily 2 % sekä yhdistetty pyöräily ja jalankulku 14 %.

Tampereen katutilasta arviolta 73 % on varattu käytännössä autoille. Kävelylle ja pyöräilylle on osoitettu katutilasta selvästi pienempi siivu, 24 %. Joukkoliikenteelle jää vaivaiset 3 % ratikan liikennöinnin aloitettuakin. Helsinkiin verrattuna yhdistetyn pyöräilyn ja jalankulun osuus on selvästi isompi.

Tämä kirjoitus on jatkoa Helsingistä tehdylle analyysille ja pohjautuu samaan metodologiaan sekä vertauskelpoisiin aineistoihin. Taustaoletuksia ja metodologiaa on kuvailtu tarkemmin Helsinkiä koskevassa artikkelissa. Kuvat on alun perin julkaissut Oras Tynkkynen toukokuussa 2023 silloisessa Twitterissä sekä blogikirjoituksena Jaakko Stenhällin kanssa otsikolla “Katutilaa autoilta ihmiselle”.

Tampereen keskustassa kulkumuotojen välset suhteet jakautuvat hieman tasaisemmin. Autoilulle on varattu 58 %, kun kävelylle ja pyöräilylle jää 38 %. Joukkoliikenteen osuus on 4 %.

Rengaskuvio katutilan jakautumisesta Tampereella, vain keskusta:
Autoilu 48 %, pysäköinti 10 %, joukkoliikenne 4 %, Jalankulku 22 %, pyöräily 4 % sekä yhdistetty pyöräily ja jalankulku 12 %.

Myös Tampereella autoilu vie hyvin suuren osan katutilasta, jos vertailee autolla tehtyjen matkojen määrään. Koska autolla tehdään pidempiä matkoja kuin jalan tai pyörällä, ero henkilökilometreissä on pienempi.

Prosenttipylväskuvio katutilan jakautumisesta Tampereella verrattuna kulkumuotojakaumaan (matkojen lukumääräinen osuus). Katutila, koko kaupunki:
Autoilu 69 %, pysäköinti 4 %, joukkoliikenne 3 %, Jalankulku 8 %, pyöräily 2 % sekä yhdistetty pyöräily ja jalankulku 14 %.
Katutila, vain keskusta:
Autoilu 48 %, pysäköinti 10 %, joukkoliikenne 4 %, Jalankulku 22 %, pyöräily 4 % sekä yhdistetty pyöräily ja jalankulku 12 %.
Kulkumuotojakauma, koko Tampere:
Autoilu 43 %, joukkoliikenne 13 %, jalankulku 34 %, pyöräily 8 %, muu 2 %. — Kulkumuotojakauman tiedot perustuu Henkilöliikennetutkimukseen 2021 ja sisältävät siten tamperelaisten tekemät matkat myös kaupungin ulkopuolella.

Kuten Helsinginkin tapauksessa, nämä luvut ovat vain arvioita, sillä suoraa valmista dataa ei ole saatavilla. Niistä saa kuitenkin hyvän suuntaa antavan käsityksen siitä, kuinka eri kulkumuotoja on priorisoitu kaupunkitilassa. Ajoratoja käyttää toki myös julkinen liikenne sekä pienemmässä määrin polkupyörät.

2023-12-202023-12-20

Helsingin kantakaupungin katutilasta ylivoimaisesti suurin osa on varattu autoilijoiden käyttöön

Rengaskuvio katutilan jakautumisesta Helsingissä, koko kaupunki. Jakauma on: Autoilu 72 %, pysäköinti yli 3 %, pyöräily 2 %, yhdistetty pyöräily ja jalankulku 8 %, jalankulku 7 %, joukkoliikenne 2 %.

Koko Helsingin katutilasta (ylempi grafiikka) noin 75 % ja kantakaupungin katutilasta noin 63 % on varattu autoille (alempi grafiikka). Luvut eivät ole täysin tarkkoja, koska joukkoliikenteen käytössä olevan osuuden suuruudesta ei ole käytettävissä tietoja. Autoilun osuus on siis se osa katualueesta (ei ajoradasta), joka ei ole varattu muuhun käyttöön. Katualueeseen kuuluu ajoradan lisäksi esim. kaistojen välinen alue moottoriliikenneteillä.

Tämä teksti on hiukan muokattu ja korjattu versio entisessä Twitterissä toukokuussa 2023 julkaistusta langasta. Helsinkiä koskevan analyysin rinnalle tehtiin myös vastaava Tampereen katutilasta.

Ylipäänsä katutilan määrittely rekisteriaineistojen perusteella on yllättävän vaikeaa! Olemme käyttäneet seuraavaa rajausta: mukana ovat kaikki katualueeksi yleisten alueiden rekisterissä määritellyt alueet sekä kevyen liikenteen väylistä ne, jotka eivät kulje puistoissa. Joukkoliikenteen käytössä olevaksi on arvioitu HKL:n, HSL:n tai Liikenneviraston huoltovastuulla olevat katuosat, joka sisältää mm. muusta liikenteestä erotellut raitiovaunukiskot ja raitiovaunupysäkit. Tämän lisäksi on arvioitu bussikaistojen ja -pysäkkien viemä tila.

Bussikaistojen kokonaismääräksi Helsingissä on Jere Laineen kandidaatintyöstä saatu 44 km, mutta ei ole tietoa, miten tämä jakautuu kantakaupungin ja esikaupunkien välillä. Olemme olettaneet, että bussikaistoista 1/3 on kantakaupungissa ja että niiden leveys on keskimäärin 3,5 metriä. Bussipysäkkien kokonaismäärä ja jakautuminen on tiedossa, mutta niiden viemä tarkka pinta-ala ei tiedetä. Tässä on arvioitu, että kukin bussipysäkki vie keskimäärin 50 m² ajoradalta ja 10 m² jalkakäytävältä. Pysäköintipaikkojen viemän tilan osuus on tässä arviossa koko kaupungin osalta liian pieni, sillä käytettävissä olevassa aineistossa ei ole mukana asukaspysäköintivyöhykkeen ulkopuolella sijaitsevia kadunvarsipaikkoja.

Autoilulle varattu osuus katutilasta on sekä kantakaupungissa että koko Helsingissä selvästi suurempi kuin autoilun osuus kaupungissa tehdyistä matkoista, kuten alla olevasta grafiikasta ilmenee.

Varattu osuus katutilasta verrattuna matkojen kulkutapajakaumaan, prosenttipylväskuvio.

Koko Helsinki:
Katutila 72 % autoilu plus 3 % pysäköinti – kulkutapaosuus 21 %. Joukkoliikenne 2 %, kulkutapaosuus 24 %. Jalankulku 12 % plus 8 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 47 %. Pyöräily 2 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %.

Vain kantakaupunki:
Katutila 54 % autoilu plus 9 % pysäköinti – kulkutapaosuus 12 %. Joukkoliikenne 5 %, kulkutapaosuus 25 %. Jalankulku 22 % plus 6 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 53 %. Pyöräily 4 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %. — Aineistona yllä olevassa grafiikassa on Helsinkiläisten liikkumistottumukset 2022 -selvitys, jossa ovat mukana helsinkiläisten Helsingin sisällä tekemät matkat.

Varattu osuus katutilasta verrattuna matkasuoritteeseen, prosenttipylväskuvio.

Koko Helsinki:
Katutila 72 % autoilu plus 3 % pysäköinti – matkasuorite 63 %. Joukkoliikenne 2 %, suorite 21 %. Jalankulku 12 % plus 8 % yhdistettyä pyöräilyn kanssa, suorite 7 %. Pyöräily 2 % ja suorite 3 %. Muu suorite 6 %.

Vain kantakaupunki:
Katutila 54 % autoilu plus 9 % pysäköinti – kulkutapaosuus 12 %. Joukkoliikenne 5 %, kulkutapaosuus 25 %. Jalankulku 22 % plus 6 % yhdistettyä pyöräilyn kanssa, kulkutapaosuus 53 %. Pyöräily 4 % ja kulkutapaosuus 10 %. Muu kulkutapa 1 %.

Suhteutettuna matkasuoritteeseen eli kullakin kulkuneuvolla tehtyjen matkojen pituuteen jakauma vaikuttaa tasaisemmalta. On kuitenkin huomioitava, että tässä käytetyssä aineistossa (Henkilöliikennetutkimus 2021) matkat on eroteltu vain vastaajan kotipaikan mukaan.

Toisin sanoen mukana ovat kaikki helsinkiläisten tai kantakaupungissa asuvien tekemät matkat, tapahtuivat ne missä päin Suomea hyvänsä. Mukana ovat myös pitkät lomamatkat, mikä näkyy esim. kategorian ”muu” (joka sisältää moottoripyörät ja matkailuautot) suuruutena. Kuten Henkilöliikennetutkimuksesta selviää, suomalaiset tekevätkin varsin paljon pitkiä matkoja autolla. Koko maassa 20–150 km mittaisilla matkoilla henkilöauto on täysin dominova kulkutapa, osuus on 93 % – 94 %. Aineistoa matkasuoritteen jakautumisesta kulkutavoittain Helsingin sisällä ei valitettavasti ole saatavilla.

Post scriptum

Muutama sananen siitä, miksi tämä laskelma antaa varsin erilaisen lopputuloksen kuin aiemmin tekemässämme grafiikassa katutilan jakautumisesta Helsingin kantakaupungissa. Uuden laskelman tekemiseen ryhdyttiin, jotta saataisiin lukuja, jotka ovat vertailukelpoisia muihin Suomen kaupunkeihin. Sitä tehdessä pyrittiin huomioimaan Twitterissä laskelmaa kohtaan esitetty kritiikki ja huomioimaan aiempaa paremmin joukkoliikenteen osuus.

Laskelma tehtiin alusta asti uusiksi ja siinä hyödynnettiin dataa aiempaa hienojakoisemmin. Alueiden pinta-alat laskettiin yhteen jo paikkatieto-ohjelmistossa kuin aikaisemmassa versiossa lopullinen yhteenlasku tapahtui Python-koodin avulla. Alkuperäinen laskelma ei ole säilynyt aivan kokonaisuudessaan, mutta säilyneiden tietojen perusteella siinä vaikuttaa olevan kaksi keskeistä virhettä.

Tekemämme Python-koodi laski kevyen liikenteen väylistä virheellisesti yhteen vain puhtaanapitovyöhyke 1:een (ydinkeskusta ja turistikohteet) kuuluvat alueet. Tämä alue on pienempi kuin koko kantakaupunki, joten kevyen liikenteen väylien pinta-ala jää näin liian pieneksi
Kadunvarsipysäköinnin vaatima tila perustuu ilmeisesti arvioon, joka on selvästi liian suuri. (Tämä laskelma ei valitettavasti ole säilynyt.) Tämä virhe ei vaikuta autoille varatun tilan suuruuteen, vaan ainoastaan siihen miten se jakautuu ajoradan ja pysäköinnin kesken.

Laskelmien tuloksissa on muitakin pieniä eroja, jotka selittyvät lähinnä datan hienojakoisempien tietojen tarkemmalla hyödyntämisellä ja todellisilla muutoksilla katutilassa (esim. uudet pyöräväylät), mutta nämä kaksi virhettä selittävät suurimman osan eroista.

2022-02-202022-02-22

MTK:n ruokakassivertailu on tyylipuhdasta datavaikuttamista

Kirjoitus on yhteenveto alunperin Twitterissä julkaistusta viestiketjusta.

Opetan XAMKin data-analytiikan koulutusohjelmassa kurssia ”Ajankohtaiset kysymykset ja datavaikuttaminen”, joka käsittelee mm. sitä, miten valtiot, yritykset ja järjestöt käyttävät dataa mielipiteenmuokkauksen ja lobbauksen välineenä. MTK:n viime viikolla julkistama ruokakassivertailu on tyylipuhdas esimerkki tällaisesta datavaikuttamisesta ja toimi kurssillamme erinomaisena case-esimerkkinä. Samalla se osoittaa kuitenkin myös kiinnostavasti, että vaikuttaminen ei aina mene putkeen.

MTK julkisti keskiviikkona 9.2. selvityksen, jossa vertailtiin neljän S-ryhmän ostosdataan perustuvan ruokakassin sekä viidennen, suomalaisiin ravitsemussuosituksiin perustuvan kassin päästöjä niiden sisältämiin ravintoarvoihin suhteutettuna. Viestinnälliseksi kärjeksi oli nostettu, että ravitsemussuositusten mukainen sekasyöjän ruokakassi aiheutti ravintosisältöönsä verrattuna täpärästi pienemmät päästöt kuin kasvispainotteinen, alle 34-vuotiaiden kaupunkilaisten ostosten perusteella muodostettu kassi.

Tähän media tarttui hanakasti. STT:n juttu selvityksestä oli otsikoitu ”Selvitys: Sekasyöjän ruuasta vähiten päästöjä – jos päästöt suhteutetaan ravintoaineiden saantiin”. Jotkut lehdet, esimerkiksi Karjalainen, lyhensivät sen muotoon ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Sanomalehti Karjalaisen painetussa versiossa 10.2.2022 julkaistu artikkeli, joka on otsikoitu ”Sekasyöjän ruuasta aiheutuu vähiten päästöjä”.

Selvityksen alkuperäinen, varsin maltillinen löydös paisui matkalla siis melkoisiin mittoihin. MTV3:n uutiset sai sen pyöräytettyä peräti muotoon ”Sekasyönti onkin ilmastoteko”.

Otsikoinnilla on suuri merkitys, sillä moni meistä ei vaivaudu lukemaan otsikkoa pitemmälle varsinkaan silloin, kun se tukee omia ennakokäsityksiä. Pelkän otsikon perusteella innostuivat twiittaamaan niin tavalliset pulliaiset kuin kansanedustajatkin.

Ruutukaappaus kansanedustaja Mikko Kärnän twiitistä. Teksti: "Kappas. Veganismi näyttää olevan ilmastolle haitallisempaa kuin sekasyönti. Ehkä tämä nyt vähentää vegaanista moraalisäteilyä ja lisää sekaruokavalion arvostusta.”

Jos selvityksen materiaalit lukee huolella, selviää kuitenkin, että yksikään vertailussa mukana olleista ruokakasseista ei ollut vegaaninen vaan myös 34-vuotiaiden kaupunkilaisten ostoksiin perustuvassa kassissa oli mukana kalaa ja kananmunia. Tämä huomattiin somessa nopeasti. Media joutuikin pian korjailemaan uutisointia. Varsinaisia oikaisuja ei ole omiin silmiini sattunut, mutta ainakin MTV3 ”tarkensi” uutistaan varsin näkyvästi. STT laati uuden, alkuperäistä selvästi laajemman jatkojutun, jonka monet lehdet julkaisivat. Tämä saattoi olla viestinnällisesti oma maali MTK:lle, sillä alkuperäisen uutisen väitteet kiistävä jatkojuttu tavoitti luultavasti alkuperäistä enemmän lukijoita. Myös somessa huomio oli voittopuolisesti negatiivista.

Korjatustakin uutisoinnista voi kuitenkin jäädä käsitys, että lihaton ja maidoton ruokakassi ei olisi ilmastovaikutuksiltaan lihaa ja maitotuotteita sisältävää, ravitsemussuositusten mukaan koottua kassia parempi. Tämä ei pidä paikkaansa. MTK:n käyttämä tapa laskea ruuan ravintoainetiheyttä on tarkoitushakuinen ja liioittelee eläinperäisten tuotteiden ravintoarvoja. Kuvaan seuraavassa, miten se toimii ja kuinka se tuottaa sopivilla valinnoilla absurdeja tuloksia.

Laskelman on MTK:lle tuottanut Envitecpolis-konsulttiyhtiön asiantuntija Senja Arffman. Se perustuu ilmeisesti alkujaan Arlan tilaamaan työhön, josta muokattiin MTK:n tarpeisiin sopiva alkujaan vuonna 2020, jolloin vertailtiin broileri- ja sushiaterian päästöjä. Jo tuolloin laskelma oli laadittu ilmeisen tarkoitushakuisesti ja se saikin osakseen laajaa kritiikkiä, jota on hyvin koottu yhteen Ruokamysteerit-blogissa. Kriittisiä kommentteja esittivät tuolloin mm. ravitsemusasiantuntija Mikael Fogelholm ja ilmastoasiantuntija Oras Tynkkynen.

Vuoden 2020 indeksi laskettiin vertaamalla annosten sisältämien vitamiinien ja kivennäisaineiden määrää per 100 g ravitsesuosituksen mukaiseen päivän saantisuositukseen. Energiaravintoaineiden osalta vertailukohtana oli se, mikä osuus ravinnosta saatavasta energiasta (E%) tulisi vähintään saada kustakin ravintoaineesta per 1 000 kcal. Kummassakin tapauksessa pudotettiin pois sellaiset ravintoaineet, joiden saanti oli alle 15 % suosituksesta. Raja on valittu mielivaltaisesti ja vaikuttaa tarkoitushakuiselta, sillä se suosii eläinperäisiä tuotteita kasviraaka-aineiden kustannuksella. Lisäksi laskutapaa kritisoitiin siitä, että energiaravintoaineista mukana oli vain proteiini ja välttämättömät rasvahapot. Suomalaiset saavat ruuasta THL:n FinRavinto 2017 -tutkimuksen mukaan liikaa proteiinia, kun taas hiilihydraatin ja kuidun saanti on riittämätöntä.

Taulukko, joka kuvaa suomalaisten ravintoaineiden saantia FinRavinto 2017 -tutkimuksen mukaan ja sitä, ovatko ne mukana MTK:n ravintotiheysvertailuissa. Proteiinia ruuasta saadaan liikaa, mutta se on vertailussa mukana, kun taas hiilihydraatit ja rasva eivät ole, vaikka hiilihydraatteja suomalaiset saavat ravinnosta liian vähän. Kuitu, jota saadaan liian vähän ei myöskään ollut mukana vuoden 2020 vertailussa, mutta on lisätty mukaan 2022 vertailuun. — *Ravintoaineet, niiden saanti FinRavinto 2017 -tutkimuksen mukaan sekä mukanaolo MTK:n ravintoainetiheysindeksissä.*

Uuteen laskelmaan on kriittisen palautteen myötä otettu kuitu mukaan ja huomioitu rasvahappojen saannin osalta myös rasvan laatu (kovat/pehmeät).

MTK:n viime viikolla julkistama laskelma vertaa siis viittä ostoskassia, joista neljä on muodostettu S-ryhmän ostosdatan ja viides ravitsemussuositusten perusteella. Kassien kooksi on vakiotu 15 kg, mutta niiden sisältämä energiamäärä vaihtelee huomattavasti, mikä tuntuu erikoiselta ratkaisulta.

Eri ruokavalioiden ilmastovaikutuksia on aiemmin tutkittu sekä kansainvälisesti (esim. Scarborough et al. 2014) sekä Suomessa, jossa Luke ja Suomen ympäristökeskus tuottivat valtioneuvoston selvitys- ja tutkimustoiminnan (VNTEAS) hankkeena, vuonna 2019 valmistuneen laajan aiheitta käsittelevän RuokaMinimi-tutkimuksen. Tutkimustietoa aiheesta siis on ja sen sanoma on jokseenkin yksiselitteinen. Kuten Luken vanhempi tutkija Juha-Matti Katajajuuri STT:n haastattelussa toteaa: kasvisruoka on yksiselitteisesti ilmastoystävällisin ravinnonlähde. Mitä uutta MTK:n selvitys kysymykseen siis tuo?

Senja Arffmanin mukaan tarkoituksena ei ole ollut vertailla ruokavalioita vaan ostoskäyttäytymistä, mutta tämä tuntuu selittelyltä, varsinkin kun koko tutkimuksen pihvi on ostoskassien sisällön suhteuttaminen ravitsemussuositusten ideaaliarvoihin. Vähintään tutkijan pitäisi pystyä perustelemaan, miksi hänen mentelmänsä tuottaa tieteellisen konsesuksen kanssa selvässä ristiriidassa olevia tuloksia. Tulokset pitäisi myös julkistaa niin, ettei tutkimuskohteesta jää epäselvyyttä.

Todellisuudessa kyse lienee pikemminkin siitä, että MTK haluaa eläintuottajien tukemiseksi hämmentää disinformaatiolla ruuan ympäristövaikutuksista käytävää keskustelua samaan tapaan kuin tupakkateollisuus aikanaan sotki keskustelua tupakan terveyshaitoista. Siksi pidän tarpeellisena nostaa esiin miten tarkoitushakuisella laskentamenetelmällä MTK:n kauppakassivertailu on toteutettu.

Käytetty laskutapa ei ilmene MTK:n omista materiaaleista, mutta Envitecpoliksen blogissa se kuvaillaan – ainakin jollain tarkkuudella.

Ruutukaappaus Envitecpoliksen esityksestä, jossa selitetään ravintotiheyspisteiden laskutapa. Selitys on hieman monitulkintainen.

Ymmärrän blogista löytyvän kuvailun perusteella menetelmän olevan seuraava:

Verrataan kunkin kassissa olevan ruoka-aineen jokaisen ravintotekijän määrää per 1 000 kcal kyseisen ravintotekijän ravitsemussuositusten mukaiseen minimiravintoaihetiheyteen per 1 000 kcal (Suomalaiset ravitsemussuositukset 2014, Liite 6, s. 51)
Jos ravintotekijän määrä ruoka-aineessa on vähintään ravitsemussuositusten mukaisen kynnysarvon verran, lisätään prosenttiluku (joka on aina vähintään 100 %) ”ravintoainetiheyspisteisiin”

Ongelmana vain on, että tällä tavoin lasketut ruokakassien pistemäärät ovat n. 50× suurempia kuin tutkimuksen julkistustilaisuuden esittelymateriaalien sivulla 7 kuvatut ravintotiheyspistemäärät!

Kokeilin miettiä muita mahdollisia tulkintoja blogissa kuvaillulle laskentamenetelmälle, mutta mikään keksimäni laskentatapa ei tuota julkistusmateriaalia vastaavia pisteitä, vaan kaikilla eri tavoilla lasketut pisteet ovat huomattavasti suurempia kuin esittelymateriaaleissa mainitut ravintotiheyspisteet.

Koska edellä kuvatulla tavalla lasketut pisteet ovat kuitenkin suunnilleen samassa suhteessa toisiinsa kuin selvityksen materiaaleissa ilmoitetut pisteluvut – tarkoittaen, että esimerkiksi alle 34-vuotiaiden kaupunkilaisten ostoskassin pisteet ovat suuruusluokkaa kaksinkertaiset yli 64-vuotiaiden maaseudulla asuvien ostoskassin pisteisiin – oletan, että selvityksessä käytetty laskentatapa on suunnilleen yllä kuvatun kaltainen ja tuo n. 50-kertainen ero johtuu jostakin pisteille laskemisen jälkeen tehdystä normalisoinnista, jota ei ole menetelmän kuvauksessa mainittu. Näin ollen oletan, että yllä kuvattu menetelmä tuottaa ainakin suhteellisesti oikean suuruisia lukemia, vaikka absoluuttiset pistemäärät poikkeavat huomattavasti ilmoitetuista. (Mikäli tämä oletus on väärä, myös osa kirjoituksen loppuosan johtopäätöksistä saattaa olla virheellisiä.)

Käytetyssä laskentatavassa on ainakin kaksi perustavanlaatuista ongelmaa:

Elintarvikkeen määrä ostoskassissa ei vaikuta mitenkään sen saamiin pisteisiin.
Menetelmä suosii elintarvikkeita, joissa on huomattavan suuria määriä yksittäisiä ravintoaineita monipuolisuuden kustannuksella ja ravintoaineen lisääminen parantaa aina tuloksia, vaikka sitä olisi kassissa entuudestaan jo riittävästi.

Koska vertailu perustuu ruoka-aineen ravintoainetiheyteen per 1 000 kcal, ei ole väliä onko sitä kassissa 50 g vai 5 kg – riittää että ruoka-aine on ylipäänsä mukana kassissa. Sen määrä vaikuttaa kuitenkin kassin ilmastopäästöihin, mikä antaa mahdollisuuden pelata luvuilla. Kassithan eivät perustu todellisiin ostoksiin, vaan ”eri ruoka-aineryhmien painottumiseen ostajaprofiileissa” ja ”profiilien suosituimpiin ruokavalintoihin ruoka-aineryhmittäin”. Tämä jättää liikkumavaraa kassin sisällön painottamiselle tarkoitushakuisesti.

(Jo vertailu kasvispainotteisen ja ravitsemussuositusten mukaisen kassin välillä perustuu tarkoitushakuisiin valintoihin, sillä kuten selvityksen taustamateriaaleissa todetaan myös alle 34-vuotiaiden kaupunkilaisten ostoksissa on todellisuudessa mukana paljon liha- ja maitotuotteita.)

Vaikuttaa tarkoitushakuiselta, että vaikka muiden kassien paino on 15 kg, ravitsemussuositusten mukaisen kassin sisältämien elintarvikkeiden kokonaispaino on vain 13,5 kg. Näin kassin ilmastopäästöt on saatu pienemmiksi ilman, että tämä vaikuttaisi ravitsemusarvoihin.

Vertailussa pisteitä saa korkeasta ravintoainetiheydestä, ei monipuolisuudesta. Elintarvike, jonka yhden ravintoaineen tiheys ylittää vertailuarvon moninkertaisesti tuottaa enemmän pisteitä kuin ruoka-aine, jossa monen tiheys jää täpärästi rajan alle. Esimerkiksi juustonaksujen ja perunalastujen ravintoainetiheys vastaa tällä laskutavalla ruisleipää ja vitaminoitu energiajuoma pieksee kalan ja lihan sekä monet vihannekset ja hedelmät. Kahvi ja aromisuola ovat varsinaisia superfoodeja.

Niinpä suunnilleen samaan ravintoainetiheyteen vertailussa mukana olleen lapsiperheen ostoskassin kanssa päästään esim. seuraavalla ”poikamiehen ostoskassilla”:

herkkusienipizza
soijanakki
tonnikalasäilyke
tumma makaroni
ranskanleipä
suklaa–mansikkamuro
suolapähkinä
perunalastu
juustonaksu
vähärasvainen kermaviili + dippijauhe
ketsuppi
hampurilaiskastike
soijakastike
sweet & sour -kastike
sipulirouhe
valkosipulimurska
aromisuola
energiapatukka
energiajuoma
kaakaojuoma
kahvi
I-olut

On selvää, että yllä kuvattu ruokakassi ei ole ravitsemuksellisesti laadukas. Se sisältää kuitenkin vain vähän eläintuotteita, joten mikäli kassille laskettaisiin myös ilmastopäästöt, se saattaisi saada suunnilleen yhtä hyvän ”CO2-ravintotiheysindeksin” kuin ravitsemussuositusten mukainen kassi.

Koska tutkimuksessa käytettyjä menetelmiä ei ole kuvattu läpinäkyvästi olen saattanut laskea edellä väärin. On kuitenkin selvää, että käytetty menetelmä on altis tietoiselle manipuloinnille ja vaikuttaa siltä, että sitä on myös harjoitettu halutun tuloksen saamiseksi.

MTK on lobbausjärjestö, joka puolustaa jäsentensä etuja tarvittaessa keinoja kaihtamatta (lain puitteissa tietenkin). Siksi heitä on mielestäni turha syyllistää tästä tutkimuksesta. Oma syyttävä sormeni osoittaa ennemminkin mediaan, joka uutisoi siitä kritiikittä. Kun etujärjestö julkaisee selvityksen, joka vaikuttaa haastavan koko vakiintuneen tieteellisen konsensuksen, olisi syytä muistaa Journalistin ohjeiden 12. kohta: ”Tietolähteisiin on suhtauduttava kriittisesti. Erityisen tärkeää se on kiistanalaisissa asioissa, koska tietolähteellä voi olla hyötymis- tai vahingoittamistarkoitus.” Toimittajien pitäisi yllättävän tutkimustuloksen kohdatessaan haastaa tiedontuottajaa enemmän. Miten tulokset on saatu? Miksi ne ovat ristiriidassa aiemman tiedon kanssa?

Mielestäni toimittajien pitäisi olla rohkeampia kyseenalaistamaan myös numerotietoja jos he mielivät toimia ”vallan vahtikoirana”. Olen kirjoittanut tästä aiheesta jutun myös Journalisti-lehteen, otsikolla ”Toimittajat pelkäävät numeroita, kirjoittaa datajournalisti Juuso Koponen”.

2019-04-122019-04-13

Näiden vaalien tuloksen ennustaminen on tavallistakin vaikeampaa

Sunnuntaina järjestettävien eduskuntavaalien tulosta on totuttuun tapaan spekuloitu ennakkoon ahkerasti. Ennustaminen on aina vaikeaa, erityisesti tulevaisuuden, mutta tällä kertaa vaalituloksen ennustaminen on tavallistakin hankalampaa.

Puolueiden kannatusta mittaavien mielipidekyselyiden tulokset antavat toki jonkinlaista osviittaa mahdollisesta vaalituloksesta. Yhdistämällä viimeisimpien Ylen, Helsingin Sanomien ja Alma Median gallupien tulokset saadaan seuraavanlainen tulos:

	Kannatus	Virhemarginaali
SDP	19,4 %	±1,3 %
kokoomus	16,8 %	±1,2 %
PS	14,9 %	±1,2 %
keskusta	14,5 %	±1,2 %
vihreät	12,5 %	±1,1 %
vasemmistoliitto	9,1 %	±0,9 %
RKP	4,4 %	±0,7 %
KD	4,2 %	±0,7 %
siniset	1,3 %	±0,4 %
muut	2,9 %	±0,6 %

(Mielipidemittausten tulosten yhdistämistä ja puoluekohtaisen virhemarginaalin laskemista käsitellään lähemmin tässä artikkelissa.)

Vaikka tulokseen liittyy epävarmuustekijöitä, uskon, että lopullinen valtakunnallinen tulos on luultavasti melko lähellä tätä.

Eduskunnan paikkajakoa ei kuitenkaan ratkaise puolueiden valtakunnallinen äänisaalis, vaan se, kuinka paljon ääniä niille kussakin vaalipiirissä kertyy. Tämän ennustaminen on aina vaikeaa, mutta erityisen hankalaa näissä vaaleissa, sillä mukana on suuri määrä uusia tai sitten viime vaalien kannatustaan kasvattaneita pienpuolueita, joiden vaikutusta on hyvin vaikea arvioida. Erityisen hankalaksi asian tekee se, että moni nykyinen kansanedustaja, mukana muutamia viime vaalien ääniharaviakin, on näissä vaaleissa valtakunnallisesti alle parin prosentin kannatuksen kellottavan puolueen ehdokkaana.

Yle ja Vihreä Lanka ovat molemmat laatineet omat ennusteensa paikkajaosta, mutta kumpikaan niistä ei ole metodologisesti tyydyttävä. Yle ei avaa lainkaan esimerkiksi sitä, millä perusteella kannatus on jyvitetty vaalipiireittäin ja miten puoluekentän muutokset on ennusteessa huomioitu – vai onko mitenkään. Vihreä Lanka on kiitettävän avoin käyttämästään mallista, mutta kuvauksen perusteella mallissa on ilmeisiä katvealueita.

Päätin yrittää itse kokeilla mallinnusta, joka huomioisi puolueiden valtakunnallisten kannatuslukujen lisäksi Turun Sanomien, Satakunnan Kansan, Kymen Sanomien, Karjalaisen, Savon Sanomien, Kalevan ja Lapin Kansan teettämät vaalipiirikohtaiset mielipidemittaukset ja vaaliliitot, ja ottaisi jollain tapaa huomioon myös kansanedustajien puolueenvaihdokset vaalikauden aikana.

Tehtävä osoittautui hankalaksi. Suurin ongelma on datan puute. Vaalipiirikohtaisia mielipidemittauksia ei ole tehty kaikissa vaalipiireissä, ja useimmissa paikallisissa gallupeissa otoskoko on joko naurettavan pieni tai sitä ei ole edes ilmoitettu.

Valtakunnallisen kannatuksen jyvittämisessä vaalipiireihin hyödynsin tietoa kansanedustajien vuoden 2015 vaaleissa saamista henkilökohtaisista äänimääristä, niin että esimerkiksi Harry Harkimon Uudellamaalla saama äänimäärä vähennettiin Uudenmaan kokoomuksen potista ja lisättiin Liike Nytille. Samoin toimittiin sinisen eduskuntaryhmän kansanedustajien kohdalla, joiden saamat äänet vähennettiin perussuomalaisten potista. Paavo Väyrynen on sen sijaan hankalampi tapaus, sillä hän on vaihtanut paitsi puoluetta, myös vaalipiiriä. Tein lopulta Lapin Kansan mielipidemittauksen perusteella – se ei ennusta järin suurta kannatusta eduskunnan ulkopuolisille puolueille Lapin vaalipiirissä – sellaisen melko mielivaltaisen päätöksen, että jyvitin vain kolmasosan Väyrysen saamista äänistä Seitsemän Tähden Liikkeelle.

Hyvin äkkiä huomasin, että kun dataa on vähän, erilaisia painokertoimia ja oletuksia tarvitaan paljon, eikä niille löydy kovin hyviä perusteluita, vaan ne jäävät tyypillisesti aika mielivaltaisiksi. Miten esimerkiksi pitäisi painottaa vaalipiirikohtaista mielipidemittauksen tulosta suhteessa valtakunnalliseen? (Pelkkiin vaalipiirikohtaisiin kyselyihin en halunnut luottaa silloinkaan kun sellainen oli saatavilla, sillä niiden otoskoot olivat yleensä varsin pieniä, ja monet on julkaistu ennen perussuomalaisten viimeaikaista gallupnousua.) Päädyin käyttämään paikallisen gallupin vastaajaluvun parina lukua, joka on muodostettu jakamalla valtakunnallisten gallupien yhteenlaskettu vastaajamäärä (3 554) kahdella sadalla ja kertomalla tämä sitten vaalipiirin kansanedustajapaikkojen määrällä. Esimerkiksi Oulun vaalipiirissä painotin siis Kalevan gallupia, jossa kantansa ilmaisi 368 vastaajaa suhdeluvulla 368 / 320, jossa 320 on saatu laskukaavalla 3 554 ÷ 200 × 18.

Näillä oletuksilla paikkaennuste on seuraava:

SDP	45	(+10)
kokoomus	35	(–3)
PS	32	(+15)
keskusta	32	(–16)
vihreät	24	(+9)
vasemmistoliitto	16	(+4)
RKP (sis. Ahvenanmaan edustajan)	9	(–1)
KD	6	(+1)
Liike Nyt	1	(–1)
siniset	0	(–17)
muut	0	(–1)

(Suluissa muutos suhteessa tämänhetkisen eduskunnan kokoonpanoon.)

Kuinka varma tämä tulos on? Hyvin epävarma.

Kokeilin simuloida vaalitulosta siten, että kunkin puolueen äänimäärä vaihtelisi vaihtelisi hieman lasketun keskiennusteen ympärillä. Tässä hankalaksi kysymykseksi muodostui se, mikä olisi oikea tapa määritellä satunnaismuuttujan hajonta, kun data ei ole yhteismitallista eikä kaikilta osin kovin laadukasta. Menemättä yksityiskohtiin, kokeilin runsaasti kaikenlaisia vaihtoehtoja saavuttamatta kovin tyydyttävää tulosta, tai kykenemättä esittämään hyviä perusteluita sille, miksi juuri tämä tai tuo painotus tai kerroin olisi sen perustellumpi kuin joku toinen.

Ohessa esimerkki yhden simulaation tuloksista. Tässä ”vaali” siis ajettiin 20 000 kertaa läpi hieman satunnaisesti varioiden kunkin puolueen kussakin vaalipiirissä saamaa äänimäärää:

Kuten kuvasta näkyy, hajonta on useimpien puolueiden osalta kuin haulikolla ammuttu. Kiinnostavasti juuri minkään puolueen kohdalla aiemmin laskettu todennäköisin arvo ei ole hajonnan keskellä, eivätkä useimmat käppyrät muutenkaan vaikuta normaalisti jakautuneilta. Kyse voi toki olla virheestä hätäisesti kyhätyssä koodissani – tämä ei yllättäisi minua lainkaan –, mutta datan lähempi tarkastelu viittaa toiseenkin mahdolliseen selitykseen: todella monessa vaalipiirissä viimeisestä 1–2 paikasta tullaan käytössä olevien lukujen valossa käymään todella kova kisa.

Oman analyysini pohjalta uskallan veikata sunnuntain vaalituloksesta vain, että se tulee sisältämään yllätyksiä. Millaisia, se jää nähtäväksi. Odotus ei onneksi ole enää pitkä.

Artikkelia muokattu 13.4.2019 klo 12:54: Korjattu ennustettujen kansanedustajapaikkojen määrää koskevassa taulukossa virheelliset muutos nykyiseen eduskunnan kokoonpanon -tiedot.

2017-02-082017-02-09

Puoluekannatus ja virhemarginaalit

Alma Media ja Yle julkistivat joulukuun lopulla peräkkäisinä päivinä puolueiden kuntavaalikannatusta koskevat mielipidemittauksensa. Tietoykkönen Oy:n Almalle toteuttaman kyselyn haastattelut tehtiin 9.–18.12., Taloustutkimus taas toteutti Ylen kyselyn 7.–28.12. Puolueiden kannatusprosentit kummassakin kyselyssä on lueteltu alla olevassa taulukossa.

	Yle	Alma Media
SDP	21,2 %	20,1 %
keskusta	20,3 %	19,5 %
kokoomus	17,4 %	17,1 %
vihreät	13,3 %	11,2 %
PS	9,4 %	11,6 %
vasemmistoliitto	7,6 %	8,8 %
RKP	4,9 %	4,5 %
KD	3,6 %	3,7 %
muut	2,3 %	3,5 %

Puolueiden kannatuksissa on havaittavissa pieniä eroja kyselyiden välillä. Huolimatta siitä, että mielipidemittausten aikavälit poikkeavat hieman toisistaan, Alman kyselyn aikaväli mahtuu kokonaan Ylen kyselyn ”sisään”. Voisi kuvitella, että liki samaan aikaan tehdyt mielipidemittaukset antaisivat melko tarkalleen samat kannatuslukemat kullekin puolueelle. Näin ei kuitenkaan ole. Mistä se johtuu?

Vastaus kysymykseen löytyy tietenkin mielipidemittausten virhemarginaalista. Mutta mitä virhemarginaali oikeastaan tarkoittaa ja miten sitä pitäisi tulkita?

Virhemarginaali ja luottamusväli

Otetaan lähempään tarkasteluun ne kaksi puoluetta, joiden kannatuslukemissa ero Ylen ja Alma Median kyselyiden välillä on suurin: poliittisen spektrin vastakkaisilta laidoilta löytyvät vihreät ja perussuomalaiset.

Ylen kyselyssä vihreät on neljänneksi suurin puolue selvällä erolla viidenneksi suurimpaan puolueeseen perussuomalaisiin. Alma Median kyselyssä puolueet taas ovat lähes tasoissa, mutta perussuomalaiset johtaa vihreitä täpärästi.

Molempien kyselyiden ilmoitettu virhemarginaali on ±2,4 prosenttiyksikköä. Tarkoittaako tämä, että esimerkiksi vihreiden todellinen kannatus voi Ylen kyselyn mukaan olla yhtä hyvin mikä hyvänsä luku välillä 10,9–15,7 % ja Alma Median mukaan välillä 8,8–13,6 %? Ei tarkoita.

Ensin lienee hyvä hieman avata, mikä on virhemarginaalin määritelmä. Tilastotieteellisin termein ilmaistuna mielipidemittauksen virhemarginaali on sama asia kuin 95 prosentin luottamusvälin (engl. confidence interval) puolikas. Tämä tarkoittaa siis sitä, että mikäli tutkimuksen otos on harhaton (tästä lisää artikkelin loppupuolella) puolueen todellinen kannatus on 95 prosentin todennäköisyydellä jollain kohtaa vaihteluväliä, joka ulottuu virhemarginaalin verran ilmoitetusta prosenttiluvusta kumpaankin suuntaan.

Kyselyn virhemarginaali lasketaan seuraavalla kaavalla:

Kaavassa p merkitsee puoluekannatuksen tai muun mittauksen kohteena olevan asian suhteellista osuutta desimaalilukuna (esim. vihreiden kannatus Ylen kyselyssä = 0,133) ja n kyselyyn vastanneiden määrää eli otoskokoa. 1,96 tulee kaavaan taas siitä, että 95 prosentin vaihteluvälin äärirajat ovat ±1,96 keskihajonnan etäisyydellä keskiarvosta.

Suoraan kaavasta ilmenee kaksi merkittävää virhemarginaalia koskevaa seikkaa:

Populaation eli perusjoukon, siis koko tutkimuksen kohteena olevan ryhmän koko ei vaikuta virhemarginaaliin. Voi tuntua epäintuitiiviselta, että puolueiden kannatuksen selvittämiseksi koko Suomessa (5,5 milj. as.) tai pelkästään vaikkapa Lappeenrannassa (73 000 as.) tarvitaan yhtä suuri otos saman virhemarginaalin saamiseksi. Mikäli otoskoko on hyvin lähellä populaation kokoa, näin ei itse asiassa olekaan, mutta useimmissa käytännön tilanteissa sama otos tuottaa mielipidemittauksessa yhtä suuren virhemarginaalin, oli tutkimuksen kohteena sitten 50 miljoonan tai 50 000:n kokoinen ihmisjoukko.
Erisuuruisilla kannatusluvuilla on eri virhemarginaalit. Tämä merkitsee sitä, että mielipidemittauksen ilmoitettu virhemarginaali pätee sellaisenaan vain yhteen vertailussa mukana olevista puolueista (yleensä suurimpaan niistä). Luvun virhemarginaali on sitä suurempi, mitä lähempänä 50 prosenttia se on. Niinpä pienempien puolueiden kohdalla todellinen marginaali on ilmoitettua pienempi.

Ylen kyselyyn vastasi 1 946 henkilöä, joista 57,6 % eli 1 121 kertoi puoluekantansa. Alma Mediaa varten haastatelluista 1 500 henkilöstä kantansa ilmaisi 70,8 % eli 1 062. Näillä luvuilla saadaan yllä esitettyä kaavaa käyttäen laskettua seuraavat virhemarginaalit kullekin puolueelle:

	Yle (n = 1 121)	Alma Media (n = 1 062)
SDP	±2,4 %	±2,4 %
keskusta	±2,4 %	±2,4 %
kokoomus	±2,2 %	±2,3 %
vihreät	±2,0 %	±1,9 %
PS	±1,7 %	±1,9 %
vasemmistoliitto	±1,6 %	±1,7 %
RKP	±1,3 %	±1,2 %
KD	±1,1 %	±1,1 %
muut	±0,9 %	±1,1 %

Todellinen arvo voi olla myös virhemarginaalin ulkopuolella

On huomionarvoista, että virhemarginaalin laskemiseen käytetty luottamusväli on 95, ei suinkaan 100 prosenttia. Todellinen arvo voi siis löytyä myös virhemarginaalin ulkopuoleltakin. Yksittäisen puolueen kannatuksen tapauksessa tämän todennäköisyys on vain 5 %, mutta koska yhdestä mielipidemittauksesta ilmenee 9 eri numeroa – 8 puolueen kannatusprosentit sekä ryhmä ”muut” – todennäköisyys sille, että ainakin yksi niistä on pielessä virhemarginaalia enemmän on 37 %. Todennäköisyys sille, että ainakin yksi joko Ylen tai Alma Median luvuista on virhemarginaalia kauempana todellisuudesta on jo 60 %, ja on lähestulkoon varmaa (todennäköisyys 99,6 %), että ainakin yksi Ylen vuoden aikana julkaisemista 12 mielipidemittauksista sisältää vähintään yhden kannatuslukeman, jonka todellinen arvo on virhemarginaalin ulkopuolella.

Yllä olevassa kuviossa on kuvattu se vaihteluväli jolle vihreiden ja perussuomalaisten todellinen kannatus Ylen ja Alma Median kannatusmittausten mukaan sijoittuu. Tavallinen, 95 prosentin luottamusväliin perustuva virhemarginaali on kuvattu täytettynä laatikkona, lisäksi katkoviivalla on osoitettu 99,7 prosentin luottamusväli (±3,0 keskihajontaa), jonka sisältä oikea arvo löytyy jo lähes varmasti.

Parikin prosenttiyksikköä on aika iso heitto kun puhutaan kymmenen prosentin tietämissä pyörivistä luvuista. Kuten ylempänä kuvatusta laskukaavasta ilmenee, virhemarginaalia olisi mahdollista pienentää otoskokoa kasvattamalla. Miksi näin ei tehdä mielipidemittausten tulosten tarkentamiseksi? Syy on yksinkertainen: raha. Virhemarginaalin puolittaminen vaatisi otoskoon nelinkertaistamista ja kustannukset kasvaisivat samassa suhteessa. Noin tuhannen vastaajan otos on vuosikymmenten saatossa päätetty tarkkuudeltaan median käyttöön riittäväksi kun otetaan huomioon myös mittausten teettämisen kustannus.

Lisäksi on syytä huomioida, että kaikki arvot virhemarginaalin sisällä eivät ole yhtä todennäköisiä. Virhemarginaalin olessa ±2,0 prosenttiyksikköä todellinen arvo on 68 prosentin todennäköisyydellä korkeintaan yhden prosenttiyksikön päässä keskiarvosta.

Alla oleva kuvio esittää vihreiden ja perussuomalaisten kannatuslukujen todennäköisyysjakauman. Todennäköisyys sille, että todellinen kannatusluku osuu kuvion keskellä olevalle tummennetulle alueelle on kussakin tapauksessa n. 4 % ja pienenee siitä etäännyttäessä. Kuvioelementtien kärjet kuvaavat 99,7 prosentin luottamusväliä.

Tämäkään kuvio ei silti vielä anna kovin hyvää vastausta siihen, mikä puolueiden todellinen kannatus on. Ylen yhden puolueen kannatukselle antama, kuviossa tummennettu todennäköisin arvo on aivan Alma Median todennäköisyysjakauman äärilaidalla ja päinvastoin.

Useamman mielipidemittauksen tulosten yhdistäminen

Usein tarkin tulos saadaan kun kahden tai useamman mielipidemittausten sisältämä tieto yhdistetään ja muodostetaan aineistosta uusi kuvio. Tähän on olemassa erilaisia tapoja. Maailmalla toimii useita mielipidemittausten tulosten yhdistelyyn erikoistuneita verkkosivustoja, joita kutsutaan mielipideaggregaattoreiksi (engl. poll aggregator). Ne ovat kehittäneet monimutkaisia, erilaisia paino- ja korjauskertoimia hyödyntäviä menetelmiään tarkoitukseen. Tunnetuin aggregaattoreista lienee FiveThirtyEight, jonka käyttämä malli pyrkii huomioimaan mm. joidenkin tutkimuksia tuottavien organisaatioiden taipumuksen systemaattisesti liioitella republikaanien tai demokraattien kannatusta. (Suomessa julkaistaan mielipidemittauksia niin harvakseltaan, ettei niiden aggregoinnista ole kehittynyt omaa journalismin lajiaan kuten esimerkiksi USA:ssa.)

Yllä olevassa kuviossa mielipidemittausten tulokset on yhdistetty kyselyiden vastaajamäärällä painotettuna, ilman muita kertoimia ja laskettu lopuksi uudet virhemarginaalit yhdistetyn vastaajamäärän mukaan. Laskelman perusteella vihreät olisi siis perussuomalaisia suositumpi, joskaan ei aivan yhtä pitkällä kaulalla kuin Ylen kyselyn alkuperäisten lukujen valossa. Tässä kaikkien puolueiden yhdistetyt luvut:

SDP	20,7 %
keskusta	19,9 %
kokoomus	17,3 %
vihreät	12,5 %
PS	10,3 %
vasemmistoliitto	8,2 %
RKP	4,7 %
KD	3,6 %
muut	2,9 %

Yhdistämiseen käyttämäni laskukaavat ovat hyvin yksinkertaisia:

jne.

Tällaisia yksinkertaisia kaavoja käyttäen laskelman tekeminen on helppoa, ja vaikka sillä onkin puutteensa verrattuna mielipideaggregaattorien käyttämiin hienostuneempiin malleihin, laskelman tulos kertoo kuitenkin puoluekannatuksesta enemmän kuin yksittäinen mielipidemittaus. Kun tämä ei ole tämän vaikeampaa, ihmettelen kyllä vähän, miksi media ei Suomessa vaikuta yhtään kiinnostuneelta tekemään puoluekannatuslaskelmia jotka perustuisivat useampaan kuin yhteen mielipidemittaukseen!

Virhemarginaali antaa liian ruusuisen kuvan mielipidemittauksen luotettavuudesta

Edellä esitetyissä laskelmissa ja mielipidemittauksen tutkimuksen virhemarginaalista puhuttaessa ylipäänsäkin lähdetään implisiittisesti siitä oletuksesta, että tutkimuksen otos on harhaton (engl. unbiased) tai ainakin, että otoksen mahdollinen vinouma on pystytty jollain tavalla oikaisemaan. Näin harvemmin todellisuudessa on.

Harhattomuus tarkoittaa sitä, että ainut tekijä joka vaikuttaa siihen, kenet populaatiosta poimitaan mielipidemittauksen tutkimusotokseen on sattuma. Jos nostamme erivärisiä palloja sisältävästä valtavasta pussista 1 121 palloa ja niistä 133 on vihreitä, voidaan virhemarginaalin laskentakaavaa käyttäen helposti selvittää, että kaikista pussissa olevista palloista on 95 prosentin todennäköisyydellä vihreitä 11,3–15,3 % (13,3 ± 2,0). Virhemarginaali kuvaa siis otantavirhettä (engl. sampling error), eli sitä, että satunnaisotantaan osuu harvoin aivan täsmälleen populaation sisäistä jakaumaa kuvaava joukko kohteita.

Mielipidemittauksiin vastaavat ihmiset eivät kuitenkaan ole yhtä helppo tutkimuskohde kuin pallot, vaan otantavirheen lisäksi tulosta vääristävät erilaiset otosharhat (engl. sampling bias):

Tutkimukseen ei ole käytännössä mahdollista poimia satunnaista joukkoa kaikista äänestysikäisistä suomalaisista, vaan otanta joudutaan tekemään esimerkiksi arpomalla haastateltavat numeropalveluun rekisteröityjen puhelinnumeroiden joukosta. Tutkimuksen otantakehikko (engl. sampling frame) on tällöin ne suomalaiset, joilla on julkinen puhelinnumero. Se ei ole täsmälleen sama joukko kuin kaikki äänestysikäiset suomalaiset, mistä johtuen kyselyyn sisältyy peittovirhe (coverage error).

Osalla suomalaisista on käytössään useampi kuin yksi puhelinnumero, joten heidän valikoitumisensa puhelinnumeroista arpomalla muodostettuun otokseen on keskimääräistä todennäköisempää. Jotkut taas voivat esimerkiksi vuorotyön vuoksi olla tutkimuksentekoaikana huonosti tavoitettavissa puhelimitse, jolloin heidän valikoitumisensa otokseen on vähemmän todennäköistä. Tällaisten syiden vuoksi puhelimitse tehtävään mielipidemittaukseen sisältyy myös valikoitumisharha (engl. selection bias).

Kaikki tutkimukseen valitut eivät syystä tai toisesta halua vastata kyselyyn. Varsinkin verkkokyselyissä vastauskato on yleensä iso ongelma ja sen aiheuttama vinouma (engl. non-response bias) potentiaalisesti suuri.

Otantavirheen ja erilaisten otosharhojen lisäksi tulosta vääristää vielä vastausharha (engl. response bias), joka on kattotermi erilaisille syille, joiden vuoksi osallistujien antamat vastaukset kyselyyn eivät aina täysin vastaa sitä, miten he todellisuudessa ajattelevat tai toimivat. Kaikki eivät esimerkiksi halua myöntää haastattelijalle kannattavansa rasistiseksi väitettyä puoluetta. Toisaalta haastateltava saattaa vastata eri kysymykseen kuin mikä häneltä on kysytty, esimerkiksi kuntavaalikannatusta koskevassa kyselyssä siihen, mitä puoluetta hän äänestäisi eduskuntavaaleissa.

Otantavirhe aiheuttaa mielipidemittauksen tuloksiin epätarkkuutta, jota voi pienentää otoskokoa kasvattamalla. Vinoutunut otos ja vastausharha sen sijaan vääristävät tuloksia usein tavoilla, joiden korjaaminen ei ole näin yksinkertaista. Jos esimerkiksi jonkin puolueen kannattajissa on enemmän vuorotöissä käyviä kuin muiden, tämän puolueen kannattajista valikoituu otokseen helposti todellista kannatusta pienempi osuus ja tämä vääristää puolueen kannatuslukuja.

Mielipidemittausten tekijät pyrkivät korjaamaan otosharhan aiheuttamaa virhettä esimerkiksi käyttämällä yksinkertaisen satunnaisotannan sijaan ositettua otantaa eli kiintiöpoimintaa (engl. stratified sampling), jolla huolehditaan siitä, että kaikkiin merkittäviin sosioekonomisiin ryhmiin (esim. miehet ja naiset, suomen- ja ruotsinkieliset) kuuluvien määrä otoksessa vastaa heidän osuuttaan väestössä. Tällaisista korjaavista toimista huolimatta mielipidemittausten tuloksiin sisältyy aina ilmoitetun virhemarginaalin lisäksi edellä mainittujen tekijöiden yhteenlasketun vaikutuksen aiheuttama metodologinen virhemarginaali. Termin kehittäjä Nate Silver arvioi yhdysvaltalaisissa mielipidemittauksissa sen olevan tavallisesti samaa suuruusluokkaa kuin tavallisen otantavirhemarginaalinkin. Tämä tarkoittaa, että karkeasti arvioiden yksittäisen mielipidemittauksen todellinen virhemarginaali voi olla kaksinkertainen ilmoitettuun nähden.

Tarinan opetus

Mielipidemittausten tuloksiin sisältyy runsaasti epävarmuutta. Todellinen virhemarginaali voi metodologiset tekijät huomioonottaen isoimpien puolueiden osalta olla kaksinkertainen tutkimuksen tekijän ilmoittamaan verrattuna ja osa todellisista kannatusluvuista voi löytyä jopa tämän laajemman virhemarginaalin ulkopuolelta. Niinpä reilusti virhemarginaalin sisään mahtuvat muutokset puolueiden kannatuksessa tai erot niiden keskinäisessä suosiossa ovat todennäköisemmin sattuman aiheuttamaa kuin merkki mistään todellisesta ilmiöstä, eikä niillä ole juurikaan uutisarvoa. Parempi käsitys puolueiden kannatuksesta saadaan, kun useampien mielipidemittausten tulokset yhdistetään.

Maarten Lambrechtsin mainio Rock ’n Poll -sivusto auttaa hahmottamaan, miten paljon otantavirhe vaikuttaa mielipidemittausten tuloksiin. Jokaisen politiikan toimittajan kannattaisi vilkaista sitä ennen kuin kirjoittaa uutisena, miten jonkin puolueen kannatus on muuttunut 0,4 prosenttiyksikköä edellisestä vertailusta.

2015-04-072015-04-08

Lisäkommentteja perussuomalaisten maahanmuuttoraportista käytyyn keskusteluun

Eilen julkaistua kirjoitustani perussuomalaisten ajatushautomon Suomen Perustan julkaisemasta, maahanmuuton vaikutuksia julkiseen talouteen käsittelevästä raportista Maahanmuutot ja Suomen julkinen talous on luettu ja jaettu kiitettävästi. Tätä kirjoittaessa sivulatauksia on kertynyt yli 12 000, millä määrällä juttu yltää blogimme historian luetuimmaksi. Maahanmuutto aiheena kiinnostaa mitä ilmeisimmin enemmän kuin vaikkapa Suomen karttakuvan kehitys. :)

Keskustelua kirjoituksesta on käyty mm. alkuperäisen artikkelin kommenttiosiossa. Raportin laatinut Samuli Salminenkin esitti joitakin kriittisiä huomautuksia tekemistäni tulkinnoista. Keskustelun sävy on ollut paikoin kipakka, mutta toistaiseksi jokseenkin asiallinen. Tänään Yle Uutiset teki myös nettijutun, jossa Salmiselta pyydettiin kommentteja esittämiini väitteisiin.

Käydyn keskustelun perusteella tulin siihen tulokseen, että on ehkä hyvä yrittää vielä tiivistää ja selkeyttää esittämiäni näkemyksiä, koska tuntuu että Salminenkaan ei aivan ole ymmärtänyt mihin kritiikkini kärki kohdistuu. Lisäksi kommenttiosiossa käydyn keskustelun myötä havaitsin erään minulta aiemmin huomaamatta jääneen seikan, joka vaikuttaa olennaisesti analyysiin.

Keskeneräisenä julkaistu selvitys on altis tulkintavirheille

Raportti on julkaistu ilmeisen keskeneräisenä. Vielä pari päivää ennen sen julkaisua perussuomalaisten Facebook-sivuilla julkaistiin video, jossa arveltiin, että torstaina joudutaan näyttämään eläinvideoita, koska selvitys ei valmistu ajallaan. Ilmeisesti paine saada jotain ulos johti siihen, että laajempi kokonaisuus pilkottiin kahteen osaan (raportin kakkososaa lupailtiin torstain tilaisuudessa julkaistavaksi tällä viikolla).

Ensimmäinenkään osa ei vaikuta aivan loppuun asti hiotulta. Esimerkiksi: ”Kaikki tutkimukseni merkittävimmät ja pääasialliset tulokset on on saatu 20–62-vuotiaista. 7–70-vuotiaiden vertailu oli sellainen kokeilu ja valmistelua elinkaarimallia varten”, sanoo Salminen Ylen haastattelussa. Hän on kuitenkin päättänyt otsikoida tätä kokeilua käsittelevän luvun ”Tulokset”, joten ei välttämättä ole pelkästään lukijan vika jos tämä erehtyy luulemaan, että nimenomaan tuo 7–70-vuotiaiden vertailu olisi tutkimuksen ydinainesta.

Jos tutkija itse olisi malttanut pitäytyä työikäisten vertailussa eikä ottaa 63–70-vuotiaita mukaan muutenkin kokonaisuudessa irralliselta tuntuvaan tutkimuksen lukuun 7, olisin ehkä minäkin lähestynyt aihetta toiselta kantilta. Nyt julkaistussa tekstissä on kaksi metodologisesti ja ikärajaukseltaan toisistaan poikkeavaa osiota, joiden keskinäinen suhde jää lukijalle epäselväksi ja altistaa väärintulkinnoille. (Tästä lisää tuonnempana.)

Alkuperäisessä kirjoituksessani oli kaksi pääpointtia:

Koko aikusväestöä tarkasteltaessa Suomessa syntyneiden vaikutus julkiseen talouteen on huonompi kuin maahanmuuttajien
Laskentatapa, joka tuottaa koko aikusväestön nettovaikutukseksi julkiseen talouteen –31,6 miljardia euroa kun todellisuudessa julkisen talouden alijäämä oli tarkasteluvuonna vain 2 miljardia on virheellinen

Käyn ne seuraavassa läpi Salmisen esittämän kritiikin valossa.

Koko aikuisväestöä tarkasteltaessa saadaan eri tuloksia kuin vain työikäisiä tarkasteltaessa

Salminen kritisoi tekemääni analyysiä Ylen haastattelussa näin: ”Koposen tekemässä vertailussa on myös se virhe, että hän on ottanut mukaan työikäisiä ja ei-työikäisiä.” Ei se ole mikään virhe, vaan toinen pääpointeistani.

Salmisen laskelma osoittaa – jos se on oikein tehty (ks. alempaa) – että työikäisen väestön keskuudessa maahanmuuttajien vaikutus julkiseen talouteen on huonompi kuin kantaväestön. Tätä en ole kiistänyt. Tämän tuloksen kiistämisen täytyisi perustua alkuperäisen datan uudelleenanalysoimiseen, ja kuten Salminen itse haastattelussa totetaa, hänellä on ollut käytössään ”rekisteriaineisto, jota ei ole ulkopuolisilla henkilöillä”. En ole ammatiltani tutkija, ja vaikka olisinkin, tällaisen analyysin tekemiseen menisi paljon enemmän aikaa kuin pääsiäsen pyhien luppohetket. Tulemme varmasti näkemään tulevaisuudessa erilaisia analyysejä työikäisten maahanmuuttajien aiheuttamista kustannuksista jotka joko vahvistavat tai kumoavat nyt julkaistun raportin tiedot, mutta minä jouduin olosuhteiden pakosta rajaamaan tarkasteluni sellaisiin kysymyksiin, joista on valmista dataa saatavilla.

Minun pointtini ei ollut, että työikäisten maahanmuuttajien tase olisi välttämättä jotain muuta kuin mitä Salminen sanoo, vaan nimenomaan että koko aikuisväestön tase on kantaväestöllä huonompi Salmisen omilla luvuilla laskettuna, koska kantaväestön ikärakenne on epäedullisempi kuin maahanmuuttajilla. Tämä selviää hyvin yksinkertaisella laskutoimituksella: otetaan Salmisen tutkimuksesta sivulta 82 löytyvästä taulukosta ulkomaalaisten ja suomalaisten nettovaikutukset henkeä kohden ja kerrotaan Tilastokeskuksen tietokannasta löytyvillä henkilömäärillä kotimaisten ja vieraiden kielten puhujien joukossa. Tämä luku voidaan vielä jakaa ihmisten kokonaismäärillä, jolloin saadaan keskimääräinen vaikutus henkeä kohden.

”Tämän henkilön kritiikin mukaan vertailuun voitaisiin ottaa vaikka mielivaltainen joukko 0–50-vuotiaat”, kritisoi Salminen Ylen haastattelussa. Eikä voitaisi. ”Kaikki aikuiset” ei ole mielivaltainen joukko.

Nähdäkseni käyttämääni laskentatapaa kohtaan voidaan esittää kaksi perusteltua vasta-argumenttia:

Tutkimuksen eläkeläisille lasketut luvut on laskettu 20–62-vuotiaille eläkeläisille, joten niitä ei voi käyttää yli 62-vuotiaiden eläkeläisten nettovaikutuksen arvioimiseen. Tämä on tietenkin periaatteessa ihan totta, mutta vanhempien eläkeläisryhmien nettovaikutus lienee pikemminkin 20–62-vuotiaita eläkeläisiä voimakkaammin negatiivinen pitempään kerrytetyn ja siten suuremman työeläkkeen, sekä suremman sairaanhoito- ja hoivapalvelujen tarpeen vuoksi. (20–62-vuotiaiden eläkeläisten ryhmässä on siis yli 62-vuotiaiden ryhmää enemmän ennenaikaiselle eläkkeelle jääneitä, joille ei ole kertynyt yhtä paljon työeläkettä kuin täyden työuran tehneille, ja vähemmän vanhustenhoidon palveluita tarvitsevia.) Jos käyttämäni laskentatapa siis vääristää tuloksia, se vääristää niitä luultavasti maahanmuuttajien kannalta epäedullisempaan suuntaan.
Lasten jättäminen pois laskuista vääristää lukuja, koska lapset aiheuttavat julkisen talouden näkökulmasta vain kuluja ja maahanmuuttajilla on enemmän lapsia kuin kantaväestöllä. Tämäkin on sinänsä totta, mutta vaikutus on pieni. Laskisin mielelläni luvut koko väestölle, lapset mukaan luettuna, mutta se ei ole mahdollista käytössäni olevalla datalla. Lasten vaikutus ei ole kovin merkittävä, sillä itse asiassa ero ulkomaalaisten ja suomalaisten lapsimäärässä ei ole kovin suuri. Kotimaisten kielten puhujista 16,4 % on 0–14-vuotiaita, vieraiden kielten puhujista 18,0 %; eroa siis vain 1,6 %-yksikköä. (Vertailun vuoksi voidaan todeta, että eläkeläisiä on kotimaisten kielten puhujista 25,0 % ja vieraskielisistä 4,3 %; ero 20,7 %-yks.) Valistuneena arvauksena uskallan myös heittää, että yhden eläkeläisen nettovaikutus selvästi suurempi kuin yhden lapsen.

Salmisen laskutapa tuottaa absurdeja tuloksia

Kun Salmisen työikäiselle väestölle laskemat luvut laajennetaan koskemaan koko aikuisväestöä, saadaan koko väestön nettovaikutukseksi julkiseen talouteen –31,6 miljardia euroa.

Salminen kritisoi käyttämääni laskentatapaa blogin kommenttiosiossa näin:

Koponen esittää tutkimuksen sivun 82 keskiarvot oikein tekstissään. Jotta keskiarvoista saadaan oikeat summaluvut, ne pitää kuitenkin kertoa oikeilla henkilölukumäärille. Sivun 82 taulukon oikeat henkilölukumäärät on esitetty tutkimuksen liitetaulukossa 1 sivulla 97. Kertomalla sivun 82 taulukon keskiarvot liitetaulukon 1 henkilölukumäärillä päästään oikeisiin summalukuihin. Sen sijaan kertomalla sivun 82 taulukon keskiarvot joillain mielivaltaisilla henkilölukumäärillä, päästään sen sijaan ”absurdeihin lukuihin”, kuten Koponen tekee tekstissään.

Sivulla 82 ovat siis henkeä kohden lasketut nettovaikutukset ja sivulla 97 työikäisten (20–62-vuotiaiden) määrät. Tehdään Salmisen mieliksi laskelma, jossa sivun 82 luvut kerrotaan todellakin sivun 97 luvuilla.

Ensin ulkomailla syntyneet:

	Opiskelijat	Työlliset	Työttömät	Eläkeläiset	Muut
henkeä	17 672	120 830	21 249	4 293	41 747
euroa/hlö	–13 465 €	+2 742 €	–17 594 €	–26 692 €	–8 734 €
yhteensä	–238,0 milj. €	+331,3 milj. €	–373,9 milj. €	–114,6 milj. €	–364,6 milj. €

Ulkomailla syntyneiden nettovaikutuksen loppusummaksi tulee –759,7 miljoonaa euroa, eli tuo paljon puhuttu 700 miljoonaa, joka näkyy kohteliaasti hieman pyöristetyn pienemmäksi perussuomalaisten puheissa.

Sitten suomalaiset. Jostain syystä suomalaisten kokonaismääriä eri ryhmissä ei sivun 97 taulukosta ilmene, vaan ainoastaan tutkimusotokseen sattuneiden määrät. Mutta eipä hätää, Tilastokeskuksen tietokannasta Väestö pääasiallisen toiminnan, sukupuolen, iän (1-v) ja vuoden mukaan 1987–2013 voidaan poimia kaikkien Suomessa asuvien määrät kohorteittain. Otetaan siis sieltä 20–62-vuotiaiden määrät vuonna 2011 ja vähennetään edellisestä taulukosta ilmenevät ulkomaalaisten määrät, niin saadaan suomalaisten luvut:

	Opiskelijat	Työlliset	Työttömät	Eläkeläiset	Muut
henkeä	142 333	2 128 977	224 453	217 068	124 378
euroa/hlö	–17 017 €	+5 337 €	–12 568 €	–24 254 €	–11 242 €
yhteensä	–2 422,1 milj. €	+1 1362,4 milj. €	–2 820,9 milj. €	–5 264,8 milj. €	–1 398,3 milj. €

Suomalaisten yhteenlasketuksi nettovaikutukseksi saadaan –543,7 miljoonaa euroa.

Tämä on aivan yhtä absurdi lopputulos kuin alkuperäisen laskelmani –31,6 miljardia euroa, koska se tarkoitaa että työikäisen väestön nettovaikutus on kokonaisuutena negatiivinen (yht. –1,3 miljardia). Koska julkisen talouden sektoritilinpidon loppusumma oli vuonna 2011 –2 miljardia, ja pelkästään perus- ja esiopetuksen menot, muista lapsien aiheuttamista kustannuksista puhumattakaan olivat 2,5 miljardia, tämä tarkoittaisi, että yli 62-vuotiaiden eläkeläisten pitäisi maksaa keskimäärin enemmän veroja kuin mitä he saavat eläkkeitä ja julkisia palveluja, jotta summat menisivät tasan. Näin ei todellakaan ole, kuten jokainen hyvin ymmärtää.

On siis ilmeistä, että Salmisen käyttämä laskentatapa on pielessä, koska se hukkaa merkittävän osan tuloista johonkin.

Laskelma ei huomioi työnantajan eläkemaksuja

Blogin kommenttiosiossa käydystä keskustelusta hoksasin lopulta yhden merkittävän tuloerän, joka on laskelmasta jätetty pois: työnantajan eläkemaksut. Koska tutkimuksen 7-luvussa (joka on siis nimetty ”Tulokset”) sanotaan ”olen ottanut julkisen talouden nettovaikutuksia laskiessani mukaan tulopuolelle myös työnantajien maksamat eläkevakuutusmaksut”, oletin tietysti yksinkertaisena ihmisenä, että nämä eläkemaksut olisi huomioitu myös edeltävissä luvuissa, joissa arvioidaan nettovaikutuksia yksilötasolla. Näin ei tarkemmalla lukemisella kuitenkaan ole. Sivulla 25 tosiaan sanotaan:

Tutkimuksen ensimmäisessä osassa (toteutuneet julkisen talouden tulot ja menot) ei ole ilman erillistä mainintaa mukana työnantajien maksamia pakollisia eläkevakuutusmaksuja, sillä ne ovat tutkimuksen määritelmien kannalta hankalia, sillä niitä ei peritä henkilöiltä (palkansaajilta) itseltään. Lisäksi tutkimuksen ensimmäisessä osassa keskityn lähinnä työikäisten, 20–62-vuotiaiden väestöjen tutkimiseen, jolloin mukana on suurin osa työeläkejärjestelmän henkilöiltä saamista tuloista, muttei toisaalta menopuolta maksettujen eläkkeiden muodossa.

Pahoittelen, etten ensimmäisellä lukemisella havainnut tätä rajausta vaan erheellisesti kuvittelin, että työnantajan eläke- ja sosiaaliturvamaksut olisi otettu mukaan julkisen sektorin tuloina. Työeläkeyhtiöt luetaan Suomessa budjettitalouden näkökulmasta julkiseen sektoriin ja nämä maksut ovat jo määritelmällisestikin osa verokiilaa, joten Salmisen tekemä ratkaisu on poikkeuksellinen, ja riittää jo yksinään selittämään tuon ulkomaalaisten 759,7 miljoonan euron negatiivisen nettovaikutuksen.

Paljonko työeläke- ja sosiaaliturvamaksujen jättäminen pois vääristää tuloksia?

VATT:n raportista Maahanmuutajien integroituminen Suomeen ilmenee (kuvio 6b), että maahanmuuttajien keskimääräiset palkka- ja yrittäjätulot aikuista (15–70 v.) kohden olivat suuruusluokkaa 13 500 €/v. Tämä tarkoittaa yhteensä noin 3 miljardin summaa, josta voidaan arvioida maksetun Salmisen laskelmista puuttuvia eläke- ja sosiaaliturvamaksuja suunnilleen… 750 miljoonaa euroa!

Korostettakoon vielä, että vaikka työnantajan sosiaaliturvamaksut huomioitaisiin laskelmassa, alkuperäisestä n. 30 miljardin heitosta väestön laskennallisen nettovaikutuksen ja toteutuneen julkisen sektorin alijäämän välillä ne selittäisivät vain n. 17 miljardia. Vielä puuttuu 13 miljardia. Raportissa käytetty laskentatapa tuottaisi siis edelleen aivan liian synkkiä lukuja, vaikka sitä korjattaisiin huomioimaan kaikki verokiilan osat julkisen sektorin tuloina, kuten tietenkin pitäisi.

Kun kerran yhteisesti kulutetut hyödykkeetkin on pystytty jyvittämään eri väestöryhmille, niin eiköhän myös sellaiset tulotkin voida ottaa mukaan laskelmaan, joita ei pystytä suoraan kohdistamaan. Luontevaa olisi vaikka vähentää nämä tulot yhteisesti kulutetuista menoista ennen menojen jyvitystä.

tl;dr

Suomalaissyntyisten vaikutus julkiseen talouteen on henkeä kohden huonompi kuin maahanmuuttajien johtuen erilaisesta väestörakenteesta.

Jos rajataan tarkastelu vain työikäiseen väestöön, saattaa hyvin olla juuri niin kuin Salminen sanoo, eli että työikäisten maahanmuuttajien nettovaikutus on työikäistä kantaväestöä huonompi ja joidenkin maahanmuuttajryhmien erittäinkin huono. Tämä on itsessään kiinnostava tulos, jolla on myös poliittisia implikaatioita.

Salmisen laskelmasta puuttuu kuitenkin merkittävä tulopuolen menoeriä, mm. työnantajan eläkevakuutusmaksut, jonka vuoksi esimerkiksi Matti Putkosen useaan kertaan toistama väite maahanmuuttajien aiheuttamista 700 miljoonan vuosittaisista kuluista ei pidä paikkaansa.

2015-04-062015-04-07

Perussuomalaisten maahanmuuttoraportin loppusummat perustuvat silmänkääntötemppuun

Perussuomalaisten ajatushautomon laatiman selvityksen loppupäätelmä nojaa tarkoitushakuiseen väestörajaukseen, jolla vanhimmat ikäryhmät siivotaan pois tilastoista. Kun tarkasteluun otetaan aikusväestö kokonaisuudessaan, kantaväestön nettovaikutus julkiseen talouteen on raportin omilla luvuilla laskettuna maahanmuuttajia huonompi.

Perussuomalaisten ajatushautomo Suomen Perusta julkaisi ennen pääsiäistä maahanmuuton vaikutuksia julkiseen talouteen käsittelevän raportin Maahanmuutot ja Suomen julkinen talous. Tutkimus pyrkii selvittämään maahanmuuttajien aiheuttamat ”julkisen talouden nettovaikutukset”, eli paljonko jää loppusummaksi kun eri maahanmuuttajaryhmien tuottamasta taloudellisesta hyödystä vähennetään aiheutetut kustannukset.

Aivan alkajaisiksi täytyy kiittää raportin laatinutta Samuli Salmista hänen tekemästään mittavasta työstä. Selvitys lienee tähän mennessä yksityiskohtaisin Suomessa tehty yritys arvioida maahanmuuton kokonaiskustannuksia. Metodologisesti se on varsin läpinäkyvä ja helposti sellaisenkin henkilön arvioitavissa, joka ei ole kvantitatiivisen yhteiskuntatutkimuksen asiantuntija (esim. allekirjoittanut).

Harmi kyllä, tutkimuksen loppupäätelmänä mm. raportin julkistustilaisuudessa esitetty arvio – maahanmuutto kokonaisuutena aiheuttaa Suomelle 700 miljoonan vuosittaiset kustannukset, kun taas kantaväestön nettovaikutus henkeä kohden on lähellä nollaa – on saatu aikaiseksi tilastollisella silmänkääntötempulla.

Ikärajaus kaunistelee suomalaissyntyisten lukuja

Tutkimuksen alkuosassa käsitellään 20–62-vuotiaiden, ulkomailla syntyneiden aiheuttamaa nettovaikutusta henkeä kohden viidessä eri ryhmässä: työlliset, työttömät, opiskelijat, eläkeläiset ja muut. Luvussa 7 tarkastellaan eri maahanmuuttajaryhmien kokonaisvaikutusta ikäryhmässä 7–70-vuotiaat. Jälkimmäisessä tarkastelussa ovat mukana myös toisen polven maahanmuuttajat, eli ne joilla on ainakin yksi ulkomailla syntynyt vanhempi.

Tutkimuksessa käytetyistä ikärajauksista varsinkin 7–70 vuotta on epätavallinen, ja ongelmallinen kahdesta syystä:

Tilastokeskuksen avoimista aineistoista ei ole mahdollisuutta tehdä poimintaa etnisen taustan mukaan eri pääasiallisen toiminnan ryhmiin (opiskelijat, työlliset jne.) kuuluvien määristä näillä ikärajauksilla, eivätkä ne ole muissakaan suomalaisissa tutkimusjulkaisuissa kovin yleisiä. Yleisemmin käytetyn ikärajauksen (vaikkapa 15–64-vuotiaat) soveltaminen tekisi tutkimuksen tuloksista paremmin vertailukelpoisia muihin tilastoihin ja tutkimustietoon.

Varsinainen silmänkääntötemppu piilee kuitenkin siinä, että ikähaitarin katkaiseminen asteikon yläpäästä kaunistelee suomalaistaustaisten nettovaikutusta ulkomaalaistaustaisiin verrattuna dramaattisesti.

Suomessa asuu yli 1,1 miljoonaa yli 62-vuotiasta suomea, ruotsia tai saamea äidinkielenään puhuvaa, kun taas vieraskielisistä vain n. 10 000 kuuluu tähän ikäryhmään. Yli 70-vuotiaiden osalta vastaavat luvut ovat 620 000 ja 4 000. Käytännöllisesti katsoen kaikki yli 70-vuotiaat ovat eläkeläisiä ja raportin lukujen mukaan juuri eläkeläisten nettovaikutus julkiseen talouteen on kaikkein voimakkaimmin negatiivinen.

Eräs painavimmista työperäisen maahanmuuton puolesta esitetyistä argumenteista on, että Suomen väestö vanhenee jatkuvasti ja eläkeläisten määrä suhteessa työikäisiin kasvaa huolestuttavasti. Jättämällä laskuista 620 000 eläkeläistä tämä näkökulma saadaan kätevästi ohitettua, mutta kovin älyllisesti rehellisenä tällaista lähestymistapaa ei voi pitää.

Uusi laskelma perustuu raportin omiin lukuihin

Raportin sivulta 82 löytyy taulukko, jossa on laskettu kymmeneen suurimpaan maahanmuuttajaryhmään (syntymävaltion perusteella) kuuluvien julkisen talouden nettovaikutukset henkeä kohden:

	Opiskelijat	Työlliset	Työttömät	Eläkeläiset	Muut
Somalia	–21 208 €	–2 998 €	–17 740 €	–32 609 €	–15 945 €
Irak	–15 462 €	–4 174 €	–20 842 €	–21 786 €	–14 944 €
Ruotsi	–14 905 €	3 954 €	–20 032 €	–31 933 €	–14 228 €
Ent. Jugoslavia	–13 630 €	765 €	–17 874 €	–22 560 €	–11 698 €
Turkki	–11 953 €	1 048 €	–15 974 €	–18 005 €	–9 225 €
Thaimaa	–10 913 €	–2 326 €	–16 332 €	–30 125 €	–8 712 €
Ent. Neuvostoliitto	–12 089 €	2 191 €	–17 615 €	–23 700 €	–8 443 €
Viro	–12 630 €	2 309 €	–18 041 €	–28 223 €	–6 612 €
Kiina	–10 473 €	3 374 €	–13 710 €	–26 723 €	–5 089 €
Saksa	–11 817 €	8 516 €	–15 095 €	–20 904 €	–4 708 €
Kaikki ulkomaat	–13 465 €	2 742 €	–17 594 €	–26 692 €	–8 734 €
Suomi	–17 017 €	5 337 €	–12 568 €	–24 254 €	–11 242 €

Yhdistin tämän taulukon henkilöä kohden lasketut luvut Tilastokeskuksen avoimiin tietoihin eri ryhmiin kuuluvien määristä siten, että kaikki 15 vuotta täyttäneet otetaan mukaan. Laajensin tarkastelun samalla kaikkiin ulkomaalaisryhmiin ja selvitin, miten suomalaiset kunnat sijoittuisivat suhteessa niihin. Kunnista kerrotaan myös kuntatyyppi tilastollisen kuntaluokituksen mukaan ja perussuomalaisten kannatus viime kunnallisvaaleissa (2012). Näin syntynyt interaktiivinen visualisointi löytyy alta. (Visualisointi ei välttämättä näy oikein kaikilla vanhemmilla selaimilla.)

Haluan vielä erikseen korostaa, että kaikki visualisoinnin tiedot perustuvat perussuomalaisten omassa maahanmuuttoselvityksessä esitettyihin lukuihin (taulukko yllä) ja Tilastokeskuksen avoimiin aineistoihin.

Grafiikassa on sinisellä värillä korostettu ne kunnat, joissa perussuomalaisten kannatus oli kunnallisvaaleissa vähintään 20 %. (Kynnysarvoa voi muuttaa vasemman alakulman säätimellä.) Kansallisuus- ja kieliryhmistä korostettuina näkyvät ne, joille on Suomen Perustan selvityksessä laskettu omat luvut. Muiden ryhmien nettovaikutus on laskettu ”kaikki ulkomaat” -rivin lukujen perusteella.

Kun tarkasteluun otetaan koko 15 vuotta täyttänyt väestö, havaitaan että vieraskielisten vaikutus julkiseen talouteen on perussuomalaisten käyttämällä laskentatavalla negatiivinen (−5 804 € henkeä kohden), mutta kotimaisten kielten puhujien vaikutus on vielä tätäkin negatiivisempi (−7 039 €). Koko eläkeläisväestön ottaminen mukaan tarkasteluun mielivaltaisen 70 vuoden ylärajan soveltamisen sijaan kääntää siis selvityksen alkuperäisen tuloksen päälaelleen: maahanmuuttajien vaikutus julkiseen talouteen on positiivisempi kuin suomalaissyntyisten.

Täsmennys 6.4. klo 16:55: 70 vuoden ikäraja ei ole täysin mielivaltainen, vaan ilmeisesti juontuu käytetystä aineistosta (Tilastokeskuksen yhdistetty työntekijä-työnantaja-aineisto, FLEED), joka sisältää vain 15–70-vuotiaat. Kun aineiston perusteella on kuitenkin pystytty laskemaan nettovaikutus henkeä kohden myös eläkeläisille ja etenkin kun yli 70-vuotiaita maahanmuuttajia Suomessa on vain n. 4 000, olisi jonkinlainen estimaatti voitu ja pitänyt tehdä myös yli 70-vuotiaiden ryhmälle.

Manner-Suomen kunnista vain noin kymmenesosa on nettovaikutukseltaan asukasta kohden vieraskielisten keskiarvoa parempi. Niistä kunnista, joissa perussuomalaisten kannatus oli kunnallisvaaleissa vähintään 20 % ei yksikään yllä vieraskielisten ryhmien keskitasolle ja vain yhden (Kaustinen) nettovaikutus on suomenkielisten keskitasoa positiivisempi.

Onko oikein arvottaa kuntia näin suoraviivaisesti pelkän asukasta kohden lasketun taloudellisen hyödyn mukaan? Pitäisikö eläkeläiset ja perussuomalaisten kannattajat ajaa pois maasta talouslukuja rumentamasta? Ei pitäisi. Ihmisarvoa tai vaikkapa kansallismaiseman arvoa ei mitata rahassa, eikä rahallinen mittari aina huomioi kunnolla kaikkea välineellistäkään hyötyä. Hyvin yksinkertaisena esimerkkinä jälkimmäisestä mainittakoon eläkeläisten apu lastenlasten hoidossa – tällä on hyvin konkreettinen merkitys kansantalouden kannalta, mutta sen täsmällinen hinnoittelu on työlästä, eikä sitä siksi yleensä laskelmissa huomioida.

Myöskään pakolaisia ei Suomeen oteta siksi, että he hyödyttäisivät julkista taloutta, vaan koska on oikein auttaa hädänalaisia. Perhesiteiden kautta maahamme tulevat taas ovat ennen kaikkea jonkun läheisiä ja vasta toissijaisesti työvoimaa ja veronmaksajia. Toki on järkevää pyrkiä hyödyntämään maassa jo asuvien taloudellinen potentiaali, mutta sitä tuskin voimme muuttaa, että juuri maahan saapuneet pakolaiset ovat julkisen talouden näkökulmasta vastakin menoerä. Ja mitä sitten? Niin ovat sairaat ja vanhuksetkin. Ei se tarkoita, että nämä ihmisryhmät pitäisi jättää oman onnensa nojaan.

Selvityksessä käytetty laskentatapa tuottaa absurdeja tuloksia

Työperäisen maahanmuuton kohdalla kysymys taloudellisista vaikutuksista on relevantti, eikä se toki merkityksetön ole muidenkaan maahanmuuttajaryhmien osalta. Harmillisesti on kuitenkin todettava, että perussuomalaisten selvitys ei anna maahanmuuton kustannuksista tai hyödyistä kunnollista kuvaa, koska käytetty laskentatapa on selvästi virheellinen.

Lähes kaikki etniset ryhmät jäävät raportin lukujen mukaan nettovaikutukseltaan selvästi pakkasen puolelle kun myös yli 70-vuotiaat otetaan mukaan laskelmaan. Ainut ryhmä, joka pääsee rimaa hipoen plussalle on Saksan kansalaiset (+12 €). Selvityksen lukujen perusteella voidaan laskea, että 15 vuotta täyttäneiden kotimaisten kielten puhujien yhteenlaskettu nettovaikutus julkiseen talouteen on –30,4 miljardia ja vieraskielisten –1,2 miljardia.

Tämä tarkoittaa sitä, että kaikkien Suomessa asuvien 15 vuotta täyttäneiden yhteenlaskettu nettovaikutus julkiseen talouteen on –31,6 miljardia. Tulos on täysin absurdi ja kertoo, että laskentatapa on pahasti pielessä. Julkisen sektorin alijäämä vuonna 2011 oli todellisuudessa vain 2 miljardia euroa. Käytetty laskentatapa hukkaa siis johonkin melkein 30 miljardia laskelman plussapuolelle kuuluvia eriä (tai liioittelee menoja).

Tästä n. 7 miljardia koostunee laskelmasta tietoisesti pois jätettyjen verojen kuten yhteisö-, kiinteistö-, perintö- ja varainsiirtoverojen osuudesta, mutta ne huomioidenkin laskelmaan jää ammottava aukko. Koko väestön yhteenlasketun nettovaikutuksen pitäisi suunnilleen vastata julkisen talouden sektoritilinpidon loppusummaa (–2 miljardia). Kun otetaan huomioon, että 0–14-vuotiaat tuottavat julkiselle sektorille pääosin menoja, yhteenlasketun nettovaikutuksen pitäisi yli 15-vuotiaiden osalta olla luultavasti jopa jonkin verran plussan puolella. Jos tuloja tai menoja ei pystytä kohdistamaan väestöryhmittäin, ne pitäisi jakaa koko väestön kesken jossain soveliaassa suhteessa, kuten tutkimuksessa on tehty esimerkiksi välillisten verojen ja kollektiivisesti kulutettujen palveluiden (esim. maanpuolustuksen) kohdalla, eikä jättää kokonaan pois, kuten nyt on tehty.

Lisäys 7.4. klo 12:02: Vaikuttaa siltä, että selvityksessä ei ole huomioitu työnantajan eläke- ja sosiaaliturvamaksuja ainakaan 20–62-vuotiaiden henkilöä kohden lasketuissa summissa. Tämä selittäisi noin 17 miljardia tuosta 31,6 miljardin aukosta. Rajaus on todella erikoinen, koska jos maksetut eläkkeet on kuitenkin laskettu mukaan menopuolelle niin totta kai eläkemaksut kuuluvat tulopuolelle. Se, että ne maksaa nimellisesti työnantaja, ei poista sitä että eläkemaksut ovat normaalimääritelmän mukaan osa verokiilaa.

20–62-vuotiaiden maahanmuuttajien ryhmässä työllisiä on selvityksen lukujen mukaan n. 120 000. Raportista ei ilmene, millainen maahanmuuttajien keskimääräinen palkkataso on, mutta tässä nopea laskelma siitä, paljonko työnantajan eläke- ja sosiaaliturvamaksuja tämän suuruiselta ryhmältä kertyisi eri keskimääräisillä kuukausipalkoilla:

• 1 500 €/kk: n. 550 milj. €/v.
• 2 000 €/kk: n. 750 milj. €/v.
• 2 500 €/kk: n. 900 milj. €/v.
• 3 000 €/kk: n. 1,1 mrd €/v.

Väite maahanmuuton 700 miljoonan vuosikuluista julkiselle sektorille näyttää siis perustuvan siihen, että laskelmassa on jätetty osa julkisen sektorin tuloista (eläke- ja sosiaaliturvamaksut) huomioimatta.

Vaikuttaa lähestulkoon siltä, että selvitystä varten on ensin kehitetty laskentatapa, jolla saadaan maahanmuuton kokonaisvaikutus painettua varmasti miinukselle, ja kun on huomattu, että se painaa suomalaissyntyisten loppusumman vielä maahanmuuttajiakin pahemmin pakkaselle, on korjausliikkeenä leikattu vanhimmat ikäluokat tarkastelusta pois. Tuskinpa tutkimuksen laatija sentään aivan näin häikäilemättömän tarkoitushakuisesti on toiminut, mutta kyllä lukujen käsittely pönkittää perussuomalaisten maahanmuuttopoliittista agendaa voimakkaammin kuin mihin niiden objektiivinen tarkastelu mielestäni antaisi aihetta.

Metodologia ja lähteet

Lopuksi vielä muutama sana itse tekemistäni valinnoista ja käytetyistä aineistoista.

Aineistoni ovat perussuomalaisten kannatuslukuja lukuun ottamatta samalta vuodelta (2011) kuin alkuperäisen selvityksen luvut. Kunnallisvaalien 2012 tulos valikoitui aineistoksi vuoden 2011 eduskuntavaalien sijaan, koska kunnallisvaaleissa vaalitulos on helposti saatavissa kunnittain kun taas eduskuntavaaleissa kuntakohtaiset tulokset pitäisi työläästi koostaa äänestysaluekohtaisia tietoja yhdistellen.

Suomen Perustan selvityksessä maahanmuuttotausta on määritelty henkilön tai hänen vanhempiensa syntymämaan mukaan. Tätä tietoa ei Tilastokeskuksen avoimista aineistoista löydy, joten olen käyttänyt visualisoinnissa sen sijaan tietoa pääasiallisesta toiminnasta kansallisuuden ja kielen mukaan. Kansallisuus vastannee siedettävällä tarkkuudella ensimmäisen sukupolven maahanmuuttajan syntymämaata ainakin tuoreemmissa maahanmuuttajaryhmissä ja kieli vuorostaan kertoo likimääräisesti ensimmäisen ja toisen sukupolven maahanmuuttajien kokonaismäärän (sikäli kun kieli voidaan yhdistää yksittäiseen taustamaahan).

Niiden etnisten ryhmien osalta, joille raportissa on laskettu omat luvut (taulukko s. 82), olen käyttänyt näitä lukuja. Muiden osalta laskelman pohjana ovat olleet ”kaikki ulkomaat” -ryhmän luvut. Kielten osalta olen hyödyntänyt tietoa Suomessa asuvien eri kielten puhujien alkuperämaista; esimerkiksi suurin osa Suomen albaniankielisistä on kotoisin entisestä Jugoslaviasta vaikka kieltä puhutaan myös Albaniassa, joten tämän kieliryhmän laskelmassa on käytetty entisen Jugoslavian lukuja. Sen sijaan esimerkiksi arabian puhujat ovat kotoisin useista eri taustamaista, joten tämän ryhmän osalta laskelma perustuu ”kaikki ulkomaat” -ryhmän lukuihin. Tästä säännöstä hieman poiketen ruotsinkielisille on käytetty Suomessa syntyneiden lukuja ja saksankielisille Saksassa syntyneiden. Ruotsin kansalaisille sen sijaan on käytetty Ruotsissa syntyneiden lukuja.

Lähteenä on käytetty Maahanmuutot ja Suomen julkinen talous -raportin lisäksi seuraavia Tilastokeskuksen avoimesta StatFin-tilastotietokannasta löytyviä aineistoja:

Koostetiedosto csv-muodossa löytyy täältä.

Kirjoitin myös jatkoartikkelin aiheesta.

2014-05-272014-05-28

Eurovaalien kovin kilpailu käytiin vihreiden ja demarien välillä

Eurovaalituloksen ensimmäisissä analyyseissä on noussut vahvasti esiin arvio, että viime eurovaaleihin nähden huonosti menestyneet vihreät menettivät ääniä ennen kaikkea hallitusvastuusta keväällä luopuneelle vasemmistoliitolle. Koko maan lukuja katsoessa tämä on houkutteleva tulkinta, olihan vasemmiston vaalivoitto suunnilleen vihreiden tappion suuruinen.

Ilmeisin selitys ei kuitenkaan välttämättä pidä paikkaansa tarkemman analyysin valossa. Jos vihreät olisivat menettäneet äänestäjiään ennen kaikkea vasemmistoliitolle, tämän pitäisi näkyä äänestysaluekohtaisessa tarkastelussa niin, että vihreiden tappio olisi suurin niillä alueilla joissa vasemmisto on onnistunut houkuttelemaan eniten äänestäjiä. Näin ei kuitenkaan näyttäisi olevan.

Tein vertailun sunnuntain eurovaalien ja vuoden 2012 kunnallisvaalien tuloksesta äänestysalueittain. (Vertailu edellisiin eurovaaleihin ei onnistu yhtä helposti, koska ainakaan vielä tätä kirjoittaessa oikeusministeriö ei ole julkaissut vuoden 2009 äänestysaluekohtaisia tuloksia yhtä kätevässä kootussa koneluettavassa muodossa kuin vuoden 2012 kuntavaaleista ja 2014 eurovaaleista on saatavilla. Tieto on sinänsä saatavilla ja ajan salliessa koitan myöhemmin ottaa sen mukaan analyysiin.) Satunnaisvaihtelun karsimiseksi otin mukaan vain sellaiset äänestysalueet, joilla molemmissa vaaleissa oli annettu yhteensä vähintään tuhat ääntä.

Käytin korrelaation mittarina helposti laskettavaa Pearsonin korrelaatiokerrointa, joka ei välttämättä ole paras mahdollinen tilastollinen analyysimenetelmä, mutta olen sen oheen tehnyt myös interaktiivisen grafiikan, jonka avulla lukija voi itse arvioida, kertovatko pelkät numerot koko totuuden vaalituloksesta.

Grafiikassa voi valita vaaka- ja pystyakselille yhden kahdeksasta isoimmasta eduskuntapuolueesta, muiden puolueiden yhteisen äänisaaliin tai yleisen äänestysaktiivisuuden. Akselien arvot ovat siis muutoksia puolueen kyseisen äänestysalueen äänistä saamassa prosenttiosuudessa vuoden 2012 kuntavaalien ja viime sunnuntain eurovaalien välillä. Renkaiden värit viittaavat vaalipiiriin. Tarkemmat tiedot äänestysalueesta saa viemällä hiiren sitä kuvaavan renkaan päälle.

Jos vaaka- ja pystyakselille valittujen puolueiden vaalituloksen välillä on vahva yhteys niin, että toinen on selvästi vienyt ääniä toiselta, äänestysalueita kuvaavien renkaiden muodostaman pistepilven pitäisi muodostua kuvion lävistäjän ympärille. Vaaka- tai pystysuuntainen pilvi viittaa siihen, ettei yhteyttä puolueiden vaalimenestyksen välillä ole. (Tällaista kuviotyyppiä kutsutaan parvikuvioksi.)

Vihreiden ja vasemmistoliiton vaalimenestystä kuvaava kuvio on voimakkaasti pystysuuntainen, joka tarkoittaa, että vihreiden ääniosuus on vaihdellut paljon edellisistä vaaleista äänestysalueesta riippuen, kun taas vasemmistoliitto on parantanut ääniosuuttaan keskimäärin melko tasaisesti eri puolilla maata. Vahvaa yhteyttä ääniosuuden muutoksien välillä ei näy, korrelaatiokerroin saa arvon r = –0,15 jota ei voi pitää kovin suurena.

Sen sijaan vihreiden ja SDP:n vaalimenestyksen välillä näkyy huomattavasti vahvempi yhteys, r = –0,48. Vihreiden menestys korreloi melko voimakkaasti myös äänestysaktiivisuuden muutoksen kanssa: r = –0,41. Nopea tulkinta on, että SDP on menettänyt äänestäjiään vihreille, ~~mutta vihreät toisesta päästä nukkuvien puolueelle.~~ (Korjaus: Ensimmäisessä versiossa tähän oli lipsahtanut ajatusvirhe. Jos vihreät olisi menettänyt ääniä ennen kaikkea äänestysaktiivisuuden laskun kautta, korrelaatiokertoimen pitäisi olla positiivinen. Nyt tilanne on päin vastoin niin, että vihreät ovat erityisesti menestyneet niillä äänestysalueilla joilla äänestysaktiivisuus laski paljon kuntavaaleihin verrattuna.) Muitakin potentiaalisia selityksiä luvuille varmasti löytyy, mutta selkeästi yhteys vihreiden ja demarien äänimenestyksen välillä on paljon vahvempi kuin vihreiden ja vasemmiston välillä.

Muiden puolueiden vaalituloksen väliltä ei löydy yhtä vahvoja yhteyksiä. Vahvimmat yksittäiset taisteluparit ovat RKP & kokoomus (r = –0,29) ja perussuomalaiset & kokoomus (r = –0,30). Mielenkiintoinen yllätys on myös vasemmistoliiton ja keskustan pieni kilvoittelu (r = –0,23). Vasemmiston tuore meppi Merja Kyllönen menestyi erinomaisesti juuri Pohjois-Suomessa ja kilpaili äänistä varmasti paljon esimerkiksi Paavo Väyrysen kanssa.

Grafiikassa on vielä pieniä teknisiä virheitä, mutta sen muodostama yleiskuva lienee oikea. Eri asia on kuinka pitkälle meneviä johtopäätöksiä lukujen perusteella voi vielä tehdä. Kuntavaalit ja eurovaalit ovat luonteeltaan erilaisia ja äänestäjät saattavat valita puolueensa näissä vaaleissa kovinkin eri perustein. Toimikoon tämä kuitenkin pienenä datajournalistisena keskustelunavauksena vaalituloksen syvempään analyysiin. Lukijoilla on myös epäilemättä paljon kommentteja valittuihin analyysimenetelmiin ja grafiikan toteutukseen, jotka koitan sitten parhaani mukaan huomioida sitten seuraavassa versiossa. :)

Lisäys 28.4.: Työkaluun on nyt lisätty mahdollisuus tarkastella aiemman ääniosuuden absoluuttisen muutoksen (%-yksikköä) myös äänimäärän absoluuttista muutosta (kpl) sekä ääniosuuden suhteellista muutosta (% suhteessa kuntavaaleihin). Absoluuttisten äänimäärien tarkastelu tarjoaa heikompia korrelaatioita kuin aiempi ääniosuuden muutos, mutta edelleen vihreiden vahvin korrelaatio säilyy nimenomaan demareihin ja vihreät on myös ainut puolue jonka kanssa SDP:n tuloksella on selvästi nollasta poikkeava negatiivinen korrelatio, vaikka kerroin onkin pieni (r = –0,26). Vihreiden ja vasemmistoliiton valtakunnallinen korrelaatio on edelleen heikko. Vihreiden vahvimmilla alueilla Helsingissä ja Uudellamaalla vasemmisto näyttäisi ehkä jonkin verran rokottaneen vihreiden tulosta, mutta vihreiden tappio absoluuttisissa äänissä mitattuna on suurempi kuin vasemmiston voitto.

(Huomautettakoon että absoluuttisen äänimäärien vertaaminen äänestysaktiivisuuteen – joka tässä on annettujen äänten määrän prosentuaalinen lasku kuntavaaleista, ei muutos prosenttiyksikköinä – ei anna järkeviä tuloksia, koska äänestysaktiivisuuden ja isojen puolueiden absoluuttisen äänimäärän korrelaatio on suuri ja pienten puolueiden pieni johtuen ihan siitä miten korrelaatio lasketaan.) Itse asiassa näin ei ole, vaan absoluuttisten äänimäärien vertailu äänestysaktiivisuuteen paljastaa että vihreät ja RKP kärsivät vähiten laskeneesta äänestysaktiivisuudesta, kun taas muiden puolueiden tulos korreloi positiivisesti äänestysaktiivisuuden muutoksen kanssa.

2013-10-15

Kiitokset taas seminaarivieraille!

Tieto näkyväksi -seminaarimme järjestettiin 20.9. toisen kerran. Paikka oli jälleen Kauppakorkeakoulun suuri juhlasali. Kuten viime vuonna käyneet muistavat, ensimmäinen seminaari oli satelliittitapahtuma OKFestivalille, jossa osa järjestäjistä oli myös pitämässä ohjelmaa. Tämänvuotinen pidettiin itsenäisenä tapahtumana, joka järjestettiin Aallon ja sponsorien voimin. Osa viimevuotisista kävijöistämme saapui festivaalin lippuvaihtojärjestelyn kautta, ja muistan kesällä miettineeni, saammeko tällä kertaa vastaavasti yleisöä ilman suuremman tapahtuman tuomaa vetoa. Huoli oli turha, sillä tapahtuma myytiin loppuun.
Koska ohjelmaa oli kahdella kielellä, päätimme tänäkin vuonna jakaa tapahtuman aamu- ja iltapäivän osioihin, joista ensimmäinen oli suomeksi ja toinen englanniksi. Tapahtuman videotaltioinnista ja striimauksesta kiitämme Aleksi Mustosta, joka laittoi ohjelman nähtäväksi Bambuser-palveluun.

Kyyriainen_7646

Kun vieraat olivat istuutuneet, seurasi avajaispuheenvuoro. John Nurmisen säätiön hallituksen puheenjohtaja, merenkulkuneuvos Juha Nurminen osoittautui todelliseksi asiantuntijaksi puheessaan karttojen ja visualisointien yhteiskunnallisesta vaikuttavuudesta. Esityksessä oli uutta ja kiinnostavaa tietoa kartografian historiaakin tunteville. Nykyajan esimerkki oli kuva Itämeren levätilanteesta, joka tekee selväksi ympäristöongelman laajuuden. Puhdas Itämeri -hankkeeseen voi tutustua projektin sivuilla.

Hannu Kyyriäinen on infografiikkaan erikoistunut graafinen suunnittelija. Hänen työnsä Suomen Kuvalehdessä on maamme mittapuulla poikkeuksellisen korkeatasoista ja monimuotoista. Hänen visualisointinsa Palestiinan aluemenetyksistä sijoittui pronssisijalle arvostetussa Malofiej-kilpailussa aiemmin tänä vuonna, ja esityksessään hän kävi läpi monia muitakin mielenkiintoisia töitään. Niihin voi perehtyä tarkemmin hänen Flickr-sivuillaan.

Vaajakallio_7711 — Kirsikka Vaajakallio esittelee haastatteluaineistoa

Kirsikka Vaajakallio on palvelumuotoilija, jonka työtapa on yhteissuunnittelu. Siihen kuuluu tuotteen tai palvelun varsinaisen käyttäjän mukaan ottaminen jo suunnitteluprosessin alkuvaiheissa. Saman tavan soisi yleistyvän myös tiedon esittämisessä, sillä kokeneinkin suunnittelija ei vain tule ajatelleeksi kaikkia yleisön tarpeita. Esityksessään Vaajakallio kertoi joistakin käyttämistään työskentelymenetelmistä, joista ehkä kiinnostavimpia olivat suunnittelupelit. Ne ovat tilanteeseen räätälöityjä seurapelejä, joiden avulla suunnitelutyöhön tottumattomat voivat jakaa ideoitaan helpommin.

Markku Mikkola-Roos on Suomen ympäristökeskuksen biodiversiteettiyksikön vanhempi tutkija, joka on erikoistunut lintujen suojeluun. Hänen puheenvuoronsa käsitteli tunnistusoppaita perinpohjaisella tavalla. Olin itse yllättynyt, kuinka vanhoja monet alan konventiot ovat. Historialliseen läpikäyntiin kuului tietenkin myös arvio nykytilanteesta. Siinä kävi ilmi, kuinka valokuvia käyttävillä oppailla on omat rajoituksensa piirrettyihin havainnekuviin verrattuna.

Peltomaki_7867 — Tuomas Peltomäki kertoo verkostojen hienoudesta

Datajournalisti Tuomas Peltomäki esitteli puheenvuorossaan seikkaperäisesti suomalaista lobbausverkostoa esittävää visualisointityötään. Twitterissä esitystä luonnehdittiin stand-upiksi, ja siinä oli myös omasta mielestäni terävää ja mukaansatempaavaa huumoria. Työhön vaadittu datamäärä oli päätähuimaava ja sen käsittely vaati uusien työtapojen kehittämistä ja vanhojen soveltamista. Visualisointiin ja sen materiaaleihin voi tutustua Peltomäen verkkosivuilla.

Ohjelman viimeinen suomenkielinen puhuja oli valokuvaaja ja filosofian tohtori Leena Saraste. Hänen aiheensa koski valokuvan totuusarvoa ja sen mielikuvia muokkaavaa voimaa. Ajatus valokuvasta todisteena ja ilmaisuvälineenä on ristiriitainen ja siksi kiinnostava. Monet ajatukset ja lainaukset olivat provosoivia, kuten väittämä ”ihmiset haluavat tulla petetyiksi”. Näiden tukena oli mielenkiintoisia esimerkkejä ikonisista ja myös vähemmän tunnetuista valokuvista, joiden aihe ja ilmaisutapa olivat tarkkaan harkittuja. Kuvista ei näe, mitä on todella tapahtunut, sillä totuus ei löydy niistä itsestään.

Tauon jälkeen alkoi englanninkielinen osuus, jonka avasi Svenska Dagbladetin graafinen journalisti Thomas Molén. Hänen kuuluisin työnsä lienee Malofiej-kilpailussa pääpalkinnon saanut grafiikka euroviisujen äänestyskäyttäytymisestä. Molén on infografiikkanörtti ja ylpeä siitä. Esityksessä näkyi helposti nörttimäisten piirteiden etu hyvän infografiikan tekemisessä. Kun mielenkiinto syttyy helposti ja tekijällä on luontainen kyky syventyä sekä kiinnostusta teknologiaan, lopputulos on myös lukijalle syvempi ja mielenkiintoisempi.

Ensimmäinen Keynote-puhujamme oli yhdysvaltalaisen Periscopic-suunnittelutoimiston perustaja Kim Rees. Toimisto on tunnettu visuaalisista datatarinoistaan, joita yritykset, järjestöt ja julkinen sektori tilaavat esittämään toimintaansa ja tavoitteitaan.
Periscopicin tunnuslause on do good with data. Töiden aiheet ovat yhteiskuntaan, terveyteen ja ympäristöön liittyviä ja ne herättävät voimakkaita tunteita. Etenkin asekuolemien takia varastetuista vuosista kertova esitys oli vähäeleisyydestään huolimatta (tai ehkä juuri sen takia) koskettava. Kerronnallisesta ja tunteita herättävästä puolestaan huolimatta hyvän visualisoinnin on pohjattava todellisuuteen, ja mieleenpainuvien esitysten vahvuus on niiden rehellisyydessä. Läpinäkyvä data tekee esittäjän haavoittuvaksi, mutta rakentaa luottamusta.

Lounastauko oli tänä vuonna erityisen pitkä, sillä sali piti antaa hetkeksi valmistujaistilaisuuden käyttöön. Toisaalta tämä oli hyväkin asia, sillä tiiviit esitykset herättivät ajatuksia ja niitä oli mukava sulatella muiden kävijöiden kanssa.

Ohjelma jatkui toisella keynote-puheenvuoroistamme, jonka piti espanjalainen Alberto Cairo. Hän on pitkän linjan graafinen journalisti ja valistaja, jonka kirja The Functional Art on luultavasti tämän hetken paras teos informaatiomuotoilun tekemisestä. Cairon esitys oli perusteellinen läpikäynti siitä, mitä todella laadukkaan visualisointityön tekeminen vaatii. Eräs hänen keskeisistä viesteistään on, että kuvallisen esityksen tekijä ei ole tietoa koristeleva käsityöläinen vaan sisältöön paneutuva viestinnän ammattilainen, jolla on journalistinen vastuu. Lukijan ymmärrys voi olla seurausta ainoastaan tekijän ymmärryksestä.
Graafisen journalistin työ on suuressa määrin myös ryhmätyötä muiden viestinnän tekijöiden sekä asiantuntijoiden kanssa. Tapausesimerkeissä tuli esille, kuinka asiantuntijan kuuleminen lisää uusia ulottuvuuksia ja syvyyttä esitykseen. Toivoisin, että meillä Suomessa annettaisiin useammin puitteet tehdä tällä tasolla datalöhtöistä kuvallista journalismia.

Päivän viimeinen puhuja oli alankomaalainen informaatiomuotoilija Frédérik Ruys. Cairon tavoin hän painotti ymmärryksestä syntyvän oivalluksen merkitystä työssään (lainaamallaan termillä infogasm). Ruys esitteli vaikuttavan ja työlään hankkeen Nederland van Boven (Alankomaat ilmasta), joka on televisioon tuotettu dokumenttisarja. Siinä yhdistetään taitavasti kuvattua ilmakuvaa huolellisesti tutkittuun informaatiomuotoiluun tavalla, joka antaa arkielämän ilmiöistä uuden kuvan. Visualisoinneissa esitettiin hälytysajoneuvojen liikettä päivän aikana ja valtamerialusten liikennettä Euroopan vilkkaimpaan satamaan. Kiehtovin esimerkki oli kuitenkin haikaran päivän aikana tekemä lentoreitti, jossa näkyy kuinka lintu käyttää ihmisen toimintaa ja rakennettua ympäristöä hyväkseen.
Hiottu lopputulos vaati runsaasti taustatyötä ja useita ideoita oli hylättävä, koska visualisointi ei sopinut välineen kerronnallisiin vaatimuksiin. Visualisointien tekijänä oli mielenkiintoista seurata, kuinka usean osa-alueen pallottelu nopean työprosessin aikana onnistui näinkin sujuvasti.

Haluamme kiittää kaikkia seminaarivieraitamme kiinnostuksestanne ja hyvistä kysymyksistä. Lisäksi kiitos kuuluu myös muille järjestelyssä auttaneille sekä sponsoreille. Oli jälleen haastavaa ja palkitsevaa suunnitella ohjelma, joka olisi yhtä monipuolinen kuin yleisömme.

Valokuvat: Pekka Niittyvirta

2012-10-292012-11-10

Kuntavaaleissa oli vain häviäjiä

Kuntavaalien vaalistudiota katsellessa vaikutti siltä, että liki jokaisen puolueen puheenjohtaja oli sitä mieltä, että juuri hänen puolueensa selviytyi näistä vaaleista voittajana: suurin ääniosuus, eniten valtuutettuja, pienin pudotus ääniosuudessa, liikkuvaan junaan hypänneeltä uudelta puheenjohtajalta huima tulos… Käytännön politiikan teon kannalta valtuustopaikat ratkaisevat ja siinä valossa moni näistä selityksistä voi olla järkeenkäypä. Jos kuitenkin katsotaan eri puolueiden kansalaisilta saamaa mandaattia, voi todeta, ettei näissä vaaleissa ollut kuin häviäjiä.

Vaalien äänestysprosentti, 58,2 %, on aivan surkea. Puolueet paukuttelevat nyt henkseleitään kun ovat saaneet ison siivun pienestä kakusta. Mutta kun katsotaan kuinka moni äänestäjä antoi kullekin puolueelle äänensä, lopputulos on että mikään, siis mikään puolue ei onnistunut keräämään lisää äänestäjiä verrattuna sekä edellisiin kuntavaaleihin 2008 että viimeisimpiin vaaleihin, jotka olivat siis vuoden 2011 eduskuntavaalit. (Presidentinvaaleja en pidä vertailukelpoisena koska niissä puoluetaustan rooli on vähäisempi.) Perussuomalaiset paransivat kyllä äänisaalistaan viime kuntavaaleihin verrattuna, mutta eduskuntavaaleihin verrattuna puolueen äänestäjien määrä on lähes puolittunut.

Oheiseen taulukkoon ja sen lukujen pohjalta laadittuun grafiikkaan on listattu nämä madonluvut. (Luvut on painotettu kussakin vaalissa äänioikeutettujen määrän mukaan, eli tarkalleen ottaen ilmoitettu muutos on puolueen saamassa osuudessa kaikkien äänioikeutettujen äänistä, ei absoluuttisissa äänimäärissä.)

	muutos 2008–	muutos 2011–
Kokoomus	–11,4 %	–12,1 %
SDP	–12,5 %	–16,1 %
Perussuomalaiset	+58,7 %	–47,0 %
Keskusta	–11,8 %	–3,0 %
Vihreät	–9,4 %	–3,7 %
Vasemmistoliitto	–13,4 %	–19,4 %
RKP	–4,7 %	–9,6 %
Kristillisdemokraatit	–15,2 %	–24,1 %
Suomen Työväenpuolue	–27,5 %	–72,8 %
Itsenäisyyspuolue	–13,8 %	–60,8 %
Köyhien Asialla	–47,8 %	–58,8 %
Piraattipuolue	—	–61,8 %
Vapauspuolue	—	–99,7 %
Muutos 2011	—	–83,8 %
Suomen Kommunistinen Puolue	–22,1 %	+17,1 %
Kommunistinen Työväenpuolue	–35,5 %	–56,7 %
Muut ryhmät	–37,4 %	+83,5 %

Ainoat puolueet, joiden saama äänimäärä on laskenut alle kymmenyksellä molemmista vertailuvaaleista ovat vihreät ja rkp ja nekin vain juuri ja juuri. Eipä ole hurraamista.

Kyllä poliitikoilla on tässä iso peiliin katsomisen paikka. Koko demokraattisen järjestelmämme legitimiteetti on koetuksella, jos tällainen kehitys jatkuu.

______________________________

Lisäys 29.10.2012

Tässä vielä painottamattomat luvut, eli siis muutokset puolueiden saamien äänten kappalemäärissä. Yleiskuva säilyy aika pitkälti samana. Keskusta ja vihreät ovat nollatuloksessa edellisiin eduskuntavaaleihin verrattuna ja kaikki miinusprosentit pienenevät hieman painotettuihin lukuihin verrattuna, mutta aika surkealta tulos näyttää näinkin arvioituna.

	muutos 2008–	muutos 2011–
Kokoomus	–9,1 %	–9,1 %
SDP	–10,1 %	–13,2 %
Perussuomalaiset	+61,5 %	–45,1 %
Keskusta	–9,4 %	+0,3 %
Vihreät	–7,0 %	–0,4 %
Vasemmistoliitto	–11,1 %	–16,6 %
RKP	–2,1 %	–6,5 %
Kristillisdemokraatit	–12,9 %	–21,5 %
Suomen Työväenpuolue	–25,6 %	–71,8 %
Itsenäisyyspuolue	–11,5 %	–59,5 %
Köyhien Asialla	–46,4 %	–57,5 %
Piraattipuolue	—	–60,4 %
Vapauspuolue	—	–99,7 %
Muutos 2011	—	–83,2 %
Suomen Kommunistinen Puolue	–20,1 %	+21,1 %
Kommunistinen Työväenpuolue	–33,8 %	–55,2 %
Muut ryhmät	–35,7 %	+88,1 %