OKFestivalin ohjelmahaku käynnissä, visualisoinnit mukana yhtenä aihealueena

Helsingissä ensi syksynä järjestettävän maailman suurimman avoimen datan tapahtuman, OKFestivalin ohjelmahaun ensimmäinen kierros saatiin päätökseen jo jokin aika sitten. Nyt luvassa on toinen kierros ja ensimmäisen kierroksen perusteella syntyneet festivaalin sisältöteematkin on julkistettu. Lisää tietoa löytyy OKFestivalin sivuilta.

Yhtenä teemoista on ”Data Journalism and Data Visualization” ja allekirjoittaneella on kunnia toimia yhtenä tämän teeman ”guest programme plannerista” Jens FinnäsinJohanna Vehkoon, Miska KnapekinLucy Chambersin ja Liliana Bounegrun ohella. Eli nyt niitä loistavia ideoita tulemaan! Luentoja, paneelikeskusteluja, työpajoja, taide-esityksiä ja installaatioita… Kunhan liittyy avoimen datan hyödyntämiseen jollain tapaa. Erityisesti heitän palloa nyt tässä designereille. Avoin data on perinteisesti ollut teknisemmin orientoituneiden ihmisten leikkikenttä ja uskon että tekniikkavetoisista ohjelmaehdotuksista ei tule olemaan pulaa. Design-lähtöistä tekemistä olisi mukava saada ohjelmaan myös kunnollinen kattaus.

Journalistista infografiikkaa Asuntokuumeessa ja Ylioppilaslehdessä

Kukas kissan hännän jne. Ajattelin, että olisi jälleen hyvä hetki mainostaa hieman omia tekemisiään.

Tämänkertaisen omakehun aiheena on journalistinen infografiikka. Tiedon visualisoinnin perinteisimpiä käyttöyhteyksiähän on nimenomaan uutisten ja muiden ajankohtaisten aiheiden havainnollistaminen journalistisessa kontekstissa. Viime vuosina on kovasti päätään nostanut datajournalismi, jossa kyse on siitä että juttu syntyy suurta datamassaa analysoimalla. Tässä visualisointi näyttelee usein merkittävää roolia.

Olen itsekin pistänyt lusikkani tähän visuaalisen journalismin soppaan paitsi mm. kouluttamalla uutisgrafiikan tekijöitä Aalto PRO -täydennyskoulutuskeskuksessa yhdessä Jonatanin kanssa, myös toimittamalla infografiikkapalstaa Ylioppilaslehteen.

Ensi perjantaina julkaistavassa numerossa nähdään yllä oleva kuvioni YK:n ihmisoikeusenuvoston päätöslauselmista, joiden valossa tosiaan näyttää siltä, että Israelia ei kohdella aivan tasapuolisesti muihin maihin verrattuna. Aikaisemmat juttuni ovat käsitelleet mm. vuotuista työaikaa eri Euroopan maissa, onnellisuuden ja julkisen sektorin roolin suhdetta sekä polkupyöräkypärän käytön merkitystä pyöräilijöiden turvallisuudelle.

Uutena aluevaltauksena aloitin tänä maanantaina myös Asuntokuume-sivuston infografiikkakolumnistina. Tästä pestistä olen hyvin innoissani! Tarkoituksena olisi joka viikko esitellä tekstin ja grafiikan voimin erilaista asumiseen ja asuntomarkkinoihin liittyvää tilastotietoa meiltä ja muualta. Ensimmäinen artikkelini käsittelee omistus- ja vuokra-asumisen yleisyyttä eri EU-maissa. Jos teillä on hyviä ideoita siitä, millaisia aiheita tulevissa postauksissa voitaisiin käsitellä tai palautetta tästä ensimmäisestä jutusta, niin laittakaa ihmeessä tulemaan. Kaikki palaute on kullanarvoista ja otetaan taatusti huomioon!

 

Tiedon visualisointia Helsingin katukuvassa

Tänään alkoi Helsingin designpääkaupunkivuoteen liittyvä tiedon visualisoitia tunnetuksi tekemään pyrkivä kampanja joka pyörii vaiheittain keskustan ulkomainospaikoilla kolme viikkoa. Me toteutimme kampanjaan 8 julistetta, joiden lisäksi sisältöä on tuottanut Wonderwater-porukka. Designpääkaupunkihankkeen ja meidän sisällöntuottajien lisäksi kamppikseen ovat olleet myötävaikuttamassa Idealist Group ja BOTH. Monta kokkia siis, mutta lopputuloksena ihan kelpo soppa.

Julkaisemme kampanjaa varten toteutetut visualisoinnit myös verkossa Creative Commons nimeä-tarttuva 1.0 suomi -lisenssillä, olkaapa hyvät.

HS Openin satoa

Maanantainen HS Open tuotti kiinnostavia tuloksia, mutta osoitti taas kerran miten hankalaa homma visualisointien tekeminen on kun sekä data on vaihtelevan laatuista että työkalut hakevat muotoaan.

Informaatiomuotoilu.fi:n porukasta minä ja Tommi olimme mukana ja kuuluimme sattumoisin molemmat ryhmiin jotka askartelivat saman kysymyksen parissa: miten asuntojen hintapyynnöt korreloivat toteutuneiden kauppahintojen kanssa. Toisen ryhmän tuloksien pohjalta saatiin aikaiseksi kiinnostava artikkeli netti-Hesariin, jossa näkökulmaa on haettu myös kiinteistövälittäjältä ja aiheeseen perehtyneiltä tutkijoilta. Jutussa Helsingin kaupungin tietokeskuksen tutkija Henrik Lönnqvist kiinnittää aivan aiheellisesti huomiota datan yhteismitallisuuden ongelmiin. Oikotie-palvelusta saatu aineisto hintapyynnöistä on kattavaa, mutta sen sijaan toteutuneista kaupoista saatu data ei ole. Omassa ryhmässäni mukana ollut toimittaja Tuomo Pietiläinen teki julkisuuslain mukaisen tietopyynnön tarkemman datan saamiseksi, mutta saa nähdä johtaako se mihinkään. Nyt jouduimme tyytymään ympäristöministeriön ja ARAn ylläpitämästä Asuntojen hintatiedot -palvelusta raavittuun aineistoon, joka on ladattavissa HS Next -blogista. Se kertoo kaupat vain kadun tarkkuudella vuoden ajalta yksilöimättä kaupankäyntiajankohtaa, minkä johdosta on melko mahdoton tehtävä yrittää katsoa millä hinnalla joku tietty asunto on mennyt kaupaksi.

Kaikkien hintapyyntöjen vertaamisessa kaikkiin toteutuneisiin kauppoihin on ilmeisiä ongelmia, jo siksi että toteutuneita kauppoja on aineistossa paljon vähemmän kuin hintapyyntöjä, joten hintapyynnöissä lienee mukana spekulatiivista kauppaa (myyntiin ei ole akuuttia tarvetta, mutta kokeillaan saisiko hyvän hinnan jos myisi) mikä on omiaan nostamaan hintapyyntöjen keskiarvoa. Tähän kuitenkin oli tyydyttävä. Omassa ryhmässäni aikomus oli tehdä jaotteluja asuntojen koon mukaan, mutta sitä ei tiukassa aikataulussa ehditty tehdä. Näin ollen esimerkiksi jos alueella on myynnissä monen kokoisia asuntoja, mutta kauppa on käynyt vain tietyn kokoisista asunnoista, keskimääräinen neliöhinta on voitu laskea hintapyynnöissä ja toteutuneissa kaupoissa ihan eri kokoisista kämpistä joka on jälleen omiaan vääristämään lopputulosta.

Itse kuuluin siis kolmihenkiseen ryhmään, jossa minun ja Pietiläisen lisäksi mukana oli vielä Seravon Otto Kekäläinen. Me taistelimme samojen aineisto-ongelmien kanssa kuin toinenkin ryhmä, mutta valitsemamme visualisointitapa, koropleettikartta, tuotti vielä lisää harmaita hiuksia. Datasta helposti saatava aluejako kun olisi postinumeroalueet, mutta niitä taas ei vaikuta löytyvän vektorina avoimella lisenssillä mistään. Karttakeskus kyllä myisi aineistoa ystävällisesti 922,50 euron hintaan. Helsinki Region Infosharen kautta saatavilla olisi pien-, suur- ja tilastoalueet vektorina, mutta jostain syystä postinumeroalueita ei tunnu löytyvän mistään. Loppujen lopuksi päädyimme hätäratkaisuna piirtämään käsipelillä alueet käsiinsaamamme jo hieman vanhentuneen kartan pohjalta, josta puuttui mm. Östersundomin alue. (Tulevaisuuden tarpeita ajatellen We Love Open Datan Martti Leppänen teki ansiokasta työtä laatimalla taulukon, jonka avulla postinumeroalueet voi sovittaa peruspiireihin. Ihan kaikkia ongelmia tämäkään ei toki ratkaise, mutta auttaa paljon.)

Kaikken tämän säädön vuoksi kävi sitten niin, että oma ryhmäni ei saanut oikein mitään valmista maanantaina. Viikon mittaan luppohetkinä on kuitenkin viimeistelty se työ joka maanantaina aloitettiin. Lopputulos, Nodeboxilla ja Illustratorilla työstetty koropleettikartta näyttää tältä:

Punainen väri ilmaisee, että toteutuneiden kauppojen keskimääräinen neliöhinta on hintapyyntöjä pienempi, vihreä taas että suurempi. Värin intensiteetti tai värikylläisyys kertoo kuinka paljon suurempi tai pienempi ja sen tummuus taas pyrkii ilmaisemaan tehtyjen kauppojen määrää, siten että tummemmilla alueilla kauppoja on tehty enemmän ja vaaleammilla vähemmän, ajatuksena siis että erotuksen merkitys on pienempi kuin kauppoja on tehty vain vähän, eli otos on pieni. Käytännössä tuli kuitenkin huomattua, että värin intensiteetti ja tummuus on aika hankala erottaa toisistaan ja asetuksia hieman peukaloimalla syntyy kovin erilaisia lopputuloksia kuten yllä olevasta kolmesta eri variaatiosta huomaa. Ongelmakohdaksi muodostui mm. 00160-postinumeroalue (Katajanokka), jossa kauppoja oli tehty hyvin vähän (18 kpl), mutta ero hinnoissa oli valtava (yli tuhat euroa neliöltä), tai toisaalta 00980-alue (Vuosaari), jossa kauppoja oli paljon (110 kpl), mutta hintaero verrattain pieni (n. 120 € neliöltä). Näistä kolmesta vaihtoehdosta ylin tuntuu ilmaisevan visuaalisesti parhaiten sen minkä numerodata kertoo, mutta sekään ei ole täysin tyydyttävä. Esimerkiksi Jollaksen 00850-postinumeroalue katoaa kartalta melkein kokonaan, koska siellä on tehty vain kolme järjestelmään tallentunutta asuntokauppaa. Tästä opin ainakin, että väriskaalan suunnitteluun kannattaa varata aikaa ja miettiä myös sen teknistä toteutusta. Nyt ratkaisuna oli muuttujien arvojen pyöräyttäminen suoraan HSB-värimallin arvoiksi pienin painotuksin, mutta paremmalta näin jälkikäteen ajatellen tuntuisi tehdä kaksiulotteinen ”liukuvärikartta” josta osa-alueiden värit sitten poimittaisiin.

Kysyn vielä Otolta, saako karttaan menneen raakadatan julkaista (se ei ole aivan täsmälleen sama kuin HS Next -blogissa julkaistu, koska se on raavittu hieman eri aikaan ja palvelua on ilmeisesti välissä päivitetty) ja jos saan myöntävän vastauksen, lisään sen tähän loppuun jos jollakulla on kiinnostusta katsoa millaisesta datasta kartta on muodostunut.

Datajournalismin päivä 29.9. Tampereella

Datajournalismin verkosto järjestää ensimmäisen Datajournalismin päivän Tampereella tämän viikon torstaina eli 29.9.2011. Päivän teemana on ”Kaupunkidata ja paikallisjournalismi – kuntavaalit 2012”. Olen mukana tapahtumassa tuuraamassa IBM:n Peter Bakia joka aikataulusyistä ei pääse paikalle. Pidän siis esityksen tiedon visualisoinnista, minkä lisäksi osallistun ”juttuakvaarioon” jossa yritämme saada päivän aikana tehtyä uutisia ja visualisointeja Tampereen ja Jyväskylän kaupunkien päätöksentekoaineistoista, eli kunnan eri toimielinten pöytäkirjoista yms.

Maksuttomaan tapahtumaan taitaa mahtua vielä muutama mattimyöhäinen osallistuja paikan päälläkin jos ilmoittautuu pikimmiten, mutta tapahtuma lähetetään myös suorana verkkolähtyksenä Bambuser-palvelun kautta.

Lisäys 11.10.2011: Esitys löytyy nyt myös videoituna verkosta.