Slate’s language map and messy census data

2014-05-13 linkit, , , Ei kommentteja

Slate.com published a fun article and set of maps about the languages spoken in the U.S., other than English and Spanish.

One of the maps struck me as somewhat surprising:

CBOX_BlattLanguage_2.jpg.CROP.original-original

 

Is New York really the only state where Chinese is the most spoken language after English and Spanish? And why no African languages made it to the map?

Being the nerd I am, I looked up the original data from the American Community Survey (the data source referred to in the original article) using Census Bureau’s American FactFinder. And it would indeed seem that the data on the map is (partially) wrong – or at least it doesn’t match the data I could find.

The table below has the correct most-spoken non-English, non-Spanish language (or group of languages) for each state, with the ones that were wrong in the original map highlighted:

Alabama German
Alaska Other Native North American languages
Arizona Navajo
Arkansas German
California Chinese
Colorado German
Connecticut Polish
Delaware Chinese
Florida French Creole
Georgia Korean
Hawaii Other Pacific Island languages
Idaho German
Illinois Polish
Indiana German
Iowa German
Kansas German
Kentucky German
Louisiana French (incl. Patois, Cajun)
Maine French (incl. Patois, Cajun)
Maryland African languages
Massachusetts Portuguese or Portuguese Creole
Michigan Arabic
Minnesota African languages
Mississippi Vietnamese
Missouri German
Montana Other Native North American languages
Nebraska Vietnamese
Nevada Tagalog
New Hampshire  French (incl. Patois, Cajun)
New Jersey Chinese
New Mexico Navajo
New York Chinese
North Carolina Chinese
North Dakota  German
Ohio German
Oklahoma Vietnamese
Oregon Chinese
Pennsylvania Chinese
Rhode Island Portuguese or Portuguese Creole
South Carolina German
South Dakota Other Native North American languages
Tennessee German
Texas Vietnamese
Utah Other Pacific Island languages
Vermont French (incl. Patois, Cajun)
Virginia Korean
Washington Chinese
West Virginia German/French (exact same number of speakers)
Wisconsin Hmong
Wyoming German

What could explain the errors? For starters, I’m probably using at least a slightly different data set from the original author, as I couldn’t find a data that had the “Other” categories broken down in the same level of detail as in the Slate article. (I’m using a data set “LANGUAGE SPOKEN AT HOME BY ABILITY TO SPEAK ENGLISH FOR THE POPULATION 5 YEARS AND OVER, 2008-2012 American Community Survey 5-Year Estimates”, which should be the most reliable current data available on the FactFinder web site.) So if the original article is using older but more detailed data, e.g. from 2005–07, that could explain at least some of the difference.

Another plausible scenario is that Slate uses the wrong data column in the same/similar data set. The data I used includes three values for each language: the total number of speakers, those who “speak English ‘very well’”, and those who “speak English less than ‘very well’”. With a quick glance at the data it seems to me that the original map actually shows the language with the biggest number of those “very well” speaking people, not the total speakers, but I didn’t test this hypothesis thoroughly.

Whatever the problem here, I can’t really blame the original author. The Census Bureau’s several websites are awfully difficult to use, the categorizations used are confusing and the data formats are a mess. It was hard work to simply get the data for all the states and clean it up into a usable format. (Now that I’ve done the job once, you can download the data here in a more user-friendly format if you want to play with it.)

This seems to unfortunately typical of a lot of open government data all around the world. A few magnificent exceptions aside, too much of the world’s open data is in an obscure or messy data format, hidden behind a crappy interface, accessible only to the most dedicated of hacks and wonks. As happy as I am for Gapminder, Google Public Data, and the like, I would rather see governments themselves clean up their act and start thinking seriously about how Joe Public can actually access their data. It isn’t enough that the data exists somewhere in some format. It needs to be accessible for regular people.


Kiitokset taas seminaarivieraille!

2013-10-15 tapahtumat, , , , , , , , , Yksi kommentti

Tieto näkyväksi -seminaarimme järjestettiin 20.9. toisen kerran. Paikka oli jälleen Kauppakorkeakoulun suuri juhlasali. Kuten viime vuonna käyneet muistavat, ensimmäinen seminaari oli satelliittitapahtuma OKFestivalille, jossa osa järjestäjistä oli myös pitämässä ohjelmaa. Tämänvuotinen pidettiin itsenäisenä tapahtumana, joka järjestettiin Aallon ja sponsorien voimin. Osa viimevuotisista kävijöistämme saapui festivaalin lippuvaihtojärjestelyn kautta, ja muistan kesällä miettineeni, saammeko tällä kertaa vastaavasti yleisöä ilman suuremman tapahtuman tuomaa vetoa. Huoli oli turha, sillä tapahtuma myytiin loppuun.
Koska ohjelmaa oli kahdella kielellä, päätimme tänäkin vuonna jakaa tapahtuman aamu- ja iltapäivän osioihin, joista ensimmäinen oli suomeksi ja toinen englanniksi. Tapahtuman videotaltioinnista ja striimauksesta kiitämme Aleksi Mustosta, joka laittoi ohjelman nähtäväksi Bambuser-palveluun.

Kyyriainen_7646

Kun vieraat olivat istuutuneet, seurasi avajaispuheenvuoro. John Nurmisen säätiön hallituksen puheenjohtaja, merenkulkuneuvos Juha Nurminen osoittautui todelliseksi asiantuntijaksi puheessaan karttojen ja visualisointien yhteiskunnallisesta vaikuttavuudesta. Esityksessä oli uutta ja kiinnostavaa tietoa kartografian historiaakin tunteville. Nykyajan esimerkki oli kuva Itämeren levätilanteesta, joka tekee selväksi ympäristöongelman laajuuden. Puhdas Itämeri -hankkeeseen voi tutustua projektin sivuilla.

Hannu Kyyriäinen on infografiikkaan erikoistunut graafinen suunnittelija. Hänen työnsä Suomen Kuvalehdessä on maamme mittapuulla poikkeuksellisen korkeatasoista ja monimuotoista. Hänen visualisointinsa Palestiinan aluemenetyksistä sijoittui pronssisijalle arvostetussa Malofiej-kilpailussa aiemmin tänä vuonna, ja esityksessään hän kävi läpi monia muitakin mielenkiintoisia töitään. Niihin voi perehtyä tarkemmin hänen Flickr-sivuillaan.

Vaajakallio_7711

Kirsikka Vaajakallio esittelee haastatteluaineistoa

Kirsikka Vaajakallio on palvelumuotoilija, jonka työtapa on yhteissuunnittelu. Siihen kuuluu tuotteen tai palvelun varsinaisen käyttäjän mukaan ottaminen jo suunnitteluprosessin alkuvaiheissa. Saman tavan soisi yleistyvän myös tiedon esittämisessä, sillä kokeneinkin suunnittelija ei vain tule ajatelleeksi kaikkia yleisön tarpeita. Esityksessään Vaajakallio kertoi joistakin käyttämistään työskentelymenetelmistä, joista ehkä kiinnostavimpia olivat suunnittelupelit. Ne ovat tilanteeseen räätälöityjä seurapelejä, joiden avulla suunnitelutyöhön tottumattomat voivat jakaa ideoitaan helpommin.

Markku Mikkola-Roos on Suomen ympäristökeskuksen biodiversiteettiyksikön vanhempi tutkija, joka on erikoistunut lintujen suojeluun. Hänen puheenvuoronsa käsitteli tunnistusoppaita perinpohjaisella tavalla. Olin itse yllättynyt, kuinka vanhoja monet alan konventiot ovat. Historialliseen läpikäyntiin kuului tietenkin myös arvio nykytilanteesta. Siinä kävi ilmi, kuinka valokuvia käyttävillä oppailla on omat rajoituksensa piirrettyihin havainnekuviin verrattuna.

Peltomaki_7867

Tuomas Peltomäki kertoo verkostojen hienoudesta

Datajournalisti Tuomas Peltomäki esitteli puheenvuorossaan seikkaperäisesti suomalaista lobbausverkostoa esittävää visualisointityötään. Twitterissä esitystä luonnehdittiin stand-upiksi, ja siinä oli myös omasta mielestäni terävää ja mukaansatempaavaa huumoria. Työhön vaadittu datamäärä oli päätähuimaava ja sen käsittely vaati uusien työtapojen kehittämistä ja vanhojen soveltamista. Visualisointiin ja sen materiaaleihin voi tutustua Peltomäen verkkosivuilla.

Ohjelman viimeinen suomenkielinen puhuja oli valokuvaaja ja filosofian tohtori Leena Saraste. Hänen aiheensa koski valokuvan totuusarvoa ja sen mielikuvia muokkaavaa voimaa. Ajatus valokuvasta todisteena ja ilmaisuvälineenä on ristiriitainen ja siksi kiinnostava. Monet ajatukset ja lainaukset olivat provosoivia, kuten väittämä ”ihmiset haluavat tulla petetyiksi”. Näiden tukena oli mielenkiintoisia esimerkkejä ikonisista ja myös vähemmän tunnetuista valokuvista, joiden aihe ja ilmaisutapa olivat tarkkaan harkittuja. Kuvista ei näe, mitä on todella tapahtunut, sillä totuus ei löydy niistä itsestään.

Tauon jälkeen alkoi englanninkielinen osuus, jonka avasi Svenska Dagbladetin graafinen journalisti Thomas Molén. Hänen kuuluisin työnsä lienee Malofiej-kilpailussa pääpalkinnon saanut grafiikka euroviisujen äänestyskäyttäytymisestä. Molén on infografiikkanörtti ja ylpeä siitä. Esityksessä näkyi helposti nörttimäisten piirteiden etu hyvän infografiikan tekemisessä. Kun mielenkiinto syttyy helposti ja tekijällä on luontainen kyky syventyä sekä kiinnostusta teknologiaan, lopputulos on myös lukijalle syvempi ja mielenkiintoisempi.

Rees_8019

Kim Rees

Ensimmäinen Keynote-puhujamme oli yhdysvaltalaisen Periscopic-suunnittelutoimiston perustaja Kim Rees. Toimisto on tunnettu visuaalisista datatarinoistaan, joita yritykset, järjestöt ja julkinen sektori tilaavat esittämään toimintaansa ja tavoitteitaan.
Periscopicin tunnuslause on do good with data. Töiden aiheet ovat yhteiskuntaan, terveyteen ja ympäristöön liittyviä ja ne herättävät voimakkaita tunteita. Etenkin asekuolemien takia varastetuista vuosista kertova esitys oli vähäeleisyydestään huolimatta (tai ehkä juuri sen takia) koskettava. Kerronnallisesta ja tunteita herättävästä puolestaan huolimatta hyvän visualisoinnin on pohjattava todellisuuteen, ja mieleenpainuvien esitysten vahvuus on niiden rehellisyydessä. Läpinäkyvä data tekee esittäjän haavoittuvaksi, mutta rakentaa luottamusta.

Lounastauko oli tänä vuonna erityisen pitkä, sillä sali piti antaa hetkeksi valmistujaistilaisuuden käyttöön. Toisaalta tämä oli hyväkin asia, sillä tiiviit esitykset herättivät ajatuksia ja niitä oli mukava sulatella muiden kävijöiden kanssa.

Cairo_8173

Ohjelma jatkui toisella keynote-puheenvuoroistamme, jonka piti espanjalainen Alberto Cairo. Hän on pitkän linjan graafinen journalisti ja valistaja, jonka kirja The Functional Art on luultavasti tämän hetken paras teos informaatiomuotoilun tekemisestä. Cairon esitys oli perusteellinen läpikäynti siitä, mitä todella laadukkaan visualisointityön tekeminen vaatii. Eräs hänen keskeisistä viesteistään on, että kuvallisen esityksen tekijä ei ole tietoa koristeleva käsityöläinen vaan sisältöön paneutuva viestinnän ammattilainen, jolla on journalistinen vastuu. Lukijan ymmärrys voi olla seurausta ainoastaan tekijän ymmärryksestä.
Graafisen journalistin työ on suuressa määrin myös ryhmätyötä muiden viestinnän tekijöiden sekä asiantuntijoiden kanssa. Tapausesimerkeissä tuli esille, kuinka asiantuntijan kuuleminen lisää uusia ulottuvuuksia ja syvyyttä esitykseen. Toivoisin, että meillä Suomessa annettaisiin useammin puitteet tehdä tällä tasolla datalöhtöistä kuvallista journalismia.

Päivän viimeinen puhuja oli alankomaalainen informaatiomuotoilija Frédérik Ruys. Cairon tavoin hän painotti ymmärryksestä syntyvän oivalluksen merkitystä työssään (lainaamallaan termillä infogasm). Ruys esitteli vaikuttavan ja työlään hankkeen Nederland van Boven (Alankomaat ilmasta), joka on televisioon tuotettu dokumenttisarja. Siinä yhdistetään taitavasti kuvattua ilmakuvaa huolellisesti tutkittuun informaatiomuotoiluun tavalla, joka antaa arkielämän ilmiöistä uuden kuvan. Visualisoinneissa esitettiin hälytysajoneuvojen liikettä päivän aikana ja valtamerialusten liikennettä Euroopan vilkkaimpaan satamaan. Kiehtovin esimerkki oli kuitenkin haikaran päivän aikana tekemä lentoreitti, jossa näkyy kuinka lintu käyttää ihmisen toimintaa ja rakennettua ympäristöä hyväkseen.
Hiottu lopputulos vaati runsaasti taustatyötä ja useita ideoita oli hylättävä, koska visualisointi ei sopinut välineen kerronnallisiin vaatimuksiin. Visualisointien tekijänä oli mielenkiintoista seurata, kuinka usean osa-alueen pallottelu nopean työprosessin aikana onnistui näinkin sujuvasti.

ulkoa_7742

Haluamme kiittää kaikkia seminaarivieraitamme kiinnostuksestanne ja hyvistä kysymyksistä. Lisäksi kiitos kuuluu myös muille järjestelyssä auttaneille sekä sponsoreille. Oli jälleen haastavaa ja palkitsevaa suunnitella ohjelma, joka olisi yhtä monipuolinen kuin yleisömme.

Valokuvat: Pekka Niittyvirta


Kiitokset seminaarissa käyneille!

2012-09-28 tapahtumat, , , , , , 2 kommenttia

Tieto näkyväksi -seminaarimme järjestettiin 17.9. Kauppakorkeakoulun juhlasalissa OKFestivalin satelliittitapahtumana. Yleisön kiinnostus ylitti kaikki odotuksemme ja vahvisti käsitystä, että tiedon kuvallinen esittäminen on ajankohtainen aihe monella alalla. Tärkein tavoitteemme oli saada muutkin kuin visuaalisten alojen ihmiset kiinnostumaan aiheesta, ja tässä onnistuimme mielestäni oikein hyvin.

Ohjelmaan kuului suomen- ja englanninkielisiä puheenvuoroja ja päivän puhujat jaettiin kielen mukaan etteivät suomea osaamattomat seminaarikävijät joutuisi seuraamaan esitystä kielellä, jota eivät osaa. Tapahtuman videotaltioinnista haluaisimme kiittää Infocrean Jarmo Lahtea. Seminaarivieras Kaisa Kyläkoski on Storify-palvelussa puolestaan koostanut kätevän yhteenvedon seminaarista, josta näkee yleisön kommenteja twitterissä ja muualla verkossa http://storify.com/K_KM_K/tieto-nakyvaksi.

Kun vieraat olivat kirjautuneet ja saaneet kahvia, Suomen Akatemian pääjohtaja Heikki Mannila toivotti kaikki tervetulleiksi. OKFestivalin hengessä puheenvuoro käsitteli tiedon käytettävyyttä yhteiskunnassa: julkinen tieto ei tosiaankaan kulu käytössä.
Ensimmäinen seminaaripuhe oli Paula Ahonen-Rainion Kun tiedolla on sijainti – kartan mahti ja sen rajat. Saimme kuulla eri valinnoista, joita karttaa laatiessa joutuu tekemään sekä karttojen uusista muodoista ja käyttökohteista. Jos jollakulla oli käsitys kartoista arvoneutraalina välineenä, mieli toivottavasti muuttui esityksen aikana.

Tapio Vapaasalo ja Terike Haapoja

Kuvataiteilija Terike Haapojan esityksessä nähtiin tiedon käyttämistä elämysten luomiseen. Hänen alaansa on joskus datataiteeksi kutsuttu ilmaisun muoto, jossa eri välineillä ja tekniikoilla tehdään koettavaksi sellaisia ilmiöitä, jotka ovat arkikokemuksessa näkymättömiä. Olimme seminaarin sivuilla kertoneet jo hänen Hiilipuu-hankkeestaan, mutta vieraita kiinnosti ehkä sitäkin enemmän Entropia-videoteos, jossa näkyy lämmön hiipuminen kuolleen hevosen ruhosta.

Eri EU-maita kuvaavat Chernoffin naamat Vehkalahden esityksessä.

Kimmo Vehkalahden esitys palasi informaatiomuotoilun yleisimmän raaka-aineen eli tilastojen pariin. Niinkin monimutkaista aihetta kuin maan talouden vointia voi esittää yhdellä kuvalla eri keinoin, joista oli esimerkkinä Chernoffin naamat. Vehkalahti on kokenut esiintyjä ja avasi hyvin aihetta maallikkoyleisöllekin.
Tilastojen ymmärtämisen jälkeen kuultiin sarjakuvataiteilija Ville Tietäväisen puhe, jossa hän kertoi tekemistään kerronnallisista valinnoista kuvituksissa ja sarjakuvissa. Tietäväinen on sarjakuvaihmiseksikin harvinaisen analyyttinen tekijä ja oli kiinnostavaa kuulla, miten hienovaraisimpien tyylivalintojen taustalla vaikuttivat monimutkaiset syyt. Esitystä ei ole videotaltioinnilla.
Tuomas Siitosen puheenvuorossa nähtiin kahdet esimerkkitapaukset tiedon havainnollistamisesta. Ensimmäinen oli helsinkiläisille suunniteltu näyttely, jossa asukkaiden omista valinnoista johtuvia ilmastovaikutuksia visualisoitiin ymmärrettävällä tavalla: ostoskorilla, jossa jokaisen esineen tilavuus vastasi jokaisen kulutusvalinnan hiilidioksidipäästömäärää. Toinen hanke oli kirja, jonka tarkoitus oli rohkaista Selkämeren alueen kestävää kehitystä.
Stefania Passeran ja Helena Haapion selkeyttämistä käsittelevä esitys oli ensimmäinen englanninkielinen osa ohjelmaa. Heillä on kiinnostava ja kunnianhimoinen tavoite tehdä sopimukset helpommin ymmärrettäviksi osin visualisoinnin avulla. Sopimusten selkeyden puutteesta oli varoittava esimerkkitapaus, jossa yhdestä pilkusta seurasi kriittinen tulkintaero ja miljoonien hintainen oikeusjuttu. Aiheesta kirjoitti vieraamme Harri Juntunen blogissaan.

Rob Waller

Lounaan jälkeen Rob Waller jatkoi selkeämmän esittämisen teemaa keynote-puheessaan. Vaikka brittiläisen ja suomalaisen selkokielisyysliikkeen välillä on eroja, tavoitteet ovat samat. Ymmärrettävyys lisää yksilön valtaa omasta elämästään. Wallerin työstä voi lukea lisää Simplification Centren sivuilta.
Yannick Assogban esitys koski myös inhimillistä aihetta. Hän esitteli kuvallista mikroblogihanketta, jossa visualisoitiin ihmisten jokapäiväisiä asioita kuten työntekoa, nukkumista ja mielialaa. Näistä avautuu tarinoita ja totuuksia ihmisten elämästä, joista tullaan tietoisiksi vasta kun niille annetaan muoto.
Moritz Stefaner esitteli seuraavaksi kahta projektiaan, Emotoa ja dataruuanlaittoa. Emoto kartoitti Twitter-viestien pohjalta yleisön tunteita Lontoon olympialaisista. Eri aiheista syntyi tietokuvioita tuntemusten laadun mukaan. Ruuanlaittotyöpaja oli kokeileva tapa esittää dataa kulinaarisin keinoin. Raaka-aineilla on maistettavia suureita ja jatkumolle sijoitettavia ominaisuuksia kuten datallakin, ja työpajaan osallistuvat ihmiset yhdistelivät niitä koekeittiössä. Tästä syntyi esimerkiksi diagrammikiisseli ja kahdella muhennoskaaviolla toimiva datavertailu.

Farida Vis taustanaan Youtube-käyttäjien verkostoja.

Farida Vis oli myös käyttänyt Twitter-viestejä tutkimuksen aineistona. Hän oli seurannut Britannian mellakoiden käsittelyä ja keskustelun aiheiden muutoksia käyttäjien viesteissä. Visin mukaan datajournalismissa on hyvä ymmärtää laadullisen tiedon merkitys määrällisen lisäksi. Kuva ei itsessään puhu puolestaan vaan vaatii usein tarinan saadakseen rakennetta. Farida Visin luentokalvot löytyvät myös Slidesharesta: What do data visualisations want? 
Viimeisenä esityksenä kuultiin Jer Thorpin keynote-puhe, jossa hän esitteli äärimmäisen vaikuttavia visualisointejaan (vaikutteina muun muassa Minority Report -elokuvan elekäyttöliittymä) ja kannusti ihmisiä ottamaan henkilökohtaisen datansa paremmin haltuun ympäristössä, jossa palveluntarjoajat ja laitevalmistajat keräävät sitä jatkuvasti.

Jer Thorp luennoi

Kiitämme kaikkia seminaarissa käyneitä sekä paikallaolosta että mielenkiintoisista kysymyksistä ja keskusteluista. Olitte loistava yleisö. Toisin kuin ehdin pelätä, tapahtuma pysyi jopa melko hyvin aikataulussa suuresta kävijämäärästä huolimatta, mistä kiitän avustajiamme.

Valokuvat: Katri Naukkarinen

* * *

Alla myös tilastotietoa seminaarikävijöistä. Tiedot on kerätty useista lähteistä ja niissä voi olla pieniä epätarkkuuksia. Seminaari-ilmoittautumisista suurin osa tuli Aallon eAge-ilmoittautumisjärjestelmän kautta, mutta tämän lisäksi ryhmäilmoittautumisia, kutsuvieraita sekä OKFestival-lippuvaihdon kautta tulleita ja viime hetken lisäyksiä, peruutuksia ja muutoksia tuli sen verran että numerot eivät liene aivan täsmällisen tarkkoja.


OKFestivalin koko ohjelma julkistettu

2012-08-28 tapahtumat, , , , , Ei kommentteja

Helsingissä 17.–22.9. järjestettävä maailman suurin avoimen datan tapahtuma OKFestival on viimein julkistanut koko ohjelmistonsa. Kiinnostavaa on vaikka kuinka paljon, mutta jos nyt muutama erityinen tärppi nostetaan tiedon visualisoinnista kiinnostuneille, niitä ovat tietenkin Informaatiomuotoilu.fi:n järjestämä Tieto Näkyväksi -seminaari maanantaina 17.9., Datajournalism/Datavisualization topic streamin ohjelmisto (pääosin tiistaina 18.9.), Hans Roslingin keynote-puheenvuoro torstaina 20.9. ja Helsingin Sanomien HSOpen-työpaja perjantaina 21.9.

Kannattaa tsekata koko ohjelmisto ja hankkia lippu pikimmiten, toistaiseksi niitä on vielä jäljellä, mutta ei loputtomiin. :) Lippuja voi ostaa päiväkohtaisesti tai koko viikoksi ja tarjontaan nähden ne ovat hyvinkin kohtuuhintaisia. Osa sessioista vaatii erillisen ennakkoilmoittautumisen (esim. HSOpenin ilmoittautumislomake on täällä) eivätkä kaikki halukkaat välttämättä mahdu mukaan vaikka festivaalilippu olisikin plakkarissa. Tämä kannattaa tarkistaa sessiokohtaisesti tapahtuman nettisivuilta. Tieto Näkyväksi -seminaariinhan pitää hankkia kokonaan erillinen lippu, joskin pieni erä seminaarilippuja tulee jossain välissä nopeat syövät hitaat -periaatteella jakoon myös viikon festaripassin hankkineille.

Nähdään Arabianrannassa!

PS. Tulkaa ihmeessä nykäisemään hihasta tapahtuman aikana, olen ainakin maanantaina ja tiistaina paikalla koko päivän ja vaihdan mielelläni ajatuksia blogin lukijoiden kanssa. Lisäksi teen myös vähän dj-hommia useampanakin päivänä tapahtuman yhteydessä… ;)


OKFestivalin ohjelmisto alkaa rakentua, tähtipuhujana Hans Rosling

2012-06-18 tapahtumat, , , , Ei kommentteja

Helsingissä syyskuussa järjestettävän maailman suurimman avoimen datan tapahtuman OKFestivalin ohjelmisto alkaa hahmottua. Tänään julkistettiin tapahtuman ohjelman perusrakenne ja ensimmäiset kansainväliset puhujavieraat. Datajournalismista ja tiedon visualisoinnista kiinnostuneille on luvassa herkkua koko rahan edestä: Lauantaina 15.9., sunnuntaina 16.9. ja maanantaina 17.9. on aihetta sivuavat satelliittitapahtumat, tiistaina 18.9. varsinainen virallisen ohjelmiston datajournalismi- ja visualisointipäivä ja torstaina 21.9. vielä Hans Roslingin keynote-puheenvuoro! Jos Hans Rosling ei vielä ole tuttu nimi, kannattaa heti tutustua hänen TED-konferensseissa pitämiin esitelmiinsä, joista varsinkin vanhin, vuoden 2006 TEDissä pidetty ja jo yli neljä miljoonaa kertaa katsottu esitys on vakuuttava esimerkki siitä miten tiedon visualisointi voi muuttaa sitä, miten näemme maailman.

Kuten aiemmin tuli mainittua, olen itse mukana suunnittelemassa OKFestivalin datajournalismi- ja datavisualisointiohjelmistoa ja maanantain 17.9. satelliittitapahtuma, laajalle yleisölle suunnattu tiedon kuvallisen esittämisen eri tapoja tunnetuksi tekevä Tieto näkyväksi -seminaari on kokonaan Informaatiomuotoilu.fi:n tuottama. Viime mainitusta lisää aivan lähipäivinä, kannattaa olla kuulolla. ;) Myös muusta ohjelmasta alkanee tippua lisätietoa tasaiseen tahtiin aivan näinä päivinä ja paljon kiinnostavaa löytyy myös festivaalin 12 muun sisältöteeman alta.

Myös liput tapahtumaan ovat myynnissä nyt. Early bird -hinta (40 € / päivä tai 100 € / koko viikko) on voimassa 31.7. asti, tosin eivät normaalihintaisetkaan liput kalliita ole varsinkaan huomioiden tapahtuman erittäin korkeatasoisen ohjelmiston. Itse suosittelen ehdottomasti koko viikon pakettia jos vain aikataulu mitenkään antaa myöten.


Apps4Finland 2012

2012-06-16 uutiset, , , Ei kommentteja

Tämänvuotinen Apps4Finland-kilpailu on julkistettu. Kyseessä on siis suomalainen avoimen datan sovelluskilpailu, eräänlainen ”avoimen datan Vuoden Huiput”. Kisaan voi ilmoittaa mitä hyvänsä vuoden 2012 aikana julkaistuja kotimaista avointa dataa hyödyntäviä sovelluksia, visualisointeja tai ideoita sellaisiksi. Palkintoja jaetaan myös datan avaajille ja tämän vuoden uutuutena ”dataopas”-sarjassa avoimen datan käyttöön opastaville ohjeillle. Viime vuotisen kisan tulosten perusteella ja avoimen datan ympärillä käyvän pöhinän perusteella uskallan arvata, että tänä vuonna tullaan näkemään todella korkeatasoinen kattaus kilpailutöitä.

Kilpailun deadline on 28.10. eli vielä ei tarvitse sännätä kilpailutöitä jättämään (niiden vastaanotto alkaakin vasta 1.8.), mutta kannattaa jo nyt laittaa kisa mieleen. Viime vuonna visualisointisarjan kärki oli terävä mutta kapea, joten tasokkailla visualisoinneilla on uskoakseni hyvät mahdollisuudet palkintosijoille. Toki tänä vuonna kisa saattaa olla aiempaa kovempi, koska meiltä (Informaatiomuotoilu.fi) on tänä vuonna ensimmäistä kertaa tulossa jokunen kilpailutyö. ;) Kannattaa silti osallistua! Kilpailu on hyvä tapa saada näkyvyyttä projekteilleen ja syksyllä järjestettävä Apps4Finland-gaala on myös erinomainen tilaisuus verkostoitua alan muiden toimijoiden kanssa.


OKFestivalin ohjelmahaku käynnissä, visualisoinnit mukana yhtenä aihealueena

2012-05-15 tapahtumat, , , Ei kommentteja

Helsingissä ensi syksynä järjestettävän maailman suurimman avoimen datan tapahtuman, OKFestivalin ohjelmahaun ensimmäinen kierros saatiin päätökseen jo jokin aika sitten. Nyt luvassa on toinen kierros ja ensimmäisen kierroksen perusteella syntyneet festivaalin sisältöteematkin on julkistettu. Lisää tietoa löytyy OKFestivalin sivuilta.

Yhtenä teemoista on ”Data Journalism and Data Visualization” ja allekirjoittaneella on kunnia toimia yhtenä tämän teeman ”guest programme plannerista” Jens FinnäsinJohanna Vehkoon, Miska KnapekinLucy Chambersin ja Liliana Bounegrun ohella. Eli nyt niitä loistavia ideoita tulemaan! Luentoja, paneelikeskusteluja, työpajoja, taide-esityksiä ja installaatioita… Kunhan liittyy avoimen datan hyödyntämiseen jollain tapaa. Erityisesti heitän palloa nyt tässä designereille. Avoin data on perinteisesti ollut teknisemmin orientoituneiden ihmisten leikkikenttä ja uskon että tekniikkavetoisista ohjelmaehdotuksista ei tule olemaan pulaa. Design-lähtöistä tekemistä olisi mukava saada ohjelmaan myös kunnollinen kattaus.


Lisää Open Data Kitchen -videoita

2012-02-15 linkit, , , , Ei kommentteja

HRI:n visualisointiblogi julkaisi vielä pari videota lisää taannoisesta Open Data Kitchenistä. Näissä äänessä ovat Informaatiomuotoilu.fi:n lisäksi We Love Open Datan Miska sekä mm. Pikseliähky-festarista tuttu Juha Huuskonen. Ensimmäisessä videossa puhutaan avoimen datan visualisoinnista yleisemmällä tasolla ja tässä toisessa spesifimmin siihen käytetyistä työkaluista. Videotuotanto on, tuota, hieman karu (ei, silmäni eivät oikeasti ole noin turvoksissa :D), mutta mielestäni sisältävät ihan mielenkiintoista jutustelua, jos aihe sattuu kinnostamaan.


Stadi.tv:n Open Data Kitchen -juttu

2012-02-10 linkit, , , Ei kommentteja

Stadi.tv teki lauantain Open Data Kitchenistä mainion viiden minuutin pätkän, jossa ODK-konseptista ja avoimen datan iloista yleisemminkin puhumassa allekirjoittanut sekä We Love Open Datan Martti.


Tietosivu kaupunginosista

2012-02-09 artikkelit, , , , , 2 kommenttia

Helsingin kaupungin tietokeskuksella on varsin paljon dataa Helsingistä kaupunginosien tasolla. Yksittäisistä taulukoista tai edes Tilastollisesta vuosikirjasta ei kuitenkaan ole aina helppoa hahmottaa kokonaiskuvaa yksittäisistä kaupunginosista. Siksi päätimme viime viikonlopun Open Data Kitchenissä yhdessä Janne Aukian ja We Love Open Datan kanssa tehdä pienen työkalun, jonka avulla voi luoda tietosivuja kaupunginosadatasta.

Työkalu ei ole valmis, mutta se on toimiva prototyyppi jolla pystyy visualisoimaan erilaista dataa kaupunginosista, kunhan se on ensin käsitelty sopivasti muotoilluiksi csv-tiedostoiksi. Mielenkiintoinen jatkokehitysmahdollisuus työkalulle olisi esimerkiksi verkkopohjainen versio, jonka avulla kävijä voisi tulostaa tai jakaa valitsemansa dataa omasta kaupunginosastaan.

Projekti on rakennettu Nodeboxilla ja on ladattavissa kokonaisuudessaan Githubista: https://github.com/jaukia/odk-localdata.
Pdf-tulosteet kaikista kaupunginosista löytyvät täältä.

Kartta perustuu kaupungin avoimeen seutukarttaan, joka on Qgisin ja kml-to-svg-konvertterin avulla muutettu svg-muotoon.

English summary: We made a tool for creating local data sheets from Helsinki city district level data in collaboration with  Janne Aukia ja We Love Open Data. It is made in Nodebox  and is available on Github: https://github.com/jaukia/odk-localdata