”Kuva on arvokkaimmillaan kun se pakottaa meidät huomaamaan jotakin, mitä emme ikinä osanneet odottaa näkevämme.”

— John Tukey

Tieto näkyväksi -seminaari 18.9., puhujina mm. Robert Simmon ja Stefanie Posavec

2014-06-30 tapahtumat, , , , Ei kommentteja

Tiedon kuvallista esittämistä yleistajuisesti käsittelevä Tieto näkyväksi -seminaari järjestetään tänä syksynä kolmatta kertaa. Tapahtuma-ajankohta on torstai 18.9. Edelliset kaksi seminaaria (2012, 2013) olivat molemmat menestyksiä, keräten kumpikin n. 600 osallistujaa.

Tämän syksyn puhujiksi on kiinnitetty NASAn Earth Observatoryssa työskentelevä Robert Simmon, freelance-suunnittelija Stefanie Posavec sekä The Economist -lehden Graham Douglas. Lisää puhujia ja tarkempia tietoja tapahtumasta julkistetaan elokuussa.

Liput tapahtumaan ovat myynnissä nyt ja early bird -hinnat (–25 %) ovat voimassa heinäkuun loppuun. Opiskelijoille tapahtuma on ilmainen, mutta vaatii ilmoittautumisen lipunmyyntijärjestelmän kautta.

Lisätietoja tapahtuman nettisivuilta ja Facebook-sivulta. Tervetuloa!


Are carbohydrates really the culprit behind the obesity epidemic?

2014-06-05 grafiikka, , , , , Ei kommentteja

Obesity is a global health problem. It is obiviously linked to diet in some way, but the exact nature of this link is the subject of volumes of research, and also of heated exchanges online. One school of thought, occasionally exhibiting quasi-religious tendencies in some of its advocates, claims that the obesity epidemic is mainly caused by our diet being too rich in carbohydrates from cereals and other such sources, as well as vegetable oils. As a solution, they advocate changing to a diet rich in animal fats, meat, eggs and so on.

Inspired by the coverage of a recent piece in The Lancet about rising obesity rates, as well as a somewhat uncritical book review in The Economist I decided to see myself if the publicly available data on obesity and diets could be tortured into confessing something on the issue.

I need to emphasize that this is not a scientific study. Describing the methods used as rigorous would be a stretch, to say the least. A few potential problems with the data and with my handling of it are outlined in the end of this article, and the list is by no means exhaustive. What this is, is a bit of light-weight data journalism that will hopefully inspire discussion and possibly more serious research into the data.

I used this WHO data on obesity (the same used by the Lancet authors), combined with agricultural statistics from FAO to see if the number of overweight and obese people in a country was correlated with the intake of various foods.

To capture the effect of changing diets, I used the data from several different years within a single country as separate data points where historical data was available. If you disagree with this choice, you can switch the view to show only the most recent data.

The end result is below, an interactive scatterplot that shows how the consumption of various foods correlates with the number of overweight and obese people in each country. The idea of the visual presentation is that the reader can look at the full dataset and not need to rely on single numbers such as averages or correlation coefficients.

In light of these numbers, there is no evidence that high cereal consumption is linked with obesity on a country level. If anything, the correlation between the share of overweight adults and cereal consumption is mildly negative (r = –0.18). With starchy roots (such as potato) there is no correlation whatsoever (r = 0.08).

The correlation between vegetable oils and overweight is moderate (r = 0.33), though not much greater than with the consumption of animal fats (r = 0.23). It should be noted, though, that the consumption of animal fats is very small in most non-Western countries, so not very many conclusions can necessarily be drawn from this comparison.

The strongest correlation in the data with the share of overweight adults is with meat consumption (r = 0.5). Not surprisingly, the correlation with sugar and sweeteners is also reasonably strong (r = 0.43).

The correlation with meat consumption and obesity is probably at least partially due to the fact that higher meat consumption is typical of higher living standards overall, which also often means a higher total calorie intake and less physical work. The existence of these types of confounding variables is amply demonstrated by the fact that the correlation of overweight with the consumption of fruits is also moderate (r = 0.32). Practically no one believes eating fruits makes you fat, so the explanation is probably that fruit intake is also simply correlated with higher living standards.

So what’s the take-home messge? I would interpret the data so that no single group of foods is responsible for the obesity epidemic by itself, certainly not cereals. This sort of population-level comparison using somewhat patchy data can hardly settle the matter by itself, but I would still argue that if cereals (and carbohydrates in general) were really so bad, there should be a sliver of the effect visible in the data even on this coarse level. Which there isn’t, as you can see.

The jury is still out on vegetable oils, but if we want to explain away the high correlation of meat consumption with the share of overweight adults, I would argue similar confounding factors are to be found here; the use of vegetable oils in the West has risen with the overall rise of living standards. So if you want to argue that the correlation of obesity with meat intake is spurious, the same should probably said of the clearly weaker correlation with vegetable oils – and vice versa.

The next step would be to compare the calorie intake from different kinds of foods instead of the absolute numbers (kg/capita/year), which could possibly help to overcome the fact that a rise in living standards affects both the total calorie intake and the mix of different types of foods consumed.

Potential sources of error

Apart the whole project being executed within the span of two working days, and by a designer with no scientific training to speak of, there are some specific details in the data and how it was processed that can be sources of error.

FAO’s data shows the “food supply”, that is, the food theoretically available for human consumption, not the actual food intake. Factors such as wastage are not taken into account, and may vary from country to country.

WHO’s data on obesity is collected using methods and samples differing from country to country and may thus not be directly comparable. There were some examples in the data where a change in the numbers was clearly an artifact of the data collection process, not representative of the change in the facts on the ground; for example the share of overweight people dropping from 59.8 to 46.2 percent in a single year in Australia 2000–2001. In such cases the most recent data was assumed to be reliable, and the older data was discarded.

The selection of countries for which the data is available is much better representative of high-income Western countries than world’s other regions, which is bound to effect the overall picture.

Because the number of years for which historical data was available varied greatly between different countries, not all years for which data was available were used. A more balanced subset was instead attempted by picking only some years, far apart enough to exhibit clear changes in dietary patterns. The method used is extremely arbitrary, and probably effects the end result.

The final dataset used for the visualization was created with a custom Python script from messy original data by a non-programmer, a process which is a highly probable source of error. The final data was superficially examined for flaws (and the script corrected several times accordingly), but it has not been rigorously and thoroughly scrutinized in the way required for e.g. scientific publication and thus scripting errors remain a potential source of errors in the data. For those interested in assessing the data quality themselves, the processed data can be downloaded as a tsv file (which is similar to csv, except using tabs instead commas as separators) here.


Eurovaalien kovin kilpailu käytiin vihreiden ja demarien välillä

2014-05-27 grafiikka, , , , 9 kommenttia

Eurovaalituloksen ensimmäisissä analyyseissä on noussut vahvasti esiin arvio, että viime eurovaaleihin nähden huonosti menestyneet vihreät menettivät ääniä ennen kaikkea hallitusvastuusta keväällä luopuneelle vasemmistoliitolle. Koko maan lukuja katsoessa tämä on houkutteleva tulkinta, olihan vasemmiston vaalivoitto suunnilleen vihreiden tappion suuruinen.

Ilmeisin selitys ei kuitenkaan välttämättä pidä paikkaansa tarkemman analyysin valossa. Jos vihreät olisivat menettäneet äänestäjiään ennen kaikkea vasemmistoliitolle, tämän pitäisi näkyä äänestysaluekohtaisessa tarkastelussa niin, että vihreiden tappio olisi suurin niillä alueilla joissa vasemmisto on onnistunut houkuttelemaan eniten äänestäjiä. Näin ei kuitenkaan näyttäisi olevan.

Tein vertailun sunnuntain eurovaalien ja vuoden 2012 kunnallisvaalien tuloksesta äänestysalueittain. (Vertailu edellisiin eurovaaleihin ei onnistu yhtä helposti, koska ainakaan vielä tätä kirjoittaessa oikeusministeriö ei ole julkaissut vuoden 2009 äänestysaluekohtaisia tuloksia yhtä kätevässä kootussa koneluettavassa muodossa kuin vuoden 2012 kuntavaaleista ja 2014 eurovaaleista on saatavilla. Tieto on sinänsä saatavilla ja ajan salliessa koitan myöhemmin ottaa sen mukaan analyysiin.) Satunnaisvaihtelun karsimiseksi otin mukaan vain sellaiset äänestysalueet, joilla molemmissa vaaleissa oli annettu yhteensä vähintään tuhat ääntä.

Käytin korrelaation mittarina helposti laskettavaa Pearsonin korrelaatiokerrointa, joka ei välttämättä ole paras mahdollinen tilastollinen analyysimenetelmä, mutta olen sen oheen tehnyt myös interaktiivisen grafiikan, jonka avulla lukija voi itse arvioida, kertovatko pelkät numerot koko totuuden vaalituloksesta.

Grafiikassa voi valita vaaka- ja pystyakselille yhden kahdeksasta isoimmasta eduskuntapuolueesta, muiden puolueiden yhteisen äänisaaliin tai yleisen äänestysaktiivisuuden. Akselien arvot ovat siis muutoksia puolueen kyseisen äänestysalueen äänistä saamassa prosenttiosuudessa vuoden 2012 kuntavaalien ja viime sunnuntain eurovaalien välillä. Renkaiden värit viittaavat vaalipiiriin. Tarkemmat tiedot äänestysalueesta saa viemällä hiiren sitä kuvaavan renkaan päälle.

Jos vaaka- ja pystyakselille valittujen puolueiden vaalituloksen välillä on vahva yhteys niin, että toinen on selvästi vienyt ääniä toiselta, äänestysalueita kuvaavien renkaiden muodostaman pistepilven pitäisi muodostua kuvion lävistäjän ympärille. Vaaka- tai pystysuuntainen pilvi viittaa siihen, ettei yhteyttä puolueiden vaalimenestyksen välillä ole. (Tällaista kuviotyyppiä kutsutaan parvikuvioksi.)

Vihreiden ja vasemmistoliiton vaalimenestystä kuvaava kuvio on voimakkaasti pystysuuntainen, joka tarkoittaa, että vihreiden ääniosuus on vaihdellut paljon edellisistä vaaleista äänestysalueesta riippuen, kun taas vasemmistoliitto on parantanut ääniosuuttaan keskimäärin melko tasaisesti eri puolilla maata. Vahvaa yhteyttä ääniosuuden muutoksien välillä ei näy, korrelaatiokerroin saa arvon r = –0,15 jota ei voi pitää kovin suurena.

Sen sijaan vihreiden ja SDP:n vaalimenestyksen välillä näkyy huomattavasti vahvempi yhteys, r = –0,48. Vihreiden menestys korreloi melko voimakkaasti myös äänestysaktiivisuuden muutoksen kanssa: r = –0,41. Nopea tulkinta on, että SDP on menettänyt äänestäjiään vihreille, mutta vihreät toisesta päästä nukkuvien puolueelle. (Korjaus: Ensimmäisessä versiossa tähän oli lipsahtanut ajatusvirhe. Jos vihreät olisi menettänyt ääniä ennen kaikkea äänestysaktiivisuuden laskun kautta, korrelaatiokertoimen pitäisi olla positiivinen. Nyt tilanne on päin vastoin niin, että vihreät ovat erityisesti menestyneet niillä äänestysalueilla joilla äänestysaktiivisuus laski paljon kuntavaaleihin verrattuna.) Muitakin potentiaalisia selityksiä luvuille varmasti löytyy, mutta selkeästi yhteys vihreiden ja demarien äänimenestyksen välillä on paljon vahvempi kuin vihreiden ja vasemmiston välillä.

Muiden puolueiden vaalituloksen väliltä ei löydy yhtä vahvoja yhteyksiä. Vahvimmat yksittäiset taisteluparit ovat RKP & kokoomus (r = –0,29) ja perussuomalaiset & kokoomus (r = –0,30). Mielenkiintoinen yllätys on myös vasemmistoliiton ja keskustan pieni kilvoittelu (r = –0,23). Vasemmiston tuore meppi Merja Kyllönen menestyi erinomaisesti juuri Pohjois-Suomessa ja kilpaili äänistä varmasti paljon esimerkiksi Paavo Väyrysen kanssa.

Grafiikassa on vielä pieniä teknisiä virheitä, mutta sen muodostama yleiskuva lienee oikea. Eri asia on kuinka pitkälle meneviä johtopäätöksiä lukujen perusteella voi vielä tehdä. Kuntavaalit ja eurovaalit ovat luonteeltaan erilaisia ja äänestäjät saattavat valita puolueensa näissä vaaleissa kovinkin eri perustein. Toimikoon tämä kuitenkin pienenä datajournalistisena keskustelunavauksena vaalituloksen syvempään analyysiin. Lukijoilla on myös epäilemättä paljon kommentteja valittuihin analyysimenetelmiin ja grafiikan toteutukseen, jotka koitan sitten parhaani mukaan huomioida sitten seuraavassa versiossa. :)

Lisäys 28.4.: Työkaluun on nyt lisätty mahdollisuus tarkastella aiemman ääniosuuden absoluuttisen muutoksen (%-yksikköä) myös äänimäärän absoluuttista muutosta (kpl) sekä ääniosuuden suhteellista muutosta (% suhteessa kuntavaaleihin). Absoluuttisten äänimäärien tarkastelu tarjoaa heikompia korrelaatioita kuin aiempi ääniosuuden muutos, mutta edelleen vihreiden vahvin korrelaatio säilyy nimenomaan demareihin ja vihreät on myös ainut puolue jonka kanssa SDP:n tuloksella on selvästi nollasta poikkeava negatiivinen korrelatio, vaikka kerroin onkin pieni (r = –0,26). Vihreiden ja vasemmistoliiton valtakunnallinen korrelaatio on edelleen heikko. Vihreiden vahvimmilla alueilla Helsingissä ja Uudellamaalla vasemmisto näyttäisi ehkä jonkin verran rokottaneen vihreiden tulosta, mutta vihreiden tappio absoluuttisissa äänissä mitattuna on suurempi kuin vasemmiston voitto.

(Huomautettakoon että absoluuttisen äänimäärien vertaaminen äänestysaktiivisuuteen – joka tässä on annettujen äänten määrän prosentuaalinen lasku kuntavaaleista, ei muutos prosenttiyksikköinä – ei anna järkeviä tuloksia, koska äänestysaktiivisuuden ja isojen puolueiden absoluuttisen äänimäärän korrelaatio on suuri ja pienten puolueiden pieni johtuen ihan siitä miten korrelaatio lasketaan.) Itse asiassa näin ei ole, vaan absoluuttisten äänimäärien vertailu äänestysaktiivisuuteen paljastaa että vihreät ja RKP kärsivät vähiten laskeneesta äänestysaktiivisuudesta, kun taas muiden puolueiden tulos korreloi positiivisesti äänestysaktiivisuuden muutoksen kanssa.


Slate’s language map and messy census data

2014-05-13 linkit, , , Ei kommentteja

Slate.com published a fun article and set of maps about the languages spoken in the U.S., other than English and Spanish.

One of the maps struck me as somewhat surprising:

CBOX_BlattLanguage_2.jpg.CROP.original-original

 

Is New York really the only state where Chinese is the most spoken language after English and Spanish? And why no African languages made it to the map?

Being the nerd I am, I looked up the original data from the American Community Survey (the data source referred to in the original article) using Census Bureau’s American FactFinder. And it would indeed seem that the data on the map is (partially) wrong – or at least it doesn’t match the data I could find.

The table below has the correct most-spoken non-English, non-Spanish language (or group of languages) for each state, with the ones that were wrong in the original map highlighted:

Alabama German
Alaska Other Native North American languages
Arizona Navajo
Arkansas German
California Chinese
Colorado German
Connecticut Polish
Delaware Chinese
Florida French Creole
Georgia Korean
Hawaii Other Pacific Island languages
Idaho German
Illinois Polish
Indiana German
Iowa German
Kansas German
Kentucky German
Louisiana French (incl. Patois, Cajun)
Maine French (incl. Patois, Cajun)
Maryland African languages
Massachusetts Portuguese or Portuguese Creole
Michigan Arabic
Minnesota African languages
Mississippi Vietnamese
Missouri German
Montana Other Native North American languages
Nebraska Vietnamese
Nevada Tagalog
New Hampshire  French (incl. Patois, Cajun)
New Jersey Chinese
New Mexico Navajo
New York Chinese
North Carolina Chinese
North Dakota  German
Ohio German
Oklahoma Vietnamese
Oregon Chinese
Pennsylvania Chinese
Rhode Island Portuguese or Portuguese Creole
South Carolina German
South Dakota Other Native North American languages
Tennessee German
Texas Vietnamese
Utah Other Pacific Island languages
Vermont French (incl. Patois, Cajun)
Virginia Korean
Washington Chinese
West Virginia German/French (exact same number of speakers)
Wisconsin Hmong
Wyoming German

What could explain the errors? For starters, I’m probably using at least a slightly different data set from the original author, as I couldn’t find a data that had the “Other” categories broken down in the same level of detail as in the Slate article. (I’m using a data set “LANGUAGE SPOKEN AT HOME BY ABILITY TO SPEAK ENGLISH FOR THE POPULATION 5 YEARS AND OVER, 2008-2012 American Community Survey 5-Year Estimates”, which should be the most reliable current data available on the FactFinder web site.) So if the original article is using older but more detailed data, e.g. from 2005–07, that could explain at least some of the difference.

Another plausible scenario is that Slate uses the wrong data column in the same/similar data set. The data I used includes three values for each language: the total number of speakers, those who “speak English ‘very well’”, and those who “speak English less than ‘very well’”. With a quick glance at the data it seems to me that the original map actually shows the language with the biggest number of those “very well” speaking people, not the total speakers, but I didn’t test this hypothesis thoroughly.

Whatever the problem here, I can’t really blame the original author. The Census Bureau’s several websites are awfully difficult to use, the categorizations used are confusing and the data formats are a mess. It was hard work to simply get the data for all the states and clean it up into a usable format. (Now that I’ve done the job once, you can download the data here in a more user-friendly format if you want to play with it.)

This seems to unfortunately typical of a lot of open government data all around the world. A few magnificent exceptions aside, too much of the world’s open data is in an obscure or messy data format, hidden behind a crappy interface, accessible only to the most dedicated of hacks and wonks. As happy as I am for Gapminder, Google Public Data, and the like, I would rather see governments themselves clean up their act and start thinking seriously about how Joe Public can actually access their data. It isn’t enough that the data exists somewhere in some format. It needs to be accessible for regular people.


Suomen karttakuvan kehitys

2014-03-30 artikkelit, linkit, , , , , , , Ei kommentteja

Helsingin Sanomat on julkaissut hauskan artikkelin Suomen ilmaantumisesta maailmankartalle (ilmaisun kirjaimellisessa merkityksessä). Itse karttakuvat saisivat kyllä olla vielä isompia!

Olen itse työstänyt samasta aiheesta tekstiä ensi vuoden alussa julkaistavaan Informaatiomuotoilu-kirjaamme, mutta näillä näkymin sitä ei tulla ainakaan tässä laajuudessa käyttämään, joten ajattelin että tämä voisi olla hyvä tilaisuus julkaista teksti täällä blogissa.

Hesarin artikkelissa mainituista karttaprojektioiden eroista minulla on valmiina myös varsin kattava teksti, mutta sitä saatte odottaa kirjan julkaisuun asti. :)

* * *

Pohjoismaita kuvaava Tabula Rogerianan osa (saksalainen faksimiili 1800-luvulta). Pohjoinen on kartassa alhaalla.

Pohjoismaita kuvaava Tabula Rogerianan osa (saksalainen faksimiili 1800-luvulta). Pohjoinen on kartassa alhaalla.

Suomi hiipi maailmankartalle vähitellen. Ylipäänsä Pohjois-Euroopan karttakuvan kehitys on ollut hyvin hidas prosessi. Karttoja tehtiin läntisessä kulttuuripiirissä lähinnä Välimeren maissa ja tehdyt kartat kuvasivat pääasiassa Euroopan eteläisempiä osia. Helsingin yliopiston pohjoismaiden historian dosentti Mikko Huhtamies on todennut, että vielä Kalmarin unionin aikaan (1397–1523) hallitsijoilla ei ollut minkäänlaista käsitystä siitä, miltä heidän valtakuntansa olisi kartalla näyttänyt. Suomen ja Venäjän välinen rajakin oli vuosisatojen ajan vain luettelo rajamerkeistä erämaassa.

Jos edes Skandinavia kartalle mahtui – yleensä lisälehtenä, tabula nova, eteläisempiä alueita kuvaavaan varsinaiseen karttaan – se kuvattiin yleensä saarena. Joissain kartoissa niemimaa yhdistyy mantereeseen kapean maakaistaleen välityksellä, mutta tätä ei voine vielä pitää varsinaisesti Suomen kuvauksena. Suomalaisia paikannimiä ei näissä varhaisimmissa kartoissa vielä esiinny.

Tabula Rogeriana (1154) nimeää kaksi suomalaista paikannimeä: ”Abu(r)a” (Turku*) ja ”Tabast” (Häme). Tanskalaisen Claudius Clavuksen 1427 laatima kuuluisa Pohjoismaiden kartta on kadonnut, mutta siitä on säilynyt myöhempiä painettuja versioita, joista vanhin on vuodelta 1482. Tässä vielä varsin epätarkassa kartassa esiintyy paikannimi ”Findlandi”, jonka on tulkittu tarkoittavan Varsinais-Suomea. Fra Mauron maailmankartassa mainitaan ”Fillandia”-nimisen maan lisäksi ainakin ”Vibògo” (Viipuri) ja ”Abo” (Turku).

 Jacob Zieglerin kartassa vuodelta 1532 Suomen maantieteellinen sijainti osana Pohjoismaita alkaa hahmottua jo oikein, vaikka rantaviivan muoto onkin vielä aika kaukana todellisuudesta. Suomalaisia paikannimiä mainitaan jo useita, mm. ”Chimene” (Kemi), ”Strobothnia” (Pohjanmaa), ”Peunthe” (Päijänne), ”Hango” (Hanko), ”Custa” (Kustavi) ja ”Rasburghum” (Raasepori).

Varsinainen läpimurtoteos on kuitenkin ruotsalaissyntyisen Olaus Magnuksen Roomassa 1539 julkaisema Carta marina, joka kuvaa koko Pohjoismaat, mukaan lukien Suomen, merkittävästi tarkemmin ja yksityiskohtaisemmin kuin kukaan ennen tätä. Suomalaisia paikannimiä mainitaan toistasataa, tosin maan sisäosat on kuvattu vielä puutteellisesti. Maantieteellisen tiedon lisäksi kartassa on kuvattu mm. kansojen elintapoja, sodankäyntimenetelmiä ja historiallisia tapahtumia, kuten Viipurin pamaus.

Myös Orteliuksen (1570), Waghenaerin (1588) ja Mercatorin (1595) kartastoissa Suomi kuvataan jo melko kattavasti, mutta vasta Ruotsin maanmittauslaitoksen perustajan Anders Buren tarkkoihin mittauksiin ja laajaan tietojenkeruuseen perustunut Orbis arctoi nova et accurata delineatio vuodelta 1626 antoi Suomen maantieteestä ratkaisevasti Carta Marinaa paremman kokonaiskuvan. Buren kartta pysyikin toistasataa vuotta perusteoksena, johon muut Pohjolan karttoja laatineet kartografit työnsä pohjasivat.

Suomen aluetta kuvaavat kartat laadittiin pitkään Tukholmasta tai vieläkin kauempaa käsin. Aidosti kotimaisen kartografian varhaisvaiheita edustavat 1640-luvulta alkaen kylittäin laaditut maakirjakartat. Niistä kehittivät vähitellen pitäjänkartat, jotka muodostivat 1940-luvulle asti suomalaisen kartta-aineiston rungon ja joita varten tehdylle pohjatyölle muut kartat lähes aina rakentuivat.

Merkittävä piristysruiske suomalaiselle maanmittaustoiminnalle oli Ranskan tiedeakatemian retkikunnan 1736–37 Tornionjokilaaksossa tekemä, Newtonin fysiikan teorioiden testaamiseen liittynyt laaja mittaushanke, joka toi maahan uusia menetelmiä ja välineitä.

1740-luvulla perustettiin isojaoksi kutsutun maatalousmaan uudelleenjaon toteuttamista varten maanmittauskomissio. Sen merkittävimmistä hankkeista mainittakoon Eric af Wetterstedtin johdolla laadittu ja vuorineuvos S. G. Hermelinin kustantama kattava Suomen kartasto (1799) joka oli yleisesti käytössä 1800-luvun puoliväliin saakka.

Venäjän vallan aika toi pitäjänkarttojen rinnalle uuden sotilaskäyttöön tarkoitetun karttatyypin jota kutsuttiin topografikartoiksi. Nämä kaksi karttatyyppiä yhdistettiin 1947 alkaen peruskartoiksi, jotka edelleen ovat kattavin Suomea kuvaava kartta-aineisto. Peruskarttojen lisäksi Maanmittauslaitos tuottaa mm. maastokarttoja.

Kuntien tuottamat kantakartat ovat vielä maasto- ja peruskarttojakin tarkempia karttoja, joita käytettään mm. kaavoituksen ja rakennustöiden suunnittelun pohjana.

Maanmittauslaitos julkaisi toukokuussa 2012 suurimman osan sähköisistä kartta-aineistoistaan vapaasti ladattavaksi ja käytettäväksi.

*) Turun kaupunki tosin perustettiin nykykäsityksen mukaan vasta 1249, joten voi olla että tällä on tarkoitettu jotain muuta paikkaa. Jonkinlainen markkinapaikka nykyisen Turun seudulla on toki hyvinkin voinut olla jo 1100-luvun puolivälin tienoilla kun tiedot karttaa varten on kerätty. Joka tapauksessa Al-Idrisin kartta oli alkujaan arabiankielinen ja Pohjolan eksoottiset paikannimet ovat voineet vääristyä niitä latinalaiseen kirjaimistoon muutettaessa. Karttoja on myös täydennetty uudelleenpiirtämisten yhteydessä, joten kyseessä voi olla myös myöhempi lisäys jota ei alkuperäisessä kartassa ole ollut.


Helsingin kartta vuodelta 1770 + nykyinen rantaviiva

2014-01-17 grafiikka, linkit, , Ei kommentteja

Helsingin kaupunkisuunnitteluvirasto on julkaissut Facebook-sivuillaan hienoja vanhoja karttoja Helsingistä. Tänään vuorossa oli vuonna 1777 julkaistu kartta. On kiehtovaa miten paljon kaupunki on muuttunut vajaassa 250 vuodessa. Vaikka paikannimistö on tuttua, harva katu kulkee enää samassa paikassa kuin tuolloin ja vielä harvempi rakennus on enää pystyssä.

Yksi suuri kaupunkikuvaan vaikuttanut tekijä on maantäytöt, joilla Helsingin rantaviivaa on muokattu viimeisen parinsadan vuoden aikana hurjasti. Hahmottaakseni itsekin paremmin, miten vanhan kartan paikat vastaavat nykyisiä tein kartasta version, johon on lisätty nykyinen rantaviiva (kuva aukeaa klikkaamalla isommaksi).

helsinki1770_nykyinen_rantaviiva

Koska 1700-luvun maanmittaustekniikat eivät olleet nykyisten veroisia, vanhan kartan vääristymät ovat melko isoja eikä nykyistä rantaviivaa saanut kohdilleen täsmällisesti. Olen sovittanut sen silmämääräisesti ja muutenkin suurpiirteisesti, joten kuva on lähinnä suuntaa-antava, mutta varmaan sellaisenaankin auttaa hahmottamaan muutosta.

 


Kiitokset taas seminaarivieraille!

2013-10-15 tapahtumat, , , , , , , , , Yksi kommentti

Tieto näkyväksi -seminaarimme järjestettiin 20.9. toisen kerran. Paikka oli jälleen Kauppakorkeakoulun suuri juhlasali. Kuten viime vuonna käyneet muistavat, ensimmäinen seminaari oli satelliittitapahtuma OKFestivalille, jossa osa järjestäjistä oli myös pitämässä ohjelmaa. Tämänvuotinen pidettiin itsenäisenä tapahtumana, joka järjestettiin Aallon ja sponsorien voimin. Osa viimevuotisista kävijöistämme saapui festivaalin lippuvaihtojärjestelyn kautta, ja muistan kesällä miettineeni, saammeko tällä kertaa vastaavasti yleisöä ilman suuremman tapahtuman tuomaa vetoa. Huoli oli turha, sillä tapahtuma myytiin loppuun.
Koska ohjelmaa oli kahdella kielellä, päätimme tänäkin vuonna jakaa tapahtuman aamu- ja iltapäivän osioihin, joista ensimmäinen oli suomeksi ja toinen englanniksi. Tapahtuman videotaltioinnista ja striimauksesta kiitämme Aleksi Mustosta, joka laittoi ohjelman nähtäväksi Bambuser-palveluun.

Kyyriainen_7646

Kun vieraat olivat istuutuneet, seurasi avajaispuheenvuoro. John Nurmisen säätiön hallituksen puheenjohtaja, merenkulkuneuvos Juha Nurminen osoittautui todelliseksi asiantuntijaksi puheessaan karttojen ja visualisointien yhteiskunnallisesta vaikuttavuudesta. Esityksessä oli uutta ja kiinnostavaa tietoa kartografian historiaakin tunteville. Nykyajan esimerkki oli kuva Itämeren levätilanteesta, joka tekee selväksi ympäristöongelman laajuuden. Puhdas Itämeri -hankkeeseen voi tutustua projektin sivuilla.

Hannu Kyyriäinen on infografiikkaan erikoistunut graafinen suunnittelija. Hänen työnsä Suomen Kuvalehdessä on maamme mittapuulla poikkeuksellisen korkeatasoista ja monimuotoista. Hänen visualisointinsa Palestiinan aluemenetyksistä sijoittui pronssisijalle arvostetussa Malofiej-kilpailussa aiemmin tänä vuonna, ja esityksessään hän kävi läpi monia muitakin mielenkiintoisia töitään. Niihin voi perehtyä tarkemmin hänen Flickr-sivuillaan.

Vaajakallio_7711

Kirsikka Vaajakallio esittelee haastatteluaineistoa

Kirsikka Vaajakallio on palvelumuotoilija, jonka työtapa on yhteissuunnittelu. Siihen kuuluu tuotteen tai palvelun varsinaisen käyttäjän mukaan ottaminen jo suunnitteluprosessin alkuvaiheissa. Saman tavan soisi yleistyvän myös tiedon esittämisessä, sillä kokeneinkin suunnittelija ei vain tule ajatelleeksi kaikkia yleisön tarpeita. Esityksessään Vaajakallio kertoi joistakin käyttämistään työskentelymenetelmistä, joista ehkä kiinnostavimpia olivat suunnittelupelit. Ne ovat tilanteeseen räätälöityjä seurapelejä, joiden avulla suunnitelutyöhön tottumattomat voivat jakaa ideoitaan helpommin.

Markku Mikkola-Roos on Suomen ympäristökeskuksen biodiversiteettiyksikön vanhempi tutkija, joka on erikoistunut lintujen suojeluun. Hänen puheenvuoronsa käsitteli tunnistusoppaita perinpohjaisella tavalla. Olin itse yllättynyt, kuinka vanhoja monet alan konventiot ovat. Historialliseen läpikäyntiin kuului tietenkin myös arvio nykytilanteesta. Siinä kävi ilmi, kuinka valokuvia käyttävillä oppailla on omat rajoituksensa piirrettyihin havainnekuviin verrattuna.

Peltomaki_7867

Tuomas Peltomäki kertoo verkostojen hienoudesta

Datajournalisti Tuomas Peltomäki esitteli puheenvuorossaan seikkaperäisesti suomalaista lobbausverkostoa esittävää visualisointityötään. Twitterissä esitystä luonnehdittiin stand-upiksi, ja siinä oli myös omasta mielestäni terävää ja mukaansatempaavaa huumoria. Työhön vaadittu datamäärä oli päätähuimaava ja sen käsittely vaati uusien työtapojen kehittämistä ja vanhojen soveltamista. Visualisointiin ja sen materiaaleihin voi tutustua Peltomäen verkkosivuilla.

Ohjelman viimeinen suomenkielinen puhuja oli valokuvaaja ja filosofian tohtori Leena Saraste. Hänen aiheensa koski valokuvan totuusarvoa ja sen mielikuvia muokkaavaa voimaa. Ajatus valokuvasta todisteena ja ilmaisuvälineenä on ristiriitainen ja siksi kiinnostava. Monet ajatukset ja lainaukset olivat provosoivia, kuten väittämä ”ihmiset haluavat tulla petetyiksi”. Näiden tukena oli mielenkiintoisia esimerkkejä ikonisista ja myös vähemmän tunnetuista valokuvista, joiden aihe ja ilmaisutapa olivat tarkkaan harkittuja. Kuvista ei näe, mitä on todella tapahtunut, sillä totuus ei löydy niistä itsestään.

Tauon jälkeen alkoi englanninkielinen osuus, jonka avasi Svenska Dagbladetin graafinen journalisti Thomas Molén. Hänen kuuluisin työnsä lienee Malofiej-kilpailussa pääpalkinnon saanut grafiikka euroviisujen äänestyskäyttäytymisestä. Molén on infografiikkanörtti ja ylpeä siitä. Esityksessä näkyi helposti nörttimäisten piirteiden etu hyvän infografiikan tekemisessä. Kun mielenkiinto syttyy helposti ja tekijällä on luontainen kyky syventyä sekä kiinnostusta teknologiaan, lopputulos on myös lukijalle syvempi ja mielenkiintoisempi.

Rees_8019

Kim Rees

Ensimmäinen Keynote-puhujamme oli yhdysvaltalaisen Periscopic-suunnittelutoimiston perustaja Kim Rees. Toimisto on tunnettu visuaalisista datatarinoistaan, joita yritykset, järjestöt ja julkinen sektori tilaavat esittämään toimintaansa ja tavoitteitaan.
Periscopicin tunnuslause on do good with data. Töiden aiheet ovat yhteiskuntaan, terveyteen ja ympäristöön liittyviä ja ne herättävät voimakkaita tunteita. Etenkin asekuolemien takia varastetuista vuosista kertova esitys oli vähäeleisyydestään huolimatta (tai ehkä juuri sen takia) koskettava. Kerronnallisesta ja tunteita herättävästä puolestaan huolimatta hyvän visualisoinnin on pohjattava todellisuuteen, ja mieleenpainuvien esitysten vahvuus on niiden rehellisyydessä. Läpinäkyvä data tekee esittäjän haavoittuvaksi, mutta rakentaa luottamusta.

Lounastauko oli tänä vuonna erityisen pitkä, sillä sali piti antaa hetkeksi valmistujaistilaisuuden käyttöön. Toisaalta tämä oli hyväkin asia, sillä tiiviit esitykset herättivät ajatuksia ja niitä oli mukava sulatella muiden kävijöiden kanssa.

Cairo_8173

Ohjelma jatkui toisella keynote-puheenvuoroistamme, jonka piti espanjalainen Alberto Cairo. Hän on pitkän linjan graafinen journalisti ja valistaja, jonka kirja The Functional Art on luultavasti tämän hetken paras teos informaatiomuotoilun tekemisestä. Cairon esitys oli perusteellinen läpikäynti siitä, mitä todella laadukkaan visualisointityön tekeminen vaatii. Eräs hänen keskeisistä viesteistään on, että kuvallisen esityksen tekijä ei ole tietoa koristeleva käsityöläinen vaan sisältöön paneutuva viestinnän ammattilainen, jolla on journalistinen vastuu. Lukijan ymmärrys voi olla seurausta ainoastaan tekijän ymmärryksestä.
Graafisen journalistin työ on suuressa määrin myös ryhmätyötä muiden viestinnän tekijöiden sekä asiantuntijoiden kanssa. Tapausesimerkeissä tuli esille, kuinka asiantuntijan kuuleminen lisää uusia ulottuvuuksia ja syvyyttä esitykseen. Toivoisin, että meillä Suomessa annettaisiin useammin puitteet tehdä tällä tasolla datalöhtöistä kuvallista journalismia.

Päivän viimeinen puhuja oli alankomaalainen informaatiomuotoilija Frédérik Ruys. Cairon tavoin hän painotti ymmärryksestä syntyvän oivalluksen merkitystä työssään (lainaamallaan termillä infogasm). Ruys esitteli vaikuttavan ja työlään hankkeen Nederland van Boven (Alankomaat ilmasta), joka on televisioon tuotettu dokumenttisarja. Siinä yhdistetään taitavasti kuvattua ilmakuvaa huolellisesti tutkittuun informaatiomuotoiluun tavalla, joka antaa arkielämän ilmiöistä uuden kuvan. Visualisoinneissa esitettiin hälytysajoneuvojen liikettä päivän aikana ja valtamerialusten liikennettä Euroopan vilkkaimpaan satamaan. Kiehtovin esimerkki oli kuitenkin haikaran päivän aikana tekemä lentoreitti, jossa näkyy kuinka lintu käyttää ihmisen toimintaa ja rakennettua ympäristöä hyväkseen.
Hiottu lopputulos vaati runsaasti taustatyötä ja useita ideoita oli hylättävä, koska visualisointi ei sopinut välineen kerronnallisiin vaatimuksiin. Visualisointien tekijänä oli mielenkiintoista seurata, kuinka usean osa-alueen pallottelu nopean työprosessin aikana onnistui näinkin sujuvasti.

ulkoa_7742

Haluamme kiittää kaikkia seminaarivieraitamme kiinnostuksestanne ja hyvistä kysymyksistä. Lisäksi kiitos kuuluu myös muille järjestelyssä auttaneille sekä sponsoreille. Oli jälleen haastavaa ja palkitsevaa suunnitella ohjelma, joka olisi yhtä monipuolinen kuin yleisömme.

Valokuvat: Pekka Niittyvirta


Ydintuho sateenkaaren väreissä – vai kuvio aallonkorkeudesta?

2013-10-15 grafiikka, , , , , , , 15 kommenttia

Fukushima-pelottelu

Sosiaalisessa mediassa on viime aikoina levinnyt artikkeleita, joissa väitetään jatkuvien radioaktiivisen veden päästöjen Fukushiman ydinvoimalasta ”myrkyttävän koko Tyynenmeren”. Jokseenkin kaikissa näissä artikkeleissa käytetään kuvituksena oheista Yhdysvaltain sään- ja valtamerentutkimusorganisaation NOAAn tekemää kuviota. Dramaattisen näköinen grafiikka todellakin nopeasti katsottuna vaikuttaa esittävän Japanista aina Pohjois- ja Etelä-Amerikan länsirannikoille asti leviäviä vaarallisen näköisiä virtauksia.

Itse asiassa kyseinen kuvio ei liity radioaktiivisuuteen mitenkään. Se esittää Tyynenmeren aallonkorkeuksia heti vuoden 2011 tuhoisan maanjäristyksen jälkeen, eli kuvaa, kuinka järistyksen aiheuttama tsunami eteni. (Tähän viitaa myös yksikön ”cm” käyttö kartassa Etelä-Amerikan kohdalle sijoitetussa asteikossa.) Alla sama kuvio rajaamattomana ja hieman suurempana, sekä NOAA:n tuottama toinen versio siitä. Urbaanilegendojen ja muiden huhujen todenperäisyyden selvittämiseen erikoistunut sivusto Snopes selittää artikkelissaan tarkemmin, mistä on kyse.

NOAA-Tsunami-plots

Miksi aallonkorkeuksia esittävä kuvio on päätynyt tämän paikkaansapitämättömän pelonlietsonnan välineeksi? Keskeinen syy lienee kuvan hurja väriskaala, jonka katsoja assosioi helposti epätoivottaviin asioihin kuten myrkkyihin ja säteilyyn. Liuku räikeästä vihreästä punaisen kautta intensiiviseen purppuraan näyttää suorastaan hehkuvan tuhoisaa energiaa. Kun kuva irroitetaan alkuperäisestä yhteydestään, muodostuu sen vahvimmaksi viestiksi voimakas ja uhkaava vaikutelma mereen leviävistä ”saasteista”. NOAA:n logo yläkulmasta antaa kuvalle uskottavuutta ja onnettomasti taustaan hukkuva asteikko jää huomioitta. Neutraalimmalla väriskaalalla toteutettuna kuva tuskin olisi päätynyt huijauksen välikappaleeksi. Ohessa pikainen kokeilu, jossa kuvion väriskaalaa on muutettu hillitymmäksi ja taustakartta haaleamman sävyiseksi.

NOAA-Tsunami-plot2_edit

 

Voisiko Fukushiman vuoto edes teoriassa saastuttaa koko Tyynenmeren alueen? Ei. Asia selviää pienellä laskuharjoituksella.

Merivesi sisältää luonnostaan monia radioaktiivisia aineita. Yksinkertaisuuden vuoksi huomioimme laskelmassamme niistä vain uraanin, jota merivedessä on keskimäärin 3,3 milligrammaa kuutiometrissä. Nopea laskutoimitus kertoo että Tyynenmeren 707,5 miljoonaan kuutiokilometriin vettä on uraania liuenneena jo entuudestaan 2 300 miljoonaa tonnia.

Fukushimasta on tähän mennessä vuotanut mereen 300 tonnia saastunutta vettä ja sitä on voimala-alueella säilytyksessä vesisäiliöissä vielä 400 000 tonnia lisää. Ydinvoimalan omistavan TEPCO-sähköyhtiön mukaan veden radioaktiivisuus on ollut enimmillään 580 000 Bq/l, mikä vastaa noin kolmea grammaa uraania litrassa. Mereen tähän mennessä vuotanut radioaktiivinen vesi sisältää siis korkeintaan 972 kiloa uraania vastaavan määrän radioaktiivisia aineita. Entäpä jos TEPCO pimentääkin tietoa ja mereen vuotaa koko ajan lisää radioaktiivista vettä? Kuinka pahasti meri saastuisi, jos voimalasta vuotaisikin tuo 300 tonnia saastunutta vettä päivittäin? Tarkastellaan tätä hieman liioiteltua skenaariota graafisesti:

Uraanigrafiikka2

Huom! Grafiikka päivitetty 16.10. Ks. kommentti artikkelin lopusta.

(Omien suositustemme vastaisesti kuviossa on käytetty kolmiulotteista valeperspektiiviä, koska vertailtavien lukujen ero on niin valtava, että niiden esittäminen pylväs- tai aluekuviolla veisi liikaa tilaa.)

Ei tietenkään ole hyvä asia, että mereen valuu radioaktiivista vettä, mutta on ilmeistä, ettei Fukushiman vuoto mitenkään pysty saastuttamaan koko Tyyntä valtamerta. Pahimmissa kuviteltavissa olevissa skenaarioissa paikallinen tuho Japanin rannikolla voi olla järkyttävä, mutta meren toisella laidalla amerikkalaisten tai australialaisten ei tarvitse missään olosuhteissa pelätä radioaktiivisen saasten kulkeutuvan heille asti. Tämän hetkisillä tiedoilla vuoto tulee luultavasti näkymään kohonneena radioaktiivisuudessa tietyissä Tyynenmeren kaloissa, mutta ei niissäkään kovin vaarallisissa määrin. Täällä Suomessa on lisäksi hyvä muistaa, että maaperämme vuoksi altistumme luonnostaan huomattavasti enemmän radioaktiiviselle säteilylle kuin esimerkiksi Yhdysvaltojen länsirannikon asukkaat.

Ehkäpä tästä kaikesta voidaan oppia se, että grafiikan tekijöiden kannattaa tarkoin harkita, millaisen mielikuvan heidän grafiikkansa asiayhteydestä irroitettuna voi synnyttää. Lukijoiden taas kannattaa pitää mielessä lähdekritiikki, etenkin ennen kuin dramaattisia grafiikoita lähdetään jakamaan eteenpäin.

Korjaus 16.10.: Alkuperäisessä tekstissä puhuttiin virheellisesti miljardeista tonneista kun tarkoitettiin miljoonia tonneja. Sama virhe toistui myös grafiikan mittasuhteissa, ja on nyt korjattu. Keskustelua  grafiikasta myös kommenteissa alla.


Aikataulumuutos Tieto näkyväksi -seminaarin ohjelmaan

2013-09-11 tapahtumat, Ei kommentteja

Tieto näkyväksi -seminaari lähestyy kovaa kyytiä ja liputkin ovat menneet mukavaa tahtia kaupaksi. Opiskelijaliput ovat tätä kirjoittaessa melkein loppu, normaalihintaisia lippuja on sen sijaan vielä jonkin verran jäljellä.

Samalle päivälle osuneen kauppakorkeakoulun valmistujaistilaisuuden vuoksi joudumme muuttamaan seminaaripäivän ohjelmaa. Päivitetty ohjelma löytyy seminaarin omilta nettisivuilta.

Tervetuloa!

 


Infografiikan tarkoitus ei ole koristeleminen, Yle

2013-08-28 linkit, , , , Ei kommentteja

Syyskuussa Tieto näkyväksi -seminaariin puhujaksi tuleva Miamin yliopiston infografiikan professori ja erinomaisen The Functional Art -kirjan kirjoittaja Alberto Cairo on sanonut osuvasti:

”Grafiikan tarkoitus ei ole tehdä luvuista ’kiinnostavia’ vaan muuttaa kuvattava aihe visuaaliseen muotoon, josta ihmisaivot pystyvät löytämään merkityksiä.”

Vaikuttaa, ettei Ylen grafiikkatoimituksessa ole aivan sisäistetty tätä ajatusta. Tuorein esimerkki aiheesta on tämä julkisen velan kehitystä Suomessa ja Ruotsissa 2012–30 käsittelevä A-studion grafiikka:

Julkinen+velka+graafi

Jutun aihe on kiinnostava ja grafiikka on teknisesti ihan kelvollisesti toteutettu, mutta se ei auta lainkaan asian ymmärtämisessä. Jos nyt unohdetaan se miltä Suomi ja Ruotsi erilleen Euroopan kartasta poimittuna joidenkin silmissä näyttävät, myös puhtaasti sisällöllisesti ajatellen grafiikka on epäonnistunut.

Ensinnäkin vertailu maiden välillä on tehty tarpeettoman hankalaksi, koska Ruotsin eteläkärki on huomattavasti etelämpänä kuin Suomen eteläisin kohta eli kuvion ”perusviiva” vaihtelee. Nyt Suomen velka vuonna 2012 näyttää ensi vilkaisulla yli kaksinkertaiselta Ruotsiin nähden vaikka oikeasti se on vain puolitoistakertainen. Ja koska maat ovat maantieteeltään erilaisia, sama prosenttiluku on Ruotsissa kauempana maan eteläkärjestä kuin Suomessa.

Kartassa taitaa myös olla suoranainen virhe. Suomen 2012 velkaprosenttia 57,7 % kuvaa alue jonka pohjoisraja on vedetty vain hieman yli maan puolivälin. (Koska Suomi ei ole itä–länsisuunnassa tasavahva pötkö vaan maan eteläinen osa on pohjoista suurempi, viivan eteläpuolelle jää jopa kaksi kolmasosaa Suomen pinta-alasta, mutta se on toinen juttu.)

Visuaalinen metafora on myös pielessä. Julkisen velan ja BKT:n suhde ilmaistaan toki yleensä prosentteina, mutta julkinen velka ei ole osa BKT:tä ja niinpä suhdeluku voi hyvinkin olla yli sata prosenttia, kuten on asian laita esimerkiksi Kreikassa ja Japanissa. Grafiikka on laadittu tavalla joka antaa ymmärtää vallan muuta.

Saman asian olisi huomattavasti selkeämmin kertonut yksinkertainen pylväskuvio, jollaisen pyöräyttää taulukkolaskentaohjelmassa parissa minuutissa:

Screen Shot 2013-08-28 at 21.09.40

Infografiikan tarkoitus ei ole koristeleminen. Jos grafiikasta yritetään tehdä ”hauskaa” ja ”oivaltavaa” niin ankarasti että itse pääasia, viestintä, kärsii, silloin mennään pahasti metsään.