Cartograms are hard

2015-03-23 artikkelit, , , , Ei kommentteja

This cartogram, purporting to show the indebtedness of Eurozone countries, has been making the rounds on the internet. To me it mostly shows that making cartograms that can actually give the reader any relevent insights is hard, and should be left to specialists.

A cartogram is a map in which the size of the countries (or municipalities, states etc.) do not correspond to their geographical dimensions but instead are scaled according to a different variable, e.g. population. (Stricly speaking, a cartogram is not a map, but in layman’s terms it is.) Truly great cartograms exist, but in my experience, 99 per cent of the time cartograms muddle the data and don’t help gain insights.

This particular cartogram comes from a Deutsche Bank research report (p. 51). The report gives no source, nor any numbers in tabular form, nor even an explanation what the data being shown is. (“Sovereign debt” might mean a variety of things.) The different colors don’t seem to signify anything.

The worst feature of the map is that only Eurozone countries have been rescaled according to debt, whereas non-Eurozone countries (nearly half of the countries shown) retain their original size (but not shape, except for UK). Unless the reader knows all the 19 Eurozone countries by heart (and recognizes their distorted, unlabeled shapes on the map), she can only guess which countries’ sizes show relevant information and which do not.

Making the assumption that the data shown in the original cartogram is public sector liabilities minus assets, per capita (excluding social security funds for better comparability across countries) I downloaded the latest (Q1/2014) available data from Eurostat and created this simple horizontal bar chart.

Edit 23.3.: It would seem that this assumption is wrong. The data shown on the cartogram can’t be liabilities minus assets, whether or not social security funds are excluded, since the Eurostat numbers for those don’t match the relative sizes of the countries on the map. (For example, Belgium should make the top 2 in both cases, but is not in the top 10 of largest countries on the map.) Either the numbers are based on a different definition of sovereign debt, or are plain wrong. I’m guessing the latter, since I can’t imagine a definition of debt which would place Belgium very far from the top among European countries.

(I also collected the data into a single csv file for anyone wishing to create their own visualizations or analyses using the same data.)

Compare the bar chart and cartogram and decide for yourself which gives you more insights about the underlying data. I think the answer is pretty obvious.

Tieto näkyväksi -seminaari 18.9., puhujina mm. Robert Simmon ja Stefanie Posavec

2014-06-30 tapahtumat, , , , Ei kommentteja

Tiedon kuvallista esittämistä yleistajuisesti käsittelevä Tieto näkyväksi -seminaari järjestetään tänä syksynä kolmatta kertaa. Tapahtuma-ajankohta on torstai 18.9. Edelliset kaksi seminaaria (2012, 2013) olivat molemmat menestyksiä, keräten kumpikin n. 600 osallistujaa.

Tämän syksyn puhujiksi on kiinnitetty NASAn Earth Observatoryssa työskentelevä Robert Simmon, freelance-suunnittelija Stefanie Posavec sekä The Economist -lehden Graham Douglas. Lisää puhujia ja tarkempia tietoja tapahtumasta julkistetaan elokuussa.

Liput tapahtumaan ovat myynnissä nyt ja early bird -hinnat (–25 %) ovat voimassa heinäkuun loppuun. Opiskelijoille tapahtuma on ilmainen, mutta vaatii ilmoittautumisen lipunmyyntijärjestelmän kautta.

Lisätietoja tapahtuman nettisivuilta ja Facebook-sivulta. Tervetuloa!

Are carbohydrates really the culprit behind the obesity epidemic?

2014-06-05 grafiikka, , , , , Ei kommentteja

Obesity is a global health problem. It is obiviously linked to diet in some way, but the exact nature of this link is the subject of volumes of research, and also of heated exchanges online. One school of thought, occasionally exhibiting quasi-religious tendencies in some of its advocates, claims that the obesity epidemic is mainly caused by our diet being too rich in carbohydrates from cereals and other such sources, as well as vegetable oils. As a solution, they advocate changing to a diet rich in animal fats, meat, eggs and so on.

Inspired by the coverage of a recent piece in The Lancet about rising obesity rates, as well as a somewhat uncritical book review in The Economist I decided to see myself if the publicly available data on obesity and diets could be tortured into confessing something on the issue.

I need to emphasize that this is not a scientific study. Describing the methods used as rigorous would be a stretch, to say the least. A few potential problems with the data and with my handling of it are outlined in the end of this article, and the list is by no means exhaustive. What this is, is a bit of light-weight data journalism that will hopefully inspire discussion and possibly more serious research into the data.

I used this WHO data on obesity (the same used by the Lancet authors), combined with agricultural statistics from FAO to see if the number of overweight and obese people in a country was correlated with the intake of various foods.

To capture the effect of changing diets, I used the data from several different years within a single country as separate data points where historical data was available. If you disagree with this choice, you can switch the view to show only the most recent data.

The end result is below, an interactive scatterplot that shows how the consumption of various foods correlates with the number of overweight and obese people in each country. The idea of the visual presentation is that the reader can look at the full dataset and not need to rely on single numbers such as averages or correlation coefficients.

In light of these numbers, there is no evidence that high cereal consumption is linked with obesity on a country level. If anything, the correlation between the share of overweight adults and cereal consumption is mildly negative (r = –0.18). With starchy roots (such as potato) there is no correlation whatsoever (r = 0.08).

The correlation between vegetable oils and overweight is moderate (r = 0.33), though not much greater than with the consumption of animal fats (r = 0.23). It should be noted, though, that the consumption of animal fats is very small in most non-Western countries, so not very many conclusions can necessarily be drawn from this comparison.

The strongest correlation in the data with the share of overweight adults is with meat consumption (r = 0.5). Not surprisingly, the correlation with sugar and sweeteners is also reasonably strong (r = 0.43).

The correlation with meat consumption and obesity is probably at least partially due to the fact that higher meat consumption is typical of higher living standards overall, which also often means a higher total calorie intake and less physical work. The existence of these types of confounding variables is amply demonstrated by the fact that the correlation of overweight with the consumption of fruits is also moderate (r = 0.32). Practically no one believes eating fruits makes you fat, so the explanation is probably that fruit intake is also simply correlated with higher living standards.

So what’s the take-home messge? I would interpret the data so that no single group of foods is responsible for the obesity epidemic by itself, certainly not cereals. This sort of population-level comparison using somewhat patchy data can hardly settle the matter by itself, but I would still argue that if cereals (and carbohydrates in general) were really so bad, there should be a sliver of the effect visible in the data even on this coarse level. Which there isn’t, as you can see.

The jury is still out on vegetable oils, but if we want to explain away the high correlation of meat consumption with the share of overweight adults, I would argue similar confounding factors are to be found here; the use of vegetable oils in the West has risen with the overall rise of living standards. So if you want to argue that the correlation of obesity with meat intake is spurious, the same should probably said of the clearly weaker correlation with vegetable oils – and vice versa.

The next step would be to compare the calorie intake from different kinds of foods instead of the absolute numbers (kg/capita/year), which could possibly help to overcome the fact that a rise in living standards affects both the total calorie intake and the mix of different types of foods consumed.

Potential sources of error

Apart the whole project being executed within the span of two working days, and by a designer with no scientific training to speak of, there are some specific details in the data and how it was processed that can be sources of error.

FAO’s data shows the “food supply”, that is, the food theoretically available for human consumption, not the actual food intake. Factors such as wastage are not taken into account, and may vary from country to country.

WHO’s data on obesity is collected using methods and samples differing from country to country and may thus not be directly comparable. There were some examples in the data where a change in the numbers was clearly an artifact of the data collection process, not representative of the change in the facts on the ground; for example the share of overweight people dropping from 59.8 to 46.2 percent in a single year in Australia 2000–2001. In such cases the most recent data was assumed to be reliable, and the older data was discarded.

The selection of countries for which the data is available is much better representative of high-income Western countries than world’s other regions, which is bound to effect the overall picture.

Because the number of years for which historical data was available varied greatly between different countries, not all years for which data was available were used. A more balanced subset was instead attempted by picking only some years, far apart enough to exhibit clear changes in dietary patterns. The method used is extremely arbitrary, and probably effects the end result.

The final dataset used for the visualization was created with a custom Python script from messy original data by a non-programmer, a process which is a highly probable source of error. The final data was superficially examined for flaws (and the script corrected several times accordingly), but it has not been rigorously and thoroughly scrutinized in the way required for e.g. scientific publication and thus scripting errors remain a potential source of errors in the data. For those interested in assessing the data quality themselves, the processed data can be downloaded as a tsv file (which is similar to csv, except using tabs instead commas as separators) here.

Eurovaalien kovin kilpailu käytiin vihreiden ja demarien välillä

2014-05-27 grafiikka, , , , 9 kommenttia

Eurovaalituloksen ensimmäisissä analyyseissä on noussut vahvasti esiin arvio, että viime eurovaaleihin nähden huonosti menestyneet vihreät menettivät ääniä ennen kaikkea hallitusvastuusta keväällä luopuneelle vasemmistoliitolle. Koko maan lukuja katsoessa tämä on houkutteleva tulkinta, olihan vasemmiston vaalivoitto suunnilleen vihreiden tappion suuruinen.

Ilmeisin selitys ei kuitenkaan välttämättä pidä paikkaansa tarkemman analyysin valossa. Jos vihreät olisivat menettäneet äänestäjiään ennen kaikkea vasemmistoliitolle, tämän pitäisi näkyä äänestysaluekohtaisessa tarkastelussa niin, että vihreiden tappio olisi suurin niillä alueilla joissa vasemmisto on onnistunut houkuttelemaan eniten äänestäjiä. Näin ei kuitenkaan näyttäisi olevan.

Tein vertailun sunnuntain eurovaalien ja vuoden 2012 kunnallisvaalien tuloksesta äänestysalueittain. (Vertailu edellisiin eurovaaleihin ei onnistu yhtä helposti, koska ainakaan vielä tätä kirjoittaessa oikeusministeriö ei ole julkaissut vuoden 2009 äänestysaluekohtaisia tuloksia yhtä kätevässä kootussa koneluettavassa muodossa kuin vuoden 2012 kuntavaaleista ja 2014 eurovaaleista on saatavilla. Tieto on sinänsä saatavilla ja ajan salliessa koitan myöhemmin ottaa sen mukaan analyysiin.) Satunnaisvaihtelun karsimiseksi otin mukaan vain sellaiset äänestysalueet, joilla molemmissa vaaleissa oli annettu yhteensä vähintään tuhat ääntä.

Käytin korrelaation mittarina helposti laskettavaa Pearsonin korrelaatiokerrointa, joka ei välttämättä ole paras mahdollinen tilastollinen analyysimenetelmä, mutta olen sen oheen tehnyt myös interaktiivisen grafiikan, jonka avulla lukija voi itse arvioida, kertovatko pelkät numerot koko totuuden vaalituloksesta.

Grafiikassa voi valita vaaka- ja pystyakselille yhden kahdeksasta isoimmasta eduskuntapuolueesta, muiden puolueiden yhteisen äänisaaliin tai yleisen äänestysaktiivisuuden. Akselien arvot ovat siis muutoksia puolueen kyseisen äänestysalueen äänistä saamassa prosenttiosuudessa vuoden 2012 kuntavaalien ja viime sunnuntain eurovaalien välillä. Renkaiden värit viittaavat vaalipiiriin. Tarkemmat tiedot äänestysalueesta saa viemällä hiiren sitä kuvaavan renkaan päälle.

Jos vaaka- ja pystyakselille valittujen puolueiden vaalituloksen välillä on vahva yhteys niin, että toinen on selvästi vienyt ääniä toiselta, äänestysalueita kuvaavien renkaiden muodostaman pistepilven pitäisi muodostua kuvion lävistäjän ympärille. Vaaka- tai pystysuuntainen pilvi viittaa siihen, ettei yhteyttä puolueiden vaalimenestyksen välillä ole. (Tällaista kuviotyyppiä kutsutaan parvikuvioksi.)

Vihreiden ja vasemmistoliiton vaalimenestystä kuvaava kuvio on voimakkaasti pystysuuntainen, joka tarkoittaa, että vihreiden ääniosuus on vaihdellut paljon edellisistä vaaleista äänestysalueesta riippuen, kun taas vasemmistoliitto on parantanut ääniosuuttaan keskimäärin melko tasaisesti eri puolilla maata. Vahvaa yhteyttä ääniosuuden muutoksien välillä ei näy, korrelaatiokerroin saa arvon r = –0,15 jota ei voi pitää kovin suurena.

Sen sijaan vihreiden ja SDP:n vaalimenestyksen välillä näkyy huomattavasti vahvempi yhteys, r = –0,48. Vihreiden menestys korreloi melko voimakkaasti myös äänestysaktiivisuuden muutoksen kanssa: r = –0,41. Nopea tulkinta on, että SDP on menettänyt äänestäjiään vihreille, mutta vihreät toisesta päästä nukkuvien puolueelle. (Korjaus: Ensimmäisessä versiossa tähän oli lipsahtanut ajatusvirhe. Jos vihreät olisi menettänyt ääniä ennen kaikkea äänestysaktiivisuuden laskun kautta, korrelaatiokertoimen pitäisi olla positiivinen. Nyt tilanne on päin vastoin niin, että vihreät ovat erityisesti menestyneet niillä äänestysalueilla joilla äänestysaktiivisuus laski paljon kuntavaaleihin verrattuna.) Muitakin potentiaalisia selityksiä luvuille varmasti löytyy, mutta selkeästi yhteys vihreiden ja demarien äänimenestyksen välillä on paljon vahvempi kuin vihreiden ja vasemmiston välillä.

Muiden puolueiden vaalituloksen väliltä ei löydy yhtä vahvoja yhteyksiä. Vahvimmat yksittäiset taisteluparit ovat RKP & kokoomus (r = –0,29) ja perussuomalaiset & kokoomus (r = –0,30). Mielenkiintoinen yllätys on myös vasemmistoliiton ja keskustan pieni kilvoittelu (r = –0,23). Vasemmiston tuore meppi Merja Kyllönen menestyi erinomaisesti juuri Pohjois-Suomessa ja kilpaili äänistä varmasti paljon esimerkiksi Paavo Väyrysen kanssa.

Grafiikassa on vielä pieniä teknisiä virheitä, mutta sen muodostama yleiskuva lienee oikea. Eri asia on kuinka pitkälle meneviä johtopäätöksiä lukujen perusteella voi vielä tehdä. Kuntavaalit ja eurovaalit ovat luonteeltaan erilaisia ja äänestäjät saattavat valita puolueensa näissä vaaleissa kovinkin eri perustein. Toimikoon tämä kuitenkin pienenä datajournalistisena keskustelunavauksena vaalituloksen syvempään analyysiin. Lukijoilla on myös epäilemättä paljon kommentteja valittuihin analyysimenetelmiin ja grafiikan toteutukseen, jotka koitan sitten parhaani mukaan huomioida sitten seuraavassa versiossa. :)

Lisäys 28.4.: Työkaluun on nyt lisätty mahdollisuus tarkastella aiemman ääniosuuden absoluuttisen muutoksen (%-yksikköä) myös äänimäärän absoluuttista muutosta (kpl) sekä ääniosuuden suhteellista muutosta (% suhteessa kuntavaaleihin). Absoluuttisten äänimäärien tarkastelu tarjoaa heikompia korrelaatioita kuin aiempi ääniosuuden muutos, mutta edelleen vihreiden vahvin korrelaatio säilyy nimenomaan demareihin ja vihreät on myös ainut puolue jonka kanssa SDP:n tuloksella on selvästi nollasta poikkeava negatiivinen korrelatio, vaikka kerroin onkin pieni (r = –0,26). Vihreiden ja vasemmistoliiton valtakunnallinen korrelaatio on edelleen heikko. Vihreiden vahvimmilla alueilla Helsingissä ja Uudellamaalla vasemmisto näyttäisi ehkä jonkin verran rokottaneen vihreiden tulosta, mutta vihreiden tappio absoluuttisissa äänissä mitattuna on suurempi kuin vasemmiston voitto.

(Huomautettakoon että absoluuttisen äänimäärien vertaaminen äänestysaktiivisuuteen – joka tässä on annettujen äänten määrän prosentuaalinen lasku kuntavaaleista, ei muutos prosenttiyksikköinä – ei anna järkeviä tuloksia, koska äänestysaktiivisuuden ja isojen puolueiden absoluuttisen äänimäärän korrelaatio on suuri ja pienten puolueiden pieni johtuen ihan siitä miten korrelaatio lasketaan.) Itse asiassa näin ei ole, vaan absoluuttisten äänimäärien vertailu äänestysaktiivisuuteen paljastaa että vihreät ja RKP kärsivät vähiten laskeneesta äänestysaktiivisuudesta, kun taas muiden puolueiden tulos korreloi positiivisesti äänestysaktiivisuuden muutoksen kanssa.

Slate’s language map and messy census data

2014-05-13 linkit, , , Ei kommentteja published a fun article and set of maps about the languages spoken in the U.S., other than English and Spanish.

One of the maps struck me as somewhat surprising:



Is New York really the only state where Chinese is the most spoken language after English and Spanish? And why no African languages made it to the map?

Being the nerd I am, I looked up the original data from the American Community Survey (the data source referred to in the original article) using Census Bureau’s American FactFinder. And it would indeed seem that the data on the map is (partially) wrong – or at least it doesn’t match the data I could find.

The table below has the correct most-spoken non-English, non-Spanish language (or group of languages) for each state, with the ones that were wrong in the original map highlighted:

Alabama German
Alaska Other Native North American languages
Arizona Navajo
Arkansas German
California Chinese
Colorado German
Connecticut Polish
Delaware Chinese
Florida French Creole
Georgia Korean
Hawaii Other Pacific Island languages
Idaho German
Illinois Polish
Indiana German
Iowa German
Kansas German
Kentucky German
Louisiana French (incl. Patois, Cajun)
Maine French (incl. Patois, Cajun)
Maryland African languages
Massachusetts Portuguese or Portuguese Creole
Michigan Arabic
Minnesota African languages
Mississippi Vietnamese
Missouri German
Montana Other Native North American languages
Nebraska Vietnamese
Nevada Tagalog
New Hampshire  French (incl. Patois, Cajun)
New Jersey Chinese
New Mexico Navajo
New York Chinese
North Carolina Chinese
North Dakota  German
Ohio German
Oklahoma Vietnamese
Oregon Chinese
Pennsylvania Chinese
Rhode Island Portuguese or Portuguese Creole
South Carolina German
South Dakota Other Native North American languages
Tennessee German
Texas Vietnamese
Utah Other Pacific Island languages
Vermont French (incl. Patois, Cajun)
Virginia Korean
Washington Chinese
West Virginia German/French (exact same number of speakers)
Wisconsin Hmong
Wyoming German

What could explain the errors? For starters, I’m probably using at least a slightly different data set from the original author, as I couldn’t find a data that had the “Other” categories broken down in the same level of detail as in the Slate article. (I’m using a data set “LANGUAGE SPOKEN AT HOME BY ABILITY TO SPEAK ENGLISH FOR THE POPULATION 5 YEARS AND OVER, 2008-2012 American Community Survey 5-Year Estimates”, which should be the most reliable current data available on the FactFinder web site.) So if the original article is using older but more detailed data, e.g. from 2005–07, that could explain at least some of the difference.

Another plausible scenario is that Slate uses the wrong data column in the same/similar data set. The data I used includes three values for each language: the total number of speakers, those who “speak English ‘very well’”, and those who “speak English less than ‘very well’”. With a quick glance at the data it seems to me that the original map actually shows the language with the biggest number of those “very well” speaking people, not the total speakers, but I didn’t test this hypothesis thoroughly.

Whatever the problem here, I can’t really blame the original author. The Census Bureau’s several websites are awfully difficult to use, the categorizations used are confusing and the data formats are a mess. It was hard work to simply get the data for all the states and clean it up into a usable format. (Now that I’ve done the job once, you can download the data here in a more user-friendly format if you want to play with it.)

This seems to unfortunately typical of a lot of open government data all around the world. A few magnificent exceptions aside, too much of the world’s open data is in an obscure or messy data format, hidden behind a crappy interface, accessible only to the most dedicated of hacks and wonks. As happy as I am for Gapminder, Google Public Data, and the like, I would rather see governments themselves clean up their act and start thinking seriously about how Joe Public can actually access their data. It isn’t enough that the data exists somewhere in some format. It needs to be accessible for regular people.

Suomen karttakuvan kehitys

2014-03-30 artikkelit, linkit, , , , , , , Ei kommentteja

Helsingin Sanomat on julkaissut hauskan artikkelin Suomen ilmaantumisesta maailmankartalle (ilmaisun kirjaimellisessa merkityksessä). Itse karttakuvat saisivat kyllä olla vielä isompia!

Olen itse työstänyt samasta aiheesta tekstiä ensi vuoden alussa julkaistavaan Informaatiomuotoilu-kirjaamme, mutta näillä näkymin sitä ei tulla ainakaan tässä laajuudessa käyttämään, joten ajattelin että tämä voisi olla hyvä tilaisuus julkaista teksti täällä blogissa.

Hesarin artikkelissa mainituista karttaprojektioiden eroista minulla on valmiina myös varsin kattava teksti, mutta sitä saatte odottaa kirjan julkaisuun asti. :)

* * *

Pohjoismaita kuvaava Tabula Rogerianan osa (saksalainen faksimiili 1800-luvulta). Pohjoinen on kartassa alhaalla.

Pohjoismaita kuvaava Tabula Rogerianan osa (saksalainen faksimiili 1800-luvulta). Pohjoinen on kartassa alhaalla.

Suomi hiipi maailmankartalle vähitellen. Ylipäänsä Pohjois-Euroopan karttakuvan kehitys on ollut hyvin hidas prosessi. Karttoja tehtiin läntisessä kulttuuripiirissä lähinnä Välimeren maissa ja tehdyt kartat kuvasivat pääasiassa Euroopan eteläisempiä osia. Helsingin yliopiston pohjoismaiden historian dosentti Mikko Huhtamies on todennut, että vielä Kalmarin unionin aikaan (1397–1523) hallitsijoilla ei ollut minkäänlaista käsitystä siitä, miltä heidän valtakuntansa olisi kartalla näyttänyt. Suomen ja Venäjän välinen rajakin oli vuosisatojen ajan vain luettelo rajamerkeistä erämaassa.

Jos edes Skandinavia kartalle mahtui – yleensä lisälehtenä, tabula nova, eteläisempiä alueita kuvaavaan varsinaiseen karttaan – se kuvattiin yleensä saarena. Joissain kartoissa niemimaa yhdistyy mantereeseen kapean maakaistaleen välityksellä, mutta tätä ei voine vielä pitää varsinaisesti Suomen kuvauksena. Suomalaisia paikannimiä ei näissä varhaisimmissa kartoissa vielä esiinny.

Tabula Rogeriana (1154) nimeää kaksi suomalaista paikannimeä: ”Abu(r)a” (Turku*) ja ”Tabast” (Häme). Tanskalaisen Claudius Clavuksen 1427 laatima kuuluisa Pohjoismaiden kartta on kadonnut, mutta siitä on säilynyt myöhempiä painettuja versioita, joista vanhin on vuodelta 1482. Tässä vielä varsin epätarkassa kartassa esiintyy paikannimi ”Findlandi”, jonka on tulkittu tarkoittavan Varsinais-Suomea. Fra Mauron maailmankartassa mainitaan ”Fillandia”-nimisen maan lisäksi ainakin ”Vibògo” (Viipuri) ja ”Abo” (Turku).

 Jacob Zieglerin kartassa vuodelta 1532 Suomen maantieteellinen sijainti osana Pohjoismaita alkaa hahmottua jo oikein, vaikka rantaviivan muoto onkin vielä aika kaukana todellisuudesta. Suomalaisia paikannimiä mainitaan jo useita, mm. ”Chimene” (Kemi), ”Strobothnia” (Pohjanmaa), ”Peunthe” (Päijänne), ”Hango” (Hanko), ”Custa” (Kustavi) ja ”Rasburghum” (Raasepori).

Varsinainen läpimurtoteos on kuitenkin ruotsalaissyntyisen Olaus Magnuksen Roomassa 1539 julkaisema Carta marina, joka kuvaa koko Pohjoismaat, mukaan lukien Suomen, merkittävästi tarkemmin ja yksityiskohtaisemmin kuin kukaan ennen tätä. Suomalaisia paikannimiä mainitaan toistasataa, tosin maan sisäosat on kuvattu vielä puutteellisesti. Maantieteellisen tiedon lisäksi kartassa on kuvattu mm. kansojen elintapoja, sodankäyntimenetelmiä ja historiallisia tapahtumia, kuten Viipurin pamaus.

Myös Orteliuksen (1570), Waghenaerin (1588) ja Mercatorin (1595) kartastoissa Suomi kuvataan jo melko kattavasti, mutta vasta Ruotsin maanmittauslaitoksen perustajan Anders Buren tarkkoihin mittauksiin ja laajaan tietojenkeruuseen perustunut Orbis arctoi nova et accurata delineatio vuodelta 1626 antoi Suomen maantieteestä ratkaisevasti Carta Marinaa paremman kokonaiskuvan. Buren kartta pysyikin toistasataa vuotta perusteoksena, johon muut Pohjolan karttoja laatineet kartografit työnsä pohjasivat.

Suomen aluetta kuvaavat kartat laadittiin pitkään Tukholmasta tai vieläkin kauempaa käsin. Aidosti kotimaisen kartografian varhaisvaiheita edustavat 1640-luvulta alkaen kylittäin laaditut maakirjakartat. Niistä kehittivät vähitellen pitäjänkartat, jotka muodostivat 1940-luvulle asti suomalaisen kartta-aineiston rungon ja joita varten tehdylle pohjatyölle muut kartat lähes aina rakentuivat.

Merkittävä piristysruiske suomalaiselle maanmittaustoiminnalle oli Ranskan tiedeakatemian retkikunnan 1736–37 Tornionjokilaaksossa tekemä, Newtonin fysiikan teorioiden testaamiseen liittynyt laaja mittaushanke, joka toi maahan uusia menetelmiä ja välineitä.

1740-luvulla perustettiin isojaoksi kutsutun maatalousmaan uudelleenjaon toteuttamista varten maanmittauskomissio. Sen merkittävimmistä hankkeista mainittakoon Eric af Wetterstedtin johdolla laadittu ja vuorineuvos S. G. Hermelinin kustantama kattava Suomen kartasto (1799) joka oli yleisesti käytössä 1800-luvun puoliväliin saakka.

Venäjän vallan aika toi pitäjänkarttojen rinnalle uuden sotilaskäyttöön tarkoitetun karttatyypin jota kutsuttiin topografikartoiksi. Nämä kaksi karttatyyppiä yhdistettiin 1947 alkaen peruskartoiksi, jotka edelleen ovat kattavin Suomea kuvaava kartta-aineisto. Peruskarttojen lisäksi Maanmittauslaitos tuottaa mm. maastokarttoja.

Kuntien tuottamat kantakartat ovat vielä maasto- ja peruskarttojakin tarkempia karttoja, joita käytettään mm. kaavoituksen ja rakennustöiden suunnittelun pohjana.

Maanmittauslaitos julkaisi toukokuussa 2012 suurimman osan sähköisistä kartta-aineistoistaan vapaasti ladattavaksi ja käytettäväksi.

*) Turun kaupunki tosin perustettiin nykykäsityksen mukaan vasta 1249, joten voi olla että tällä on tarkoitettu jotain muuta paikkaa. Jonkinlainen markkinapaikka nykyisen Turun seudulla on toki hyvinkin voinut olla jo 1100-luvun puolivälin tienoilla kun tiedot karttaa varten on kerätty. Joka tapauksessa Al-Idrisin kartta oli alkujaan arabiankielinen ja Pohjolan eksoottiset paikannimet ovat voineet vääristyä niitä latinalaiseen kirjaimistoon muutettaessa. Karttoja on myös täydennetty uudelleenpiirtämisten yhteydessä, joten kyseessä voi olla myös myöhempi lisäys jota ei alkuperäisessä kartassa ole ollut.

Helsingin kartta vuodelta 1770 + nykyinen rantaviiva

2014-01-17 grafiikka, linkit, , Ei kommentteja

Helsingin kaupunkisuunnitteluvirasto on julkaissut Facebook-sivuillaan hienoja vanhoja karttoja Helsingistä. Tänään vuorossa oli vuonna 1777 julkaistu kartta. On kiehtovaa miten paljon kaupunki on muuttunut vajaassa 250 vuodessa. Vaikka paikannimistö on tuttua, harva katu kulkee enää samassa paikassa kuin tuolloin ja vielä harvempi rakennus on enää pystyssä.

Yksi suuri kaupunkikuvaan vaikuttanut tekijä on maantäytöt, joilla Helsingin rantaviivaa on muokattu viimeisen parinsadan vuoden aikana hurjasti. Hahmottaakseni itsekin paremmin, miten vanhan kartan paikat vastaavat nykyisiä tein kartasta version, johon on lisätty nykyinen rantaviiva (kuva aukeaa klikkaamalla isommaksi).


Koska 1700-luvun maanmittaustekniikat eivät olleet nykyisten veroisia, vanhan kartan vääristymät ovat melko isoja eikä nykyistä rantaviivaa saanut kohdilleen täsmällisesti. Olen sovittanut sen silmämääräisesti ja muutenkin suurpiirteisesti, joten kuva on lähinnä suuntaa-antava, mutta varmaan sellaisenaankin auttaa hahmottamaan muutosta.


Aikataulumuutos Tieto näkyväksi -seminaarin ohjelmaan

2013-09-11 tapahtumat, Ei kommentteja

Tieto näkyväksi -seminaari lähestyy kovaa kyytiä ja liputkin ovat menneet mukavaa tahtia kaupaksi. Opiskelijaliput ovat tätä kirjoittaessa melkein loppu, normaalihintaisia lippuja on sen sijaan vielä jonkin verran jäljellä.

Samalle päivälle osuneen kauppakorkeakoulun valmistujaistilaisuuden vuoksi joudumme muuttamaan seminaaripäivän ohjelmaa. Päivitetty ohjelma löytyy seminaarin omilta nettisivuilta.



Infografiikan tarkoitus ei ole koristeleminen, Yle

2013-08-28 linkit, , , , Ei kommentteja

Syyskuussa Tieto näkyväksi -seminaariin puhujaksi tuleva Miamin yliopiston infografiikan professori ja erinomaisen The Functional Art -kirjan kirjoittaja Alberto Cairo on sanonut osuvasti:

”Grafiikan tarkoitus ei ole tehdä luvuista ’kiinnostavia’ vaan muuttaa kuvattava aihe visuaaliseen muotoon, josta ihmisaivot pystyvät löytämään merkityksiä.”

Vaikuttaa, ettei Ylen grafiikkatoimituksessa ole aivan sisäistetty tätä ajatusta. Tuorein esimerkki aiheesta on tämä julkisen velan kehitystä Suomessa ja Ruotsissa 2012–30 käsittelevä A-studion grafiikka:


Jutun aihe on kiinnostava ja grafiikka on teknisesti ihan kelvollisesti toteutettu, mutta se ei auta lainkaan asian ymmärtämisessä. Jos nyt unohdetaan se miltä Suomi ja Ruotsi erilleen Euroopan kartasta poimittuna joidenkin silmissä näyttävät, myös puhtaasti sisällöllisesti ajatellen grafiikka on epäonnistunut.

Ensinnäkin vertailu maiden välillä on tehty tarpeettoman hankalaksi, koska Ruotsin eteläkärki on huomattavasti etelämpänä kuin Suomen eteläisin kohta eli kuvion ”perusviiva” vaihtelee. Nyt Suomen velka vuonna 2012 näyttää ensi vilkaisulla yli kaksinkertaiselta Ruotsiin nähden vaikka oikeasti se on vain puolitoistakertainen. Ja koska maat ovat maantieteeltään erilaisia, sama prosenttiluku on Ruotsissa kauempana maan eteläkärjestä kuin Suomessa.

Kartassa taitaa myös olla suoranainen virhe. Suomen 2012 velkaprosenttia 57,7 % kuvaa alue jonka pohjoisraja on vedetty vain hieman yli maan puolivälin. (Koska Suomi ei ole itä–länsisuunnassa tasavahva pötkö vaan maan eteläinen osa on pohjoista suurempi, viivan eteläpuolelle jää jopa kaksi kolmasosaa Suomen pinta-alasta, mutta se on toinen juttu.)

Visuaalinen metafora on myös pielessä. Julkisen velan ja BKT:n suhde ilmaistaan toki yleensä prosentteina, mutta julkinen velka ei ole osa BKT:tä ja niinpä suhdeluku voi hyvinkin olla yli sata prosenttia, kuten on asian laita esimerkiksi Kreikassa ja Japanissa. Grafiikka on laadittu tavalla joka antaa ymmärtää vallan muuta.

Saman asian olisi huomattavasti selkeämmin kertonut yksinkertainen pylväskuvio, jollaisen pyöräyttää taulukkolaskentaohjelmassa parissa minuutissa:

Screen Shot 2013-08-28 at 21.09.40

Infografiikan tarkoitus ei ole koristeleminen. Jos grafiikasta yritetään tehdä ”hauskaa” ja ”oivaltavaa” niin ankarasti että itse pääasia, viestintä, kärsii, silloin mennään pahasti metsään.

Malofiej – infografiikan Pulitzerit

2013-07-03 artikkelit, , , Yksi kommentti

Artikkeli on julkaistu lyhennettynä Grafia-lehden numerossa 2/2013.

Infografiikan alan ykköstapahtuma on loistava tilaisuus kuulla huippuluokan puhujia ja verkostoitua, mutta itse palkintogaala kaipaisi lisää glamouria. 

Espanjan Pamplonassa jaettiin maaliskuun puolivälissä Malofiej-infografiikkakilpailun palkinnot. Koska kilpailun tuomaristo koostuu monipuolisesti alan huipputekijöistä, on  palkintojenjaon yhteydessä keksitty ryhtyä järjestämään myös seminaaria, jonka puhujina toimivat juryn jäsenet. Lopputuloksena on poikkeuksellisen kovatasoinen seminaariohjelma ja infografiikan tekijöiden kansainväliset kokoontumisajot vailla vertaa.

Ensi kertaa vuonna 1993 järjestetty tapahtuma – oman määritelmänsä mukaan ”infografiikan Pulitzer-palkinnot” – on vuosien varrella kasvanut ja monipuolistunut, mutta edelleen varsin kompaktin kokoinen. Seminaarin osallistujaluettelo mahtuu siististi muutamalle A4-arkille. Painotus on edelleen journalistisessa infografiikassa eikä Pamplonassa juuri nähdä esimerkiksi tieteellisiä visualisointeja. (Niille on omat tapahtumansa kuten USA:ssa vuosittain järjestettävä IEEE VIS.)

Malofiej-seminaari järjestettiin Navarran yliopiston viestinnän laitoksen tiloissa Pamplonassa.

Malofiej-seminaari järjestettiin Navarran yliopiston viestinnän laitoksen tiloissa Pamplonassa.

Seminaaripuheenvuorot tarjosivat mahdollisuuden päästä näkemään luonnosvaiheesta alkaen kuinka maailmanluokan visualisoinnit syntyvät. Eräänä yhdistävänä teemana olikin juuri huolelliseen luonnostelun merkitys niin isoissa kuin pienissäkin medioissa. Argentiinalaisen La Voz del Interior -lehden piskuinen kolmen(!) hengen grafiikkadeski tuottaa jatkuvalla syötöllä maailmanluokan tietokuvituksia, joiden pohjana on huolellista luonnostelutyötä. Juan Colombato kertoi tutkijoita ja muita asiantuntijoita haastatellessaan pyytävänsä heitä luonnostelemaan itse miten aihe heistä kannattaisi esittää.

National Geographicilla yksittäistä grafiikkaa saatetaan työstää luonnoksina puolikin vuotta. Projekteja venyttää ennen kaikkea faktojen tarkistuksen perusteellisuus. ”Moni ajattelee että National Geographicin kuvitukset ovat vain ’taiteilijan näkemyksiä’. Eivät ne ole. Pienimmätkin yksityiskohdat on tarkistettu”, kertoi Amanda Hobbs ja näytti kuvitusversioita jotka oli asiantuntijoiden kommenttien perusteella piirretty uusiksi moneen kertaan pientenkin yksityiskohtien oikeellisuuden varmistamiseksi.

Omaa elämäänsä Feltron report -”vuosikertomuksen” muotoon dokumentoiva Nicholas Felton esitteli tiedonkeruun ja sen esityskuntoon työstämisen vaiheita. Feltonin esityksessä kiinnostavaa oli uudenlainen työskentelytapa jossa lyijykynän sijaan luonnostelun välineenä on ohjelmakoodi. Muuttamalla parametreja ja kokeilemalla eri tapoja käsitellä dataa syntyy luonnosmaisia versioita joista sitten lopuksi jokin valitaan viimeisteltäväksi julkaisukuntoon.

Myös liikkuvan grafiikan tuotanto vaatii lukuisia luonnostelukierroksia storyboard-vaiheesta ensimmäisiin animointikokeiluihin. The New York Timesin Graham Roberts näytti hauskoja making of -videoita lehden nettisivuille mm. liikkeenkaappaustekniikalla toteutetuista 3d-animaatioista. Videografiikan erityisenä haasteena on, että tarjolla olevat työkalut on yleensä suunniteltu fiktioelokuvan ja pelien tarpeisiin ja niiden uutisviestimen tarpeisiin soveltaminen vaatii välillä luovaa hakkerointia.

Kilpailun parhaana verkkotyönä palkittiin The New York Timesin aitajuoksija Lolo Jonesin juoksutekniikkaa esittelevä video. (ruutukaappaus)

Kilpailun parhaana verkkotyönä palkittiin The New York Timesin aitajuoksija Lolo Jonesin juoksutekniikkaa esittelevä video. (ruutukaappaus)

Viimeisen seminaaripäivän lopuksi tapahtunut palkintojen julkistaminen oli lähestulkoon antikliimaksi intensiivisen ja huippukiinnostavan seminaariohjelman jälkeen. Jury luetteli kultamitalistit lyhyin perusteluin ja loput palkitut saimme lukea jaetusta tulosteesta. Ensi kertaa kilpailun historiassa Suomeenkin saatiin mitali kun Suomen Kuvalehden Hannu Kyyriäisen Kutistunut Palestiina voitti pronssia.

Palkintojen saajien julkistaminen ei tuntunut herättävän yleisössä juuri minkäänlaisia reaktioita. Keskustelin tästä myöhemmin pöytäseurueeni kanssa gaalaillallisella, jossa kultamitalien ja erikoispalkintojen voittajat saivat kunniakirjansa. Viime vuonna paikalla olleiden mukaan palkintojenjako oli silloin kuumentanut tunteet lähes tappeluksi asti. Ehkäpä juuri konfliktien välttämiseksi kultamitaleita olikin sitten jaettu tänä vuonna ennätysmäärä eikä yleisökään lähtenyt julkisesti kommentoimaan juryn valintoja.

Palkittujen töiden joukossa korostuvat urheiluaiheiset grafiikat, jotka keräsivät peräti kolmasosan kaikista kultamitaleista. Eikä ihme: esimerkiksi kisassa hyvin pärjännyt The New York Timesin olympialajeja esittelevä How to win -sarja saa vähemmänkin urheilusta kiinnostuneen innostumaan.


Googlen Fernanda Viégasilla ja freelancerina toimivalla Frédérik Ruysillä oli hauskaa kilpailun palkintojenjakoa odotellessa. Vasemmalla kilpailun järjestäjän, SND-E:n puheenjohtaja Javier Errea.

Tapahtuman antia pohtiessa nousee mieleen väistämättä vertailu suomalaisiin vastaaviin kilpailuihin. Omaa infografiikkakilpailuahan meillä ei tietysti ole eikä esimerkiksi Vuoden Huipuissa ole omaa sarjaa tiedon visualisoinnille. Vuoden parhaat sivut -kilpailussa infografiikkaa arvioidaan lehtien ulkonäkökilpailun puitteissa, Apps4Finlandin visualisointisarjan arviointikriteerit taas tuntuvat painottavan teknisiä ja datalähtöisiä kysymyksiä eivätkä niinkään kuvallista viestintää. Ehkä jonkun näistä kilpailuista olisi aika toteuttaa kunnollinen infografiikkasarja.

Saatiin kotimaisiin kisoihin tulevaisuudessa omaa sarjaa infografiikalle tahi ei, idea tuomariston osaamista hyödyntävästä seminaarista on mainio ja pitäisi mielestäni ehdottomasti kopioida meillekin. Malofiej voisi vuorostaan ottaa oppia esimerkiksi Vuoden Huipuista siinä miten itse palkintojenjakoon saadaan draamaa ja glamouria.

Teksti ja kuvat: Juuso Koponen

* * *

Malofiej-kilpailun palkitut

The New York Times (USA)
Lolo Jones, cleared for takeoff
Verkkoon tehtyjen töiden parhaana palkittiin olympialajeja esittelevien verkkojuttujen How to win -sarjaan kuuluva aitajuoksua käsittelevä video.

National Geographic Magazine (USA)
An army for afterlife
Painettujen julkaisujen pääpalkinnon voitti 500-luvulta peräisin olevasta kiinalaisesta terrakotta-armeijasta kertova feature-kokonaisuus.

Paras kartta/verkko
ProPublica (USA)
Eniten keskustelua gaalaillallisella herätti parhaan verkkokartan palkinnon myöntäminen fontille(!). Vapaasti ladattava Stateface sisältää kirjainten sijaan kaikkien Yhdysvaltain osavaltioiden ja itsehallintoalueiden ääriviivat.

Paras kartta/printti
The New York Times (USA)
Counties blue and red move to the right (verkkoversio)
Printtikarttojen pääpalkinnon voittaja analysoi piirikunnittain Yhdysvaltain presidentinvaalien tulosta uudenlaisella tavalla.

Kultamitalien voittajat:

The New York Times (USA) •••••••
National Geographic Magazine (USA) ••••
El Correo (Espanja) ••
In Graphics (Saksa) ••
South China Morning Post (Kiina) • (Espanja) •
El Telégrafo (Ecuador) •
Golden Section Graphics (Saksa) •
Prensa Libre (Guatemala) •
O Estado de S. Paulo (Brasilia): •

Yhteensä 21 kpl.
Hopeamitaleja jaettiin 52 kpl ja pronssimitaleja 74 kpl. Yhteensä kilpailuun osallistui 1 191 työtä 154 eri julkaisulta 28 eri maasta.

 Täydellinen luettelo palkituista töistä

* * *

Kilpailun tuomaristo

Puheenjohtaja: Jaime Serra, La Vanguardia (Espanja) @ja_serra
Wilson Andrews, The Washington Post (USA) @wilsonandrews
Jen Christiansen, Scientific American (USA) @ChristiansenJen
Juan Colombato, La Voz del Interior (Argentiina) @jcolombato
Nicholas Felton, Facebook (USA) @feltron
Amanda Hobbs, freelancer/National Geographic (USA) @AmandaHobbs427
Artem Koleganov, Infografika (Venäjä) @infographer_ru
Fabricio Miranda, Superinteressante (Brasilia) @FabricioMiranda
Stefanie Posavec, freelancer (USA/Iso-Britannia) @stefpos
Graham Roberts, The New York Times (USA) @Grahaphics
Frédérik Ruys, Vizualism (Alankomaat) @fruys
Jan Willem Tulp, freelancer (Alankomaat) @JanWillemTulp
Fernanda Viégas, Google (Brasilia/USA) @viegasf