Are carbohydrates really the culprit behind the obesity epidemic?

Obesity is a global health problem. It is obiviously linked to diet in some way, but the exact nature of this link is the subject of volumes of research, and also of heated exchanges online. One school of thought, occasionally exhibiting quasi-religious tendencies in some of its advocates, claims that the obesity epidemic is mainly caused by our diet being too rich in carbohydrates from cereals and other such sources, as well as vegetable oils. As a solution, they advocate changing to a diet rich in animal fats, meat, eggs and so on.

Inspired by the coverage of a recent piece in The Lancet about rising obesity rates, as well as a somewhat uncritical book review in The Economist I decided to see myself if the publicly available data on obesity and diets could be tortured into confessing something on the issue.

I need to emphasize that this is not a scientific study. Describing the methods used as rigorous would be a stretch, to say the least. A few potential problems with the data and with my handling of it are outlined in the end of this article, and the list is by no means exhaustive. What this is, is a bit of light-weight data journalism that will hopefully inspire discussion and possibly more serious research into the data.

I used this WHO data on obesity (the same used by the Lancet authors), combined with agricultural statistics from FAO to see if the number of overweight and obese people in a country was correlated with the intake of various foods.

To capture the effect of changing diets, I used the data from several different years within a single country as separate data points where historical data was available. If you disagree with this choice, you can switch the view to show only the most recent data.

The end result is below, an interactive scatterplot that shows how the consumption of various foods correlates with the number of overweight and obese people in each country. The idea of the visual presentation is that the reader can look at the full dataset and not need to rely on single numbers such as averages or correlation coefficients.

In light of these numbers, there is no evidence that high cereal consumption is linked with obesity on a country level. If anything, the correlation between the share of overweight adults and cereal consumption is mildly negative (r = –0.18). With starchy roots (such as potato) there is no correlation whatsoever (r = 0.08).

The correlation between vegetable oils and overweight is moderate (r = 0.33), though not much greater than with the consumption of animal fats (r = 0.23). It should be noted, though, that the consumption of animal fats is very small in most non-Western countries, so not very many conclusions can necessarily be drawn from this comparison.

The strongest correlation in the data with the share of overweight adults is with meat consumption (r = 0.5). Not surprisingly, the correlation with sugar and sweeteners is also reasonably strong (r = 0.43).

The correlation with meat consumption and obesity is probably at least partially due to the fact that higher meat consumption is typical of higher living standards overall, which also often means a higher total calorie intake and less physical work. The existence of these types of confounding variables is amply demonstrated by the fact that the correlation of overweight with the consumption of fruits is also moderate (r = 0.32). Practically no one believes eating fruits makes you fat, so the explanation is probably that fruit intake is also simply correlated with higher living standards.

So what’s the take-home messge? I would interpret the data so that no single group of foods is responsible for the obesity epidemic by itself, certainly not cereals. This sort of population-level comparison using somewhat patchy data can hardly settle the matter by itself, but I would still argue that if cereals (and carbohydrates in general) were really so bad, there should be a sliver of the effect visible in the data even on this coarse level. Which there isn’t, as you can see.

The jury is still out on vegetable oils, but if we want to explain away the high correlation of meat consumption with the share of overweight adults, I would argue similar confounding factors are to be found here; the use of vegetable oils in the West has risen with the overall rise of living standards. So if you want to argue that the correlation of obesity with meat intake is spurious, the same should probably said of the clearly weaker correlation with vegetable oils – and vice versa.

The next step would be to compare the calorie intake from different kinds of foods instead of the absolute numbers (kg/capita/year), which could possibly help to overcome the fact that a rise in living standards affects both the total calorie intake and the mix of different types of foods consumed.

Potential sources of error

Apart the whole project being executed within the span of two working days, and by a designer with no scientific training to speak of, there are some specific details in the data and how it was processed that can be sources of error.

FAO’s data shows the “food supply”, that is, the food theoretically available for human consumption, not the actual food intake. Factors such as wastage are not taken into account, and may vary from country to country.

WHO’s data on obesity is collected using methods and samples differing from country to country and may thus not be directly comparable. There were some examples in the data where a change in the numbers was clearly an artifact of the data collection process, not representative of the change in the facts on the ground; for example the share of overweight people dropping from 59.8 to 46.2 percent in a single year in Australia 2000–2001. In such cases the most recent data was assumed to be reliable, and the older data was discarded.

The selection of countries for which the data is available is much better representative of high-income Western countries than world’s other regions, which is bound to effect the overall picture.

Because the number of years for which historical data was available varied greatly between different countries, not all years for which data was available were used. A more balanced subset was instead attempted by picking only some years, far apart enough to exhibit clear changes in dietary patterns. The method used is extremely arbitrary, and probably effects the end result.

The final dataset used for the visualization was created with a custom Python script from messy original data by a non-programmer, a process which is a highly probable source of error. The final data was superficially examined for flaws (and the script corrected several times accordingly), but it has not been rigorously and thoroughly scrutinized in the way required for e.g. scientific publication and thus scripting errors remain a potential source of errors in the data. For those interested in assessing the data quality themselves, the processed data can be downloaded as a tsv file (which is similar to csv, except using tabs instead commas as separators) here.

Informaatiomuotoilun monet käyttökohteet

Espanjalaissyntyinen, nykyisin Miamin yliopistossa infografiikan opettajana toimiva Alberto Cairo kirjoittaa tulevan kirjansa markkinoimiseksi perustetussa mainiossa The Functional Art -blogissaan infografiikan tekijöiden työtilanteesta. Talouskriisin kanssa painivassa Espanjassa suuri joukko uutisgraafikoita on saanut potkut tai oma-aloitteisesti ottanut lopputilin ja vaihtanut alaa. Espanjalaisten lehtien ahdinko ei johdu pelkästään taloustaantumasta vaan on osa laajempaa median myllerrystä, jonka laineet ulottuvat suomalaiseenkin lehdistöön, vaikka meillä yleinen talous- ja työllisyystilanne ei ole alkuunkaan niin huono kuin Espanjassa. Mutta siinä missä espanjalainen lehdistö laittaa infografiikan tekijöitä kilometritehtaalle, meillä trendi vaikuttaisi olevan päinvastainen. Huolimatta meikäläisenkin median ahdingosta laskevien tilaajamäärien ja alv-korotusten paineessa lehdet ja sähköinenkin media etsivät uusia infografiikan tekijöitä ja kouluttavat omaa väkeään tiedon visualisoinnin saloihin. (Full disclosure -hengessä pitää tässä kohdin muistuttaa lukijaa siitä, että allekirjoittaneenkin tuloista merkittävä osa tulee informaatiomuotoiluun liittyvästä koulutuksesta.)

Eroa selittänee paitsi taloustilanne, myös historia. Espanjassa uutisgrafiikalla on pitkät perinteet ja kaikilla vakavasti otettavilla lehdillä on ollut jo vuosikausia kunnolliset grafiikkatoimitukset, kun taas Suomessa oikeastaan vain Helsingin Sanomat on panostanut grafiikkaan jo pitempään johdonmukaisesti. Muut suomalaiset mediat ovat vasta aivan viime vuosina alkaneet herätä infografiikan journalistisiin mahdollisuuksiin ja nyt tilanne vaikuttaisi olevan se, että hyvien tekijöiden löytäminen on jopa pieni haaste monille lehdille. Suomessa siis myös journalistisesta infografiikasta kiinnostuneen opiskelijan työllistymismahdollisuudet alalle näyttävät valoisilta kun taas Espanjassa alan työmarkkinat vaikuttavat lehdistön ahdingon huomioonottaen ylisaturoituneilta.

Mielenkiintoisinta Cairon kirjoituksessa ovat kuitenkin informaatiomuotoilun käyttökohteet journalismin ulkopuolella. Hän käsittelee erikseen esimerkkejä sekä yrityselämän että tieteen parista. Varsinkin tieteen piirissä onkin ollut kasvavana trendinä eksploratiivisten visualisointien hyödyntäminen tutkimusmenetelmänä. (Eksploratiivisen ja tietoa välittävän grafiikan erosta on kirjoitettu tässä blogissa pari viikkoa sitten.) Suomen Kuvalehden mainio juttu tutkija Markus Jokelasta avaa hyvin sitä suoranaista datatulvaa jonka keskelle tutkijat ovat teknisen kehityksen ja avoimen datan ideologian yleistymisen ansiosta päässeet. Visualisoiminen on mainio tapa lähteä hakemaan tolkkua valtaviin tietoaineistoihin. Kuten esimerkiksi Anscomben kvartetiksi kutsuttu esimerkki osoittaa, visualisoinnin avulla on mahdollista saada datasta selkoa usein jopa paremmin kuin monilla yleisesti käytetyillä matemaattisen analyysin menetelmillä.

Aasinsillalla pääsenkin tästä vielä mainostamaan tulevaa tapahtumaamme. :) Juuri tämä sama havainto informaatiomuotoilun käyttökelpoisuudesta hyvin moninaisilla elämänaloilla on nimittäin ollut johtoajatuksenamme 17.9. järjestettävän Tieto näkyväksi -seminaarin suunnittelussa. Olemme pyrkineet rakentamaan kokonaisuuden, joka sisällöllisesti puhuttelisi paitsi informaatiomuotoilun ammattilaisia myös esimerkiksi kirjoittavia toimittajia, viestintäihmisiä, poliitikkoja ja aktivisteja, business intelligence -asiantuntijoita, virkamiehiä, tieteentekijöitä, opettajia, arkkitehteja, insinöörejä, juristeja ja monia muita tietotyöläisiä jotka voisivat omassa työssään hyötyä erilaisista tiedon visualisoinnin menetelmistä. Seminaarin ohjelmistoon on tulossa myöhemmin vielä reilusti täydennystä, mutta jo nyt voi varmaankin hahmottaa että olemme yrittäneet pitää alan sisäisen neppailun osuuden minimissään ja rakentaa laajan ja yleistajuisen kattauksen erilaisista tiedon kuvallisisen esittämisen menetelmistä. Myös liput on pyritty pitämään hyvin edullisina, ettei kiinnostuneiden osallistuminen jäisi ainakaan rahasta kiinni. Opiskelijat pääsevät tapahtumaan ilmaiseksi ja toivon lämpimästi, että myös muidenkin alojen kuin designin ja viestinnän/journalismin opiskelijat löytävät tapahtuman.

Käsittämättömän kuvaaminen

Teksti on julkaistu lyhennettynä Grafia-lehdessä.

Informaatiomuotoilun voima on asioiden näyttäminen niiden todellisissa mittasuhteissa. Se on verrattain helppoa silloin, kun esitettävät asiat ovat jollain tavalla katsojan arkikokemukseen verrattavia, mutta usein näin ei ole. Valaisivimmat näkemäni esitykset ovat onnistuneet voittamaan käsityskyvyn rajoitukset ja antaneet realistisemman näkökulman asioihin kuin pelkät asiantuntijoiden selitykset.

Kuten tästä dvice.comin kuvasta näkyy, kuuluisan Virgin Galacticin avaruuskoneen lentokorkeus peittoaa saman sarjan kilpailijat, mutta on mainettaan mitättömämpi ainakin verrattuna valtiollisten ohjelmien saavutuksiin.

Yleisimmät vaikeaa mittakaavaa käyttävät esitykset liittyvät avaruuden sijaan tavalla tai toisella talouteen. Vuoden 2008 velkakriisin laajetessa syntyi joukko huonoja uutisia. Niiden myötä ilmestyi uutisiin lukumääriä, jotka ovat satoja kertaluokkia suurempia kuin mitä arkielämässä yleensä kohtaa. Kuukausien sisällä päätettiin satojen miljardien dollarien suuruisten rahamäärien kohtalosta. Pelastuspakettien vastustajat Yhdysvalloissa käyttivät pitkiä puheenvuoroja, jotka vilisivät lukusanoja, joita yleensä käytetään vain tähtitieteessä. Niillä ei kuitenkaan ollut samaa selittävää voimaa kuin hyvillä visualisoinneilla, jotka laittoivat luvut oikeaan asiayhteyteen. Lukijan on helpompi hahmottaa vuoden aikana talouteen kaadetun rahan määrä, kun koko paketti on eritelty ja laitettu vierekkäin maan suurimpien menoerien kanssa kahden vuosisadan ajalta. Tällainen visualisointi on tehokasta ja puhuttelevaa sisältöä ja vaatii suunnittelijalta samaa vastuuta kuin toimittajalta.

Vaikka esitys saisi olla visuaalisesti hiotumpi, se auttaa hahmottamaan elvytyspaketin suuruutta. Kuva ei aivan ehtinyt Bailout Nation -kirjan kovakantiseen painokseen, mutta se osoittaa tekijöidensä kyvyn esittää asiat ymmärrettävässä asiayhteydessä.

Toinen ihmiselle vaikeasti hahmottuva asia on todennäköisyys (tähän lottoamisenkin suosio perustuu). Olemme luonnostamme taitamattomia arvioimaan harvinaisten tapahtumien todennäköisyyksiä. Seuraavanlaisia kuvia voisi jakaa kaikille luulotautisille ja kroonisesti pelokkaille.

(klikkaa päästäksesi suurempaan versioon)

Hyvän viestinnän ohjeen mukaan ihmisen havaintokyky on kaventuva ja tarkentuva: havaitsemme suuripiirteisesti laajoja kokonaisuuksia ja niiden pienempiä osasia yksityiskohtineen, mutta emme kumpaakin yhtä aikaa. Kirjoittajalle tämä tarkoittaa, että uudet asiat esitellään aloittamalla yleisistä piirteistä ja päätymällä lopulta yksityiskohtiin. Informaatiomuotoilussa sama johdattelu tehdään käyttämällä kuvan sisäistä visuaalista kielioppia. Siinä yleinen taso on se, jonka lukija huomaa ensinäkemältä. Se määrittää mittakaavan ja esitettävän tiedon eri tyypit. Yksityiskohtaisin taso näyttää tarkimman tiedon, jonka parhaassa tapauksessa voi suhteuttaa saumattomasti kuvan muihin osiin. Pelkkä datatiheys ei tee kuvasta arvokasta, sillä ilman yhdistäviä vinkkejä se on vain tiedon saareke. Edellä näytetyissä esimerkeissä johdattelu yleisen ja yksityisen välillä tapahtui yksinkertaisesti visualisoimalla luvut eri asiayhteyksiin. Saman voi tehdä monipolvisesti, kuten itse kokeilin tässä puretussa aikajanassa, joka havainnollistaa geologisen ajan jakotapaa:

 

(kuva suurenee klikkaamalla)

Harmittavan yleinen tapa graafikoilla on tekstin välttäminen informaatiomuotoilussa. Ehkä kyse on liiasta itsevarmuudesta (tai turhamaisuudesta). Tekijä luottaa kuvakerrontansa vahvuuteen niin paljon, että tekstin käyttäminen tuntuu luovuttamiselta. Ehkä kyseessä on myös jonkinlainen tiedostamaton reviirijako kuvittavan ja kirjoittavan väen välillä. Joka tapauksessa on harvoin mitään oikeaa syytä olla käyttämättä tekstiä osana esitystä. Uudet asiat on joka tapauksessa avattava sanallisesti, ja parhaiten se onnistuu kun selitys on osa kuvitusta. Typografian hierarkiaa luovat keinot ovat kuvallisia kerrontatapoja muiden rinnalla.

Kun visuaalinen kielioppi on johdonmukainen ja helppo hahmottaa, sitä voi jatkaa eri mittakaavojen lisäksi eri kuviin. Kun samaan raamiin laadittuja kuvallisia tietokokonaisuuksia järjestetään kuvasarjaksi, niitä vertaamalla voi nähdä pieniäkin muutoksia lukumäärien ja muiden arvojen välillä. Edward Tufte käyttää näistä nimitystä small multiples, toistokuvio. Tämän keinon vahvuus vaikeasti hahmotettavien asioiden kuvaamisessa on sen kyky kertoa muutoksen laatu ja määrä hyvin tarkasti. Tällaiset esitykset näyttävät sommittelunsa puolesta hieman sarjakuvilta, ja niissä toimii lukemisen johdattelun kannalta pitkälti sama logiikka. Tufte on sitoutunut pelkistettyyn ja hienovaraiseen esittämiseen ja perustelee mieltymyksensä hyvin, mutta sarjakuvakerronnan keinoilla olisi paljon annettavaa informaatiomuotoilulle. Etenkin aikasarjaan järjestetyissä kuvissa sarjakuvateoreetikko Scott McCloudin ohjeet ruutusommittelusta tekisivät esityksistä parempia. Ne ovat yhtä avartavaa luettavaa kuin mikä tahansa informaatiomuotoilun teorian klassikoista, mutta ikävä kyllä yhtä huonosti saatavilla suomeksi. Hänen nettisivunsa ovat kuitenkin hyvää luettavaa kaikille graafikoille. McCloud jakaa ruutuvaihdosten tyypit kuuteen luokkaan riippuen ajallisen ja tilallisen muutoksen määrästä ruutujen välillä. Hetkestä hetkeen tapahtuva muutos on näistä välittömin, kun taas suurin muutos vaihtaa kohtauksen tapahtumapaikan ja -ajan täysin. Mikään teoria ei tietenkään korvaa kokeneen suunnittelijan visuaalista rytmitajua, mutta ruutukerrontaan liittyy yllättäviä ja helppotajuisia lainalaisuuksia, joita avataan lyhyesti kirjassa Sarjakuva – näkymätön taide.

Tilastografiikassa mitta-asteikon yhdenmukaisuus on selkeyden kulmakivi. Siitä tulee kuitenkin rasite, kun esitetään yhdessä kuvassa täysin eri kertaluokkien lukuja. Tällaisiin tarkoituksiin ei ole sellaisia valmiita ratkaisuja, joita muut kuin asiantuntijat osaisivat lukea. Tämä ei estä hyvää tarkoittavia valistajia yrittämästä. Välillä suurelle yleisölle tarkoitettuihin julkaisuihin eksyy jopa tilastokuvia, joissa käytetään logaritmista asteikkoa. Ne kertovat tekijöiden oppineisuudesta, mutta harvoin avaavat sisältöä lukijalle. Eri mittakaavojen asioita vertailtaessa onkin välillä luovuttava yhtenäisestä mitta-asteikosta. Rinnastus on silti mahdollista, jos muut kuvalliset mittarit ovat yhtenäiset. Väri on tässä yleinen apu, samoin kuin typografinen hierarkia. Isotype-kuvista tutut yksikkösymbolit ovat myös tapa kuvata lukumääriä vertailukelpoisesti. Kun jokainen symboli on suunniteltu hyvin skaalautuvaksi, rinnastettavilla kuvilla voi olla suurikin määrällinen ero. Mittakaavaongelman ratkaisemiseksi osiin purettu kuva vie usein enemmän tilaa ja esittää edelleen saman datamäärän, mutta tiheyden menetystä korvaa sen saama kerronnallinen arvo. Vaikka infokuvan ei pidäkään olla kuvitusta, tällaiset koostetut esitykset ovat usein esteettisestikin kiinnostustavia.

Vaikeasti hahmotettavien asioiden tulkitsemisessa kuviksi pelkät äärimmäiset mittakaavat eivät ole ainoa ongelma. Suunnittelijan oma ymmärrys aiheesta on kapein pullonkaula. Parhaissa esityksissä tekijä on hankkinut vähintään perustiedot aiheesta ennen kuvan luonnostelua, mikä näkyy oivaltavina ja genren rajoja rikkovina ratkaisuina. On parempi, että aineistoon perehtyy graafinen suunnittelija kuin että kuvan tekisi visuaalisuuteen perehtymätön aiheen asiantuntija. Moni tärkeä uutinen on joka tapauksessa vaikea käsittää, ja hyvä kuva avaa sen sisällön tavalla, johon pelkkä teksti ei kykene.

Säteilyannoslaskimia

Ennen taskulaskinten yleistymistä kaikille oppikoulun käyneille tuttu apuväline oli laskutikku eli -viivain, logaritmisten asteikkojen ominaisuuksiin perustuva apuväline jonka avulla pystyi helposti suorittamaan likimääräisesti erilaisia matemaattisia operaatioita. Pyöreää laskutikkua kutsutaan laskukiekoksi.

Laskutikkuja ja -kiekkoja on suunniteltu yleismatematiikan lisäksi myös hyvinkin spesifeihin tarkoituksiin, mm. valotusajan määrittämiseen, lentokoneiden polttoaineenkulutuksen arvioimiseen ja esimerkiksi kumulatiivisen talletuskoron laskemiseen. 1950-luku ja vielä 60-luvun alku olivat paitsi myös laskuviivainten, myös ydinpaniikin kulta-aikaa. Nämä kaksi asiaa yhdistyvät Oak Ridge Associated Universities -yliopistoverkoston nettisivuille kootussa valikoimassa upeita laskukiekkoja ydinlaskeuman, säteilyannostusten ja muiden ydinaseisiin liittyvien suureiden laskentaan.

Näissä laskimissa yhdistyy funktionaalinen, minimalistinen kauneus yllättävänkin runsaaseen tietosisältöön. Muutamalla pyörivällä levyllä on saatu aikaan elegantti ja runsasdatainen esitys, jonka rinnalla useimmat nykyaikaisen tietotekniikan mahdollisuuksia hyödyntävät interaktiiviset sovellukset auttamatta kalpenevat. Mielenkiintoista on myös, että suunnittelijoina ovat yleensä toimineet insinöörit ja fyysikot, toki painoalan ammattilaisia viimeistelyssä apunaan käyttäen, mutta silti kokonaan ilman varsinaisia graafisia suunnittelijoita. Jokainen tyypillisiä 2000-luvun insinöörien suunnittelemia esityksiä nähnyt voi vain harmitella, miten insinöörien visuaaliset taidot ovat rapautuneet tietokoneavusteisen suunnittelun myötä.

* * *

Jos tämä ei ollut vielä tarpeeksi nörttiä, maailman kattavin valikoima laskuviivaimia löytyy Kansainvälisen laskuviivainmuseon nettisivuilta.