maanantai 23. elokuuta 2010

Maailman rasistisin ja suvaitsemattomin maa

Siltä varalta että joku on viettänyt viimeisen viikon tynnyrissä, kerrottakoon että Newsweek rankkasi Suomen maailman parhaaksi maaksi. Ihmetyttää millaisia ne muut sitten mahtavat olla.

Tutkimukseen valittiin sata maata, joille annettiin pisteitä eri osa-alueilta: koulutus (TIMSS- ja PISA-testit), terveydenhuolto (odotettavissa oleva laadukas elinikä syntyessä), elämänlaatu (tulojen perhekunnittainen jakautuminen eli Gini-indeksi, köyhien osuus, elintaso, rikollisuus, työttömyysprosentti) talousdynamiikka (BKT:n kasvu, teollisuustuotannon osuus, innovatiivisuus, liiketalouden vapaus, osakemarkkinoiden osuus BKT:sta), poliittinen vapaus (poliitikkojen valintajärjestelmä, äänestysprosentti, poliittisten riskien määrä).

Tutkimuksessa ei kuitenkaan mitattu näin mamukriitikon kannalta oleellisia asioita. Tekeekö maasta hyvän, jos siellä ei ole paljon siirtolaisia? Onko muslimien kansoittama valtio erityisen ihana tapaus? Miten kielellinen yhtenäisyys vaikuttaa maan hienouteen? Entä tulenarin aihe kaikista eli mihin etniseen ryhmään asukkaat kuuluvat?

Nämä tilastotiedot eivät vaikuttaneet maiden rankkaukseen, joten on mielenkiintoista tutkia, kuinka hyvin ne korreloivat saadun indeksipistemäärän kanssa. Ongelmana oli luotettavien tilastotietojen löytäminen; tietyt asiat tuntuvat olevan niin arkaluontoisia, että tiedot ovat kiven alla. Onpa Euroopassa maitakin, joissa joidenkin tilastotietojen kerääminen on jopa lainvastaista.

Koska maailman maat ovat hyvin erilaisia jo peruslähtökohdiltaan, on syytä tehdä vertailevaa tutkimusta paitsi kaikkien tutkimukseen valittujen sadan maan kesken, myös nimenomaan Suomen viiteryhmään kuuluvien maiden välillä. Suomen viiteryhmäksi voidaan katsoa sellaiset eurooppalaiset maat, jotka eivät kuuluneet Varsovan liittoon ja joiden pääkaupunki sijaitsee Alppien pohjoispuolella. Tutkimuksessa näistä maista olivat mukana Suomi, Ruotsi, Norja, Tanska, Iso-Britannia, Irlanti, Hollanti, Belgia, Luxemburg, Ranska, Sveitsi, Itävalta ja Saksa. Yhteensä 13 maata Islannin puuttuessa joukosta.

Tutkimuskohteet:
1. Millä tavoin maassa asuvan ei-alkuperäisen väestön määrä vaikuttaa hyvinvointiin?
2. Onko kielellisesti (ja samalla yleensä myös kulttuurisesti ja etnisesti) yhtenäinen maa hyvinvoivempi kuin kielellisesti hajanainen maa?
3. Onko muslimiväestö eduksi vai haitaksi hyvinvoinnille?
4. Millä tavoin kaukaso-europidiseen Cavalli-Sforza –suurklusteriin kuuluvan väestön osuus vaikuttaa hyvinvointiin?
5. Millä tavoin afro-niloottiseen Cavalli-Sforza –suurklusteriin kuuluvan väestön osuus vaikuttaa hyvinvointiin?


Ensimmäisenä kannattaa tutkia, miten maassa asuvien emigranttien määrä korreloi tutkimuksessa saavutetun pistemäärän kanssa. Tiedot kunkin maan maahanmuuttajien prosentuaalisesta osuudesta ovat peräisin Wikipediasta. Tämän tilastotiedon lineaarinen korrelaatio indeksipistemäärän kanssa on 0,293. Suomen viiteryhmässä korrelaatio on 0,202.

Lineaarisen korrelaation itseisarvon ollessa alle 0,3 korrelaatio on merkityksetön. Maassa asuvien ulkomaalaisten määrä ei siis vaikuta maan elinolosuhteisiin. Se mamukritiikistä, voisi todeta. Vaan mietitäänpä tarkemmin. Millaisiin maihin pakolaiset hakeutuvat? Vertailun pahnanpohjimmainen on Burkina Faso. Eipä tule kovin monelle mieleen, että lähdenpä tästä Burkina Fasoon nauttimaan pakolaisstatuksen suomista eduista. Ei, siirtolaiset hakeutuvat rikkaampiin ja hyvinvoiviin maihin. Luulisi, että emigranttien määrä korreloisi positiivisesti hyvinvointi-indeksin kanssa. Näin ei kuitenkaan ole.

Villi arvaus. Periaatteessa siirtolaisuus suuntautuu hyvinvoiviin maihin. Jotkin näistä maista puolestaan ottavat pakolaisia vähemmin vastaan. Seuraus: hyvinvoivissa maissa on sekä maita, joissa on paljon että vähän emigrantteja, jolloin korrelaatiota hyvinvoinnin ja emigranttien määrän välillä ei esiinny. Lisäksi maahanmuuton laadussa saattaa olla merkittäviä eroja – on hieman eri asia ottaa maahanmuuttajia Japanista kuin Sierra Leonesta.

Näin ollen on oleellisempaa tutkia maahanmuuton laatua ja kansallista yhtenäisyyttä sekä samaan viiteryhmään (länsieurooppalaiset maat) kuuluvia maita kuin maahanmuuttoa sinänsä.

Kansallisen yhtenäisyyden vähiten huono mittari lienee kielellinen diversiteetti. Sen mittaamiseksi käytetään Greenbergin menetelmää, joka on matemaattisesti suhteellisen yksinkertainen, kunhan maan kieliolot tunnetaan. Lyhyesti sanottuna indeksi ilmoittaa sen todennäköisyyden, että kaksi satunnaisesti valittua maan asukasta eivät puhu äidinkielenään samaa kieltä. Maksimiarvo on yksi ja maailman hajanaisin maa on ei niin yllättäen Papua-Uusi-Guinea, jonka tulos on 0,990. Tutkimuksessa mukana olleista korkein arvo on Tansanialla, 0,947, ja matalin lähes täysin espanjankielisellä Kuuballa, 0,001. Suomen arvo on 0,148.

Kielidiversiteetin ja hyvinvointi-indeksin välinen korrelaatio koko aineistossa on -0,516 ja Suomen viiteryhmässä -0,213.
Maailmanlaajuisesti tarkastellen kielidiversiteetin ja hyvinvoinnin välillä on siis kohtalainen negatiivinen korrelaatio eli maa on yleensä sitä parempi elinpaikka, mitä yhtenäisempi se on. Suomen viiteryhmässä korrelaatiota ei käytännössä ole. Tämän voi arvata johtuvan siitä, että korkean koulutuksen ansiosta ihmisillä on kuitenkin yhteinen kieli, vaikka äidinkieli olisikin erilainen.

Muslimiväestön osuus selviää niin ikäänWikipediasta. Muslimiväestön prosentuaalinen osuus väestöstä korreloi hyvinvointi-indeksin kanssa kertoimella -0,424. Suomen viiteryhmässä korrelaatio on -0,345.
Nämä korrelaatiokertoimet tarkoittavat sekä globaalisti että länsimaissa sitä, että muslimiväestön prosentuaalinen osuus korreloi negatiivisesti kohtalaisella voimakkuudella maan hyvinvoinnin kanssa. Maa on siis yleensä sitä parempi paikka elää, mitä pienempi muslimiväestön osuus on. Tästä voidaan tietysti sanoa, että kulttuurirelativismi huomioiden muslimit olisivat ehkä valinneet hyvinvointi-indeksiin toisenlaiset preferenssit ja saaneet eri tuloksia. Mutta tämäkään ei selitä sitä, miksi hitossa muslimit siinä tapauksessa pyrkivät muuttamaan länsimaihin muslimimaista.

Viimeiset kaksi tilastotietoa, Cavalli-Sforza -klustereita koskevat olivat kaikkein hankalimmat kaivaa esiin. CIA:n World Factbookilla ei pitkälle pötkitty. Siksi tiedot onkin koottu eri lähteistä ja koskevat vain länsimaita, muiden maiden kohdalta urakka olisi ollut mahdoton. Eivätkä tiedot täysin luotettavia ole eri lähteiden antaessa eri tietoja, mutta uskoisin niiden olevan kahden prosenttiyksikön tarkkuudella oikeita jopa huonoimmassa arviossa. Jos joku onnistuu löytämään luotettavaa dataa, niin tehköön tutkimuksen paremmin.
Ihanteellisinta tietysti olisi, mikäli pystyisi selvittämään todellisen geneettisen osuuden kustakin maasta. Nykytilanteessa esim. 25-prosenttisesti europidinen luultavasti lasketaan täysin europidiksi. Tämä taas kasvattaa valtaväestön prosenttilukemaa ja pienentää vähemmistöjen prosenttilukemaa todelliseen geneettiseen jakaumaan nähden.
Suomen viiteryhmän klusteriin kuuluvaksi katsottiin alkuperältään kyseisestä viiteryhmästä (Länsi-Eurooppa) lähtöisin olevat. Esimerkiksi Suomen europidiosuuteen lasketaan vaikkapa Suomessa asuvat saksalaiset ja suomalaiset, mutta ei esimerkiksi ukrainalaisia eikä botswanalaisia.

Europidien prosentuaalinen määrä korreloi hyvinvointi-indeksin kanssa kertoimella 0,436 Suomen viiteryhmässä. Kyseessä on kohtalainen positiivinen korrelaatio.

Vastaavasti afro-niloottiseen suurklusteriin kuuluvien asukkaiden prosentuaalinen määrä korreloi hyvinvointi-indeksin kanssa kertoimella -0,482. Kyseessä on kohtalainen negatiivinen korrelaatio.

Johtopäätökset:

1. Ulkomaalaistaustaisten prosentuaalinen osuus ei sinänsä vaikuta merkittävästi maan hyvinvointiin sen paremmin globaalisti kuin pelkästään länsimaissa.

2. Kielellisesti (ja samalla etnisesti sekä kulttuurisesti) hajanaiset maat ovat globaalissa mittakaavassa huonompia asuinpaikkoja kuin yhtenäiset. Länsimaissa kielellisellä hajanaisuudella ei ole tilastollista merkitystä.

3.Muslimiväestön prosentuaalisen osuuden suuruus korreloi negatiivisesti maan hyvinvoinnin kanssa sekä globaalisti että länsimaissa. Toisin sanoen maa on yleensä sitä huonompi paikka elää, mitä suurempi osa väestöstä on muslimeja.

4. Mitä suurempi on alkuperäisen länsimaisen väestön prosenttiosuus väestöstä, sitä parempi asuinpaikka kyseinen länsieurooppalainen maa yleensä on.

5. Mitä suurempi on afro-niloottisen väestön prosenttiosuus väestöstä, sitä huonompi asuinpaikka kyseinen länsieurooppalainen maa yleensä on.


Suomen muslimiväestön osuus on kolmentoista vertailussa mukana olleen länsimaan prosentuaalisesti pienin.
Suomen länsimaisen väestön osuus on kolmentoista vertailussa mukana olleen länsimaan prosentuaalisesti suurin.
Suomen afro-niloottisen väestön osuus on kolmentoista vertailussa mukana olleen länsimaan prosentuaalisesti pienin.

Suomi on näillä kriteereillä mitattuna maailman "rasistisin" ja "suvaitsemattomin" maa.

Newsweekin kriteereillä mitattuna Suomi on maailman paras maa.

Olisiko näillä kahdella asialla jotain tekemistä keskenään?

11 kommenttia:

  1. Luulinpa otsikon perusteella ensin, että ilmottauduit siihen laajaan suomalaiseen aktiiviväestöön, jonka mielestä mokomat Newsweekit ja muut arveluttavat tahot senkun vaan yrittävät pilkata meitä, koska meitähän ei sovi kehua, eikä varsinkaan sen vuoksi että tämä maa on kuitenkin ihan p-seestä...
    Mutta onnistuitpa tieteellisen näköisesti todistamaan Newsweekin puolesta! Hienoa!

    VastaaPoista
  2. No juu, mitä tieteellisyyteen tulee niin olen tietoinen Pearsonin korrelaatiokertoimen lievistä heikkouksista prosentuaalisten ja indeksipohjaisten muuttujien käytössä. Se soveltuu parhaiten raa'asti lukumääräisten tai kvantitatiivisten asioiden tutkimiseen, mutta hyvin myös tällaiseen tilanteeseen.

    Isoin puute on tietojen luotettavuus; siirtolaisten määrästä, kielioloista ja uskontojen jakaumasta maittain on olemassa tilastoja, mutta etenkin ensimmäisessä tiedot vaihtelevat jonkin verran lähteittäin. Etnisen taustan suhteen liikutaan vaarallisilla vesillä; kaikki tiedot ovat enemmän tai vähemmän arvioita ja eri lähteistä kerättyjä. Virallista tietoa asiasta on vain harvasta maasta eikä mistään suoranaista geneettistä prosenttia. Mutta kuten todettu, heitot ovat melko varmasti enintään parin prosenttiyksikön luokkaa.

    VastaaPoista
  3. Jos melkoinen osa suomalaisia on geeneiltään "itäistä" siis sanoisko sukua noille ukrainalaisille, niin voiko suomalaisia laskea "europideiksi" kuin puoliksi?

    Nimim Rannalla huutaja

    http://www.hs.fi/kulttuuri/artikkeli/Suomalaiset+ovat+kahta+eri+kansaa/1135258317862

    VastaaPoista
  4. Anonyymi, tässä on laskettu koska kyse on yhtä paljon kulttuuri- kuin geenitaustasta.

    VastaaPoista
  5. "Esimerkiksi Suomen europidiosuuteen lasketaan vaikkapa Suomessa asuvat saksalaiset ja suomalaiset, mutta ei esimerkiksi ukrainalaisia
    -------------
    eikä botswanalaisia."

    Täh?

    VastaaPoista
  6. Europidi-sanan käyttö tässä yhteydessä ei tarkoita rotua. Se tarkoittaa alkuperältään länsieurooppalaista henkilöä. Eli henkilöä, joka on kotoisin jostakin mainituista 14 länsieurooppalaisesta maasta. Tarkoitus kun oli tutkia, miten kulttuuriltaan länsieurooppalaisen väestön määrä vaikuttaa hyvinvointiin.

    VastaaPoista
  7. Ihan hauska idea, mutta...
    Teitkö multiregressiot myös, ja laskitko p-arvot kertoimille?

    Nimittäin, vanha sanonta "korrelaatiosta ei seuraa kausaatiota", vaikka on ehkä eniten väärinkäytetty, toimii sikäli tällaisessa, että jos selittävistä tekijöistä osa on keskenään riippuvia, ne yksittäisinä "imuroivat" toistensa vaikutuksia, ja siten tällainen vertaileva tutkimus on metodina kyseenalainen.

    Minulla on ehdotus, kun sinulla on nyt data, laita isoon regressioon selittäväksi tekijäksi kerralla kaikki mainitsemasi maat, ja lisäksi selittäväksi muuttujaksi jokin sopiva kontrollimarkkeri, joka imuroi näiden etnisten ryhmien tuottaman ilmeisen ylimääräisen selityskertoimen, joka johtuu siitä, että Afrikan maista niiin monet ovat täysiä persläpiä.

    Esimerkiksi, laita selittäväksi tekijäksi pelkän etnisen komposition lisäksi maan etäisyys päiväntasaajasta.

    VastaaPoista
  8. Sori kirjoitin epäselvästi: siis,
    ota vertailuun kaikki maat, ja selittäviksi tekijöiksi kerralla kaikki käyttämäsi markkerit + etäisyys päiväntasaajasta (tai jokin sopiva maan "trooppisuutta" kuvaava muuttuja) ja selitettäväksi se indeksi.

    Tämän luulisi olevan informatiivisempi.

    VastaaPoista
  9. Tiedemies, sinusta ei aina ota selvää oletko tosissasi vai piruiletko...

    Kuten alkuperäistekstissä totesin, tehköön joku paremmin jos löytää parempaa infoa. Olisin halunnut tehdä perusteellisempaa työtä, mutta perusinfo oli sen verran kiven alla ja puutteellista, että vähän sammui kesken. Pistin jutun julki osin siinä toivossa, että joku minua pätevämpi (ja enemmän vapaa-aikaa omaava) innostuisi tutkimaan ilmiötä.

    En tehnyt multiregressiota ja p-arvojen laskemisesta en edes muista, miten se tehtiin, pitäisi kerrata. Tilastotieteestä olen unohtanut enemmän kuin useimmat koskaan oppivat.

    Etäisyys päiväntasaajasta on sinänsä hyvä selitys, sitä käytti jo Matti Kuusi mainiossa kirjassaan Pohjoiset reservit. Ihmiskunnan sivistyksellisen edistyksen keskipiste on koko ajan siirtynyt matalamman keskilämpötilan suuntaan.

    VastaaPoista
  10. Jos sinulla on data, lähetä minulle sähköpostissa, se on etunimi.sukunimi@gmail.com, niin lasken nuo. Tein itse taannoin yhden multiregressiot ja t-arvot laskevan softan, ja voisin vaikka laskea nuo.

    Olen täysin tosissani; se syy, miksi etäisyys päiväntasaajasta on hyvä olla mukana on, että jos sen pitäisi imuroida pois se vaikutus, että etninen koostumus korreloi sen kanssa, ja tällöin etninen koostumus kaappaa sen kertoimen vain oletuksella "jos leveyspiiri olisi sama". p-arvo jää väistämättä pienemmäksi, mutta tulos on luotettavampi.

    Toinen mahdollisuus on instrumentoida; instrumentoinnissa on ideana, että muutetaan todellinen muuttuja "proxyksi" selittämällä se muiden muuttujien lineaarikombinaationa ja lopullisessa regressiossa käytetään selitettyjä arvoja. Ideana on, että kohinaisesta mittarista saadaan "olennainen" esillle. Esimerkiksi voidaan instrumentoida etninen koostumus niin, että selitetään "europidien" määrä germaanisten, slaavilaisten, romaanisten ja suomalais-ugrilaisten kielten osuuksilla, ja tämän jälkeen korvataan "europidien määrä" tällä ennustetulla lukemalla. En tunne instrumentoinnin teoriaa riittävästi ehdottaakseni sitä.

    VastaaPoista
  11. Se, jos korrelaation itseisarvo on alle 0,3, ei tarkoita tarkoita, että korrelaatio ei olisi tilastollisesti merkityksellinen. Se tarkoittaa vain sitä, että tilastollinen yhteys on olemassa, mutta se on melko heikko. Yhteiskuntatieteessä tuollainen korrelaatio on tavanomainen. Esimerkiksi sosiaalipsykologisissa meta-analyyseissa lasketut korrelaatiot jakautuvat seuraavasti: http://languagelog.ldc.upenn.edu/myl/SocialPsychMetaCorr.png (lähde: F.D. Richard, C.F. Bond, and J.J. Stokes-Zoota, "One hundred years of social psychology quantitatively described", Review of General Psychology, 2003; http://languagelog.ldc.upenn.edu/nll/?p=1667)

    Korrelaation tilastollinen merkitsevyys, t.s. että onko tulos sattuman tulosta vai ei, taas lasketaan p-arvoilla.

    VastaaPoista