USA:n presidentinvaalit olivat jo aikapäiviä sitten. Yhä vääjäämättömämmin alkaa näyttää siltä, että Trump joutuu väistymään Valkoisesta talosta Bidenin tieltä. Tämänhetkisen isännän yritykset kumota vaalitulos eivät ole tuottaneet tulosta.
En seurannut vaaleja kovinkaan tiiviisti muiden kiireiden takia. Heränneet vilppiepäilyt toki kiinnostivat ja ajattelin, että voisinpa hieman kaivautua dataan ja analysoida, olisiko niissä tilastollisesti ottaen perää.
En aio tehdä perusteellista tilastoanalyysia, vaan otan pari yksinkertaista hypoteesia ja testaan niitä. Kirjoitan hypoteesit auki ennen kuin teen pienintäkään tilastojen esiin kaivamista, niin tarkastelu on mahdollisimman puolueeton.
Päätin verrata tämänkertaisia vaalituloksia neljän vuoden takaiseen. Pienellä etsinnällä löytyi data, josta saa esiin sekä vuoden 2020 tulokset että vuoden 2016 tulokset piirikunnittain. Tutkin asiaa seuraavasti:
Menettelytapa 1:
1. Otan tutkittavaksi vain kuusitoista Manner-Yhdysvaltojen osavaltiota (eli Alaska ja Havaiji suljetaan erikoistapauksina pois, vaikka ne valintakriteerin perusteella saattaisivat tähän kuulua): A: ne neljä, joissa Trumpin voitto oli suurin (Wyoming, Länsi-Virginia, Oklahoma, Pohjois-Dakota), B: ne neljä joissa Trumpin voitto oli pienin (Pohjois-Carolina, Florida, Teksas, Ohio), C: ne neljä joissa Bidenin voitto oli pienin (Georgia, Arizona, Wisconsin, Pennsylvania) ja D: ne neljä, joissa Bidenin voitto oli suurin (Vermont, Massachusetts, Maryland, Kalifornia). Prosentuaalisesti tietenkin.
2. Näistä osavaltioista tutkin piirikunnittain, miten paljon Trumpin äänimäärä kussakin piirikunnassa poikkesi osavaltion keskimääräiseen tulokseen nähden prosenttiyksikköinä.
3. Kaikissa tuloksissa on jätetty pois muut kuin kaksi pääehdokasta; prosenttilukemana on käytetty ainoastaan sitä lukemaa, jonka Trump sai Trumpin ja Bidenin/Clintonin yhteenlasketuista äänistä. Näin tulokset saadaan vertailukelpoisiksi.
4. Saatu lukema on siis Trumpin äänimäärän poikkeama prosenttiyksikköinä jokaisessa piirikunnassa osavaltion keskimääräisestä lukemasta.
5. Nämä luvut lasketaan erikseen vuoden 2020 ja 2016 vaaleista.
6. Mikäli osavaltiossa piirikuntien keskimääräinen poikkeama osavaltion keskimääräisestä tuloksesta on selvästi suurempi kuin toisissa vaaleissa oli, on syytä epäillä vilppiä.
Tämä hypoteesi perustuu siihen, että mikäli vilppiä on, sitä kannattaa tehdä vain mahdollisimman harvassa paikassa kiinnijäämisriskin minimoimiseksi. Tällöin ääniosuuksissa pitäisi olla piirikunnissa keskimääräistä enemmän hajontaa.
Hajonta voi tietysti olla satunnaista. Kuitenkin, jos tätä hajontaa on eniten kriittisissä osavaltioissa, joissa Biden voitti eli ryhmässä C, epäilykset heräävät.
Menettelytapa 2:
1. Tutkittavana samat osavaltiot piirikunnittain kuin äsken.
2. Muuttujana Trumpin ääniosuuden muutos piirikunnittain vuoden 2016 vaaleista vuoden 2020 vaaleihin.
3. Mikäli ääniosuuden muutoksessa on suurta vaihtelua piirikunnittain saman osavaltion sisällä, epäilykset heräävät.
Tämä hypoteesi perustuu siihen, että Trumpin kannattajamäärien voi olettaa muuttuvan osavaltion sisällä suhteellisen tasaisesti piirikunnittain. Mikäli tätä hajontaa on eniten kriittisissä ryhmän C osavaltioissa, epäilykset heräävät.
Menettelytapa 3:
1. Katsotaan, missä tutkittavan osavaltion piirikunnissa muutos vaaleista 2016 vaaleihin 2020 on suurin. Mikäli nämä muutokset tapahtuvat osavaltion asukasluvultaan suurimmissa piirikunnissa, herää epäilys.
2. Otetaan osavaltion piirikunnista ylöspäin pyöristäen ne 25 %, joissa muutos on suurin. Katsotaan, kuinka monta näistä kuuluu asukasluvultaan osavaltion ylimpään kvartiiliin eli 25 %:iin. Mikäli näitä on enemmän kuin neljäsosa suurimman muutoksen piirikunnista, se on epäilyttävää.
Tämä hypoteesi perustuu siihen, että pienemmissä piirikunnissa pitäisi olla enemmän satunnaista vaihtelua kuin suurimmissa. Samoin jos huijausta tapahtuu, se on viisaampaa tehdä suuremmissa piirikunnissa, koska niissä vaikutus on suurin.
Kaikki edelläoleva on siis kirjoitettu ennen kuin mitään tietoja on haettu saati sitten laskettu, poislukien kirjoitusvirheiden korjaukset. Halusin selvittää asian mahdollisimman puolueettomasti.
Tulokset olivat seuraavat. Jokaisessa taulukossa on ensimmäisessä sarakkeessa osavaltion nimi, toisessa mihin ryhmään osavaltio kuului (A = Trumpin selvimmät voitot, B = Trumpin niukimmat voitot, C = Bidenin niukimmat voitot, D = Bidenin selvimmät voitot) ja kolmannessa sarakkeessa tutkittava muuttuja. Osavaltiot on järjestetty tunnusluvun mukaan. Niiden alapuolella on vielä ryhmien keskiarvot tunnusluvun mukaan järjestettynä.
Menettelytapa 1:
Laskin jokaisesta tutkittavasta osavaltiosta piirikunnittaisen keskihajonnan osavaltion normaaliin tulokseen nähden. Alla olevassa taulukossa on tutkittavana muuttujana vuoden 2020 vaalien keskihajonnan ja vuoden 2016 vaalien keskihajonnan erotus osavaltion piirikunnissa. Positiivinen arvo tarkoittaa keskihajonnan kasvua, negatiivinen pienenemistä.
Osavaltio | Ryhmä | Tunnusluku |
---|---|---|
Länsi-Virginia | A | 0,00932 |
Oklahoma | A | 0,00748 |
Wyoming | A | 0,00706 |
Ohio | B | 0,00423 |
Wisconsin | C | 0,00400 |
Pennsylvania | C | 0,00271 |
Georgia | C | 0,00095 |
Pohjois-Dakota | A | 0,00043 |
Vermont | D | -0,00074 |
Florida | B | -0,00418 |
Pohjois-Carolina | B | -0,00506 |
Massachusetts | D | -0,00653 |
Arizona | C | -0,00716 |
Maryland | D | -0,00799 |
Kalifornia | D | -0,01129 |
Teksas | B | -0,02160 |
Keskiarvo | A | 0,00607 |
Keskiarvo | C | -0,00255 |
Keskiarvo | D | -0,00664 |
Keskiarvo | B | -0,00665 |
Tämän mukaan huolestuttavimmat tulokset olisivat tulleet ryhmän A osavaltioissa, joissa Trump voitti reiluimmin. Niissä piirikuntien keskihajonta kasvoi siis eniten vuoden 2016 vaaleihin nähden. Kaikissa muissa ryhmissä keskihajonta pieneni. Huijaaminen olisi kuitenkin ollut turhaa selvästi voitokkaissa osavaltioissa. Muissa osavaltioissa piirikuntien hajonta oli pienempää kuin neljä vuotta aiemmissa vaaleissa, ei suurempaa kuten huijauksessa olisi luultavasti tapahtunut.
Tämän mittarin mukaan ei ole mitään syytä epäillä vaalivilppiä.
Menettelytapa 2:
Katsotaan, kuinka Trumpin ääniosuus muuttui vuoden 2016 vaaleista vuoden 2020 vaaleihin. Tätä muutosta verrataan piirikunnittain osavaltion keskimääräiseen muutokseen laskemalla, kuinka suuri oli muutoksen keskihajonta. Mitä suurempi lukuarvo, sitä enemmän osavaltion piirikunnissa oli eroa osavaltion keskimääräiseen muutokseen.
Osavaltio | Ryhmä | Tunnusluku |
---|---|---|
Teksas | B | 0,05082 |
Arizona | C | 0,02753 |
Kalifornia | D | 0,02500 |
Florida | B | 0,02455 |
Georgia | C | 0,02332 |
Maryland | D | 0,02240 |
Pohjois-Carolina | B | 0,02228 |
Oklahoma | A | 0,01983 |
Ohio | B | 0,01847 |
Massachusetts | D | 0,01726 |
Pohjois-Dakota | A | 0,01693 |
Länsi-Virginia | A | 0,01539 |
Wisconsin | C | 0,01449 |
Pennsylvania | C | 0,01313 |
Wyoming | A | 0,01170 |
Vermont | D | 0,00721 |
Keskiarvo | B | 0,02903 |
Keskiarvo | C | 0,02194 |
Keskiarvo | D | 0,01797 |
Keskiarvo | A | 0,01596 |
Vaa’ankieliosavaltioissa hajonta oli suurinta. Suurempaa se oli Trumpia kannattavissa osavaltioissa kuin Bideniä kannattavissa. Ero tulokseltaan selviin osavaltioihin oli kohtuullisen suuri, mutta ei niin suuri että se olisi merkki huijauksesta.
Tämä mittari ei anna merkittävää syytä epäillä vaalivilppiä. Kuitenkin epäilyttävät osavaltiot ovat tilastossa kärjessä, mikä herättää huomiota.
Menettelytapa 3:
Katsotaan, missä osavaltion piirikunnista muutos vuoden 2016 vaaleista vuoden 2020 vaaleihin on ollut poikkeuksellisen suuri verrattuna osavaltion keskimääräiseen muutokseen. Otetaan osavaltion piirikunnista ylöspäin pyöristäen ne 25 %, joissa muutos on suurin. Katsotaan, kuinka monta näistä kuuluu asukasluvultaan osavaltion ylimpään kvartiiliin eli 25 %:iin. Kolmannessa sarakkeessa on tällaisten piirikuntien lukumäärä, neljännessä sarakkeessa kuinka monta niitä pitäisi olla jos niitä olisi täsmälleen niin monta kuin pitäisi. Viimeisessä sarakkeessa näkyy, kuinka moninkertainen poikkeama suurten piirikuntien odotusarvosta on. Nollatulos tarkoittaa täsmälleen odotusarvoa, positiivinen suurten piirikuntien yliedustusta, negatiivinen aliedustusta.
Osavaltio | Ryhmä | Piirikuntia | Odotusarvo | Tunnusluku |
---|---|---|---|---|
Teksas | B | 23 | 15,5 | 0,484 |
Pennsylvania | C | 6 | 4,1875 | 0,433 |
Maryland | D | 2 | 1,5 | 0,333 |
Ohio | B | 7 | 5,5 | 0,273 |
Florida | B | 3 | 4,125 | -0,273 |
Wisconsin | C | 3 | 4,5 | -0,333 |
Georgia | C | 6 | 9,8125 | -0,389 |
Pohjois-Dakota | A | 2 | 3,3125 | -0,396 |
Pohjois-Carolina | B | 2 | 6 | -0,667 |
Länsi-Virginia | A | 1 | 3,1875 | -0,686 |
Oklahoma | A | 1 | 4,75 | -0,789 |
Kalifornia | D | 1 | 14,5 | -0,931 |
Wyoming | A | 0 | 1,4375 | -1,000 |
Arizona | C | 0 | 0,9375 | -1,000 |
Vermont | D | 0 | 0,875 | -1,000 |
Massachusetts | D | 0 | 0,875 | -1,000 |
Keskiarvo | B | -0,046 | ||
Keskiarvo | C | -0,347 | ||
Keskiarvo | D | -0,649 | ||
Keskiarvo | A | -0,718 |
Etukäteen ajatellen kaikkien arvojen luulisi olevan negatiivisia, koska pienissä piirikunnissa satunnaisen vaihtelun pitäisi olla suurempaa. Peräti neljässä osavaltiossa oli kuitenkin yliedustus suurten piirikuntien määrässä. Toisaalta nämä kuuluvat kolmeen eri ryhmään, mikä ei viittaa huijaukseen.
Tämän mittarin perusteella huijausta ei tapahtunut, mutta sen mahdollisuutta ei voi sulkea pois.
Lopputulema siis on, että ainakaan tällä menetelmällä ei saatu mitään näyttöä huijauksesta – millään kolmella tutkimusasetelmalla. Ensimmäinen niistä antoi täysneutraalin tuloksen. Kahdessa muussa oli hieman poikkeamaa odotettuihin tuloksiin, mutta täysin satunnaisen vaihtelun rajoissa.
Tutkimusmenetelmän ilmeinen heikkous oli tietysti se, että vertailukohtana käytettiin vuoden 2016 vaaleja. Trumpin kannatus ja vastustus tuskin on muuttunut. Biden on kuitenkin erilainen ehdokas ja vetoaa osin eri äänestäjiin kuin Clinton. Voidaan esimerkiksi kuvitella, että jossakin piirikunnassa on runsaasti konservatiivisia feministejä, jotka varmasti äänestivät Clintonia, mutta eivät Bideniä vaan jättivät äänestämättä tai äänestivät jopa Trumpia.
Toinen heikkous on se, että piirikuntien koko ja lukumäärä ovat kovin erilaiset eri osavaltioissa. Joissakin on 14 piirikuntaa ja Teksasissa niitä on 254. Piirikuntien kokoerotkin ovat valtavat: Teksasin (ja koko Manner-Yhdysvaltojen) pienin piirikunta on 134 asukkaan Loving, kun taas suurimmassa eli Harrisissa (Houston) on 4,6 miljoonaa asukasta. Nämä aiheuttavat tietysti aineiston analysointiin ongelmia.
Kolmas heikkous on myös kokoon liittyvä. Jos huijausta tapahtui, sitä luultavimmin tapahtui suurten piirikuntien muutamalla äänestysalueella. Tämä huijaus uppoaa tilastoaineistossa melko hyvin näkymättömiin, mutta jos tutkisi äänestysalueiden suhteita piirikunnan sisällä samalla menetelmällä kuin tässä tutkittiin piirikuntia osavaltion sisällä, huijaus saattaisi paljastua.
Lisäksi olisi mielenkiintoista verrata Bidenin suoritusta Clintonin suoritukseen muissa osavaltioissa. Kävihän tässä jopa sellainen mielenkiintoiselta vaikuttava tapaus, että Biden sai Clintonia vähemmän ääniä kaikissa suurkaupungeissa, paitsi Milwaukeessa (Wisconsin), Detroitissa (Michigan), Atlantassa (Georgia) ja Philadelphiassa (Pennsylvania). Kaikki avainosavaltioissa, kolme niistä tässäkin tutkimuksessa mukana Bidenin niukkoina voittoina.