Jos elokuussa ei tiedettäisi mitään, niin sitten kai pitäisi jakaa 100 prosentin kakku tasan kaikkien ehdokkaiden kesken, joita on Clintonin ja Trumpin lisäksi ainakin pari-kolme. Mutta silloin kai tiedettiin jo suurella todennäköisyydellä, että valinta tulee olemaan Clintonin ja Trumpin välillä, ja että Clinton on suosikki voittamaan (koska Trump on ennätysmäisen epäsuosittu ehdokas). Tiedettiin myös, että Trumpillakin on mahdollisuuksia voittoon, koska iso osa äänestäjistä ei ollut vielä lukinnut kantaansa mihinkään suuntaan, ja Trumpin lupaama muutos saattoi houkutella ihmisiä tilanteessa, jossa suurin osa amerikkalaisista on tyytymättömiä maan suuntaan.
Kyllä, mitä yrität tällä sanoa? Esim. Predictwisen ennuste heinäkuun lopussa oli Clintonille noin 75%, mikä oli erinomaisesti linjassa sivuston aiemman ennusteen kanssa, mutta antoi myös selvän mahdollisuuden Trumpin voitolle. Fivethirtyeightin ennuste oli käytännössä 50-50, mikä oli melkoinen muutos heidän aiempiin mutta erityisesti tuleviin lukuihinsa. Noin viikko tuosta eteenpäin 538 oli nimittäin sitä mieltä että Clinton on niskan päällä 85-15. Samaan aikaan Predictwise oli päivittänyt ennusteensa tuosta 75-25 tilanteesta tilanteeseen 80-20. Eilisiltaan mennessä Predictwisen ennuste oli päätynyt maltillisten heilahtelujen jälkeen arvioon 89-11, kun taas samana ajanjaksona 538 on tullut 90-10 -arviosta vielä kerran 50-50 arvioon ja päätynyt lopulta noin tilanteeseen 70-30 Clintonille.
Silverin sekoilu sotii lähes kaikkea hänen itse kirjassaan saarnaamaa vastaan mm.
hitaasti asteittain todennäköisyyksien päivittämisestä uuden tiedon valossa ja ylisovittamisen vaaroista sekä puheista ihanteellisesta "Bayes-maasta", jossa eri mieltä olevat ennustajat joko sovittavat ennusteensa yhteen tai lyövät vetoa.
Silver olisi tässä vedonlyönnissä juuri vaikka Predictwisea vastaan rumasti tappiolla, kuten yllä sanoin ja linkkasin selvityksen aiheesta.
Clintonin voittotodennäköisyydet Nate Silverin mallissa on vaihdellut välillä 50-89 % ja Trumpin 12-50 %, mikä vastaa tätä ajatusta, että Clinton on suosikki mutta Trumpillakin on mahdollisuus. Minua ei haittaa tuo todennäköisyyksien heittely, sillä ennusteen käyttäjän pitää kai ymmärtää, että kun vaalit on vielä etäällä niin todennäköisyydet on silloin vain suuntaa antavia, kun suuri osa äänestäjistäkään ei ole vielä päättänyt mitä mieltä ovat. Vasta sitten lopussa todennäköisyyksien pitäisi vakiintua jollekin tasolle, niin kuin ne nyt ovat tässä viimeisellä viikolla tehneetkin.
Nate Silver on alunperin antanut Trumpin ehdokkuudestakin todennäköisyysarvion "käytännössä mahdoton". Nyt hänen mallinsa on tosiaan ollut mainitsemallasi välillä, mikä on hälyttävää noin lyhyelle ajalle, sillä tuo ei ole vähittäisen päivityksen tulosta vaan äkkinäisiä kimpoamisia edestakaisin. Esim. Predictwise on yli tuplasti tuon pituisella ajalla pysynyt suunnilleen välillä 60-90% Clintonille, mutta heidän mallinsa on selvästi tarkentunut vähittäisten muutosten seurauksena, eikä näytä siltä kun viikottaiset arviot valittaisiin rulettia pyörittämällä. Samalla välillä kuin tuo sinun mainitsemasi 538:n 50-89% väli on ollut Clintonille (heilahteluineen), on Predictwise pysynyt välillä 74%-91%.
Ja 538:n todennäköisyydet eivät ole vakiintuneet millekään tasolle, vaan jatkaneet samaa heittelyään mutta toki itse vaalit tämän kierteen pysäyttää kun ennusteen tekeminen loppuu. Siinä mielessä voidaan sanoa arvion "vakiintuneen".
Onko sinusta hyvä kymmenen päivän sääennustekin sellainen, että joka toinen päivä annetaan sateen todennäköisyydeksi 90% ja joka toinen esim. 20%, kunnes lopulta samana aamuna kerrotaan että kyllä se on 80%? Häiritseekö sinua tuolloin todennäköisyyksien
suuri vaihtelu, ja jos kyllä, niin miksi ei nyt? 538:n ennusteesta tulee mieleen että pitäisi ennustaa esim. HIFK:n loppusijoitus Liigassa joka viikko ja päätyisin riviin:
2,1,8,6,1,9,...,6,6,1,6,1,8,1,3, ja
kolme tuli, ennuste oli oikeassa! Ihan kuin esim. ennuste 4, 4, 5, 4,...,4, 3, 3, 2, 3, 3 olisi jotenkin tasavertainen tai luoja paratkoon huonompi. Jos tuossa ensimmäisessä ei haista palaneen käryä ja tarkastele oletuksiaan todella, todella kriittisesti, on jotain vialla ja pahemman kerran.
Kyllä noiden ennusteiden pitäisi myös muuttua uuden datan tullessa sisään, ei voi koko aikaa näyttää 98 % todennäköisyyttä Clintonin voitolle, jos kerran mielipidemittaukset indikoi tiukkaa kisaa.
Jos uskot voivasi antaa toiselle ehdokkaalle niin suuren todennäköisyyden kuin 90% kuukausi-kuukausia ennen vaalitapahtumaa, on ihan naurettavaa joutua muuttamaan ennustetta alaspäin
useita kertoja kymmeniä prosenttiyksikköjä. Eikö tuo nyt viittaa juuri siihen, että varmuuden taso ei ole ollut lähelläkään yhdeksääkymmentä ja tulevaisuuden epävarmuus on aliarvioitu kerta toisensa jälkeen.
Tämä on muutenkin melkoista olkinukkeilua jos kuvittelet tuon olevan vaihtoehto 538:n ylös-alas hyppiville ennusteille. Luitko yllä linkkaamiani kritiikkejä Silverin malleja (erityisesti niiden heilumista) kohtaan?
Valitettavasti tähän kiistaan ei saada vaalin tuloksesta ratkaisua ainakaan jos Clinton voittaa, sillä molemmat tahothan ennustaa Clintonin voittoa, eikä suurikaan voitto (esim. 323-215, jota HP pitää todennäköisimpänä) olisi kovin epätodennäköinen myöskään Nate Silverin ennusteen mukaan. No jos tulee huomattavan niukka Clintonin voitto tai jopa Trumpin voitto, niin se nyt ainakin vihjaisi vahvasti, että Huffington Post oli turhan varma Clintonin voitosta.
En missään nimessä hehkuta Huffington Postin ennustetta, vaan olen pitänyt sitä ja 538:a huomattavasti parempana Predictwisen ennustetta, jossa Clinton sai vaaliaattona todennäköisyydeksi 89%. Nate olisi omaan ennusteeseensa uskoessaan ja oppiensa mukaan eläessään hävinnyt jo ennen lopputuloksen tietoon tuloa melkoisen rahamäärän, joten sanoisin kyllä ettei "voittajasta" tässä suhteessa ole epäselvyyttä.