Menin eilen kirjaston lehtiosastolle äärimmäisen motivoituneena ja päämäärätietoisena. Kuntavaaleja on nyt seurattava!
Ihmiset antoivat nöyrästi tilaa ja väistyivät tieltäni, kun he näkivät tahdonvoiman, joka kumpusi sielustani. Tieto ja minä vedimme toisiamme puoleemme väistämättömästi.
Mieli auki, sielu auki, takki auki.
Suomen Kuvalehti auki.
Suu auki.
Ensimmäinen reaktioni oli hämmästys: onpas isoja mielipide-eroja.
Sitten huomasin asteikon. Halvatun toimittaja (tai graafikko) oli venyttänyt skaalaa miten tahtoi, jotta puolueiden kannattajat olisivat ääripäissä.
Jos asteikko on 1-5, ja ylimmän palkin keskiarvot ovat 3,25 ja 3,60, ne eivät itse asiassa ole lainkaan ääripäitä, vaan hyvinkin lähekkäin toisiaan.
Ketä tällainen palvelee?
Suomen Kuvalehti kiinni.
Yksinkertainen vastaus eli toimittajia. Jos ei ole uutisoitavaa, niin tehdään sitä sitten. Olisi aika tylsää uutisoida, että kaikilla puolueiden kannattajilla suunnilleen samat asiat vaikuttavat äänestyspäätökseen.
Tämä on tärkeä asia opeteltaessa kommentoimaan politiikkoja eli aina pitää löytää jokin pienen pieni asia johon tarttua kiinni. Jos ei muuten onnistu, niin asia pitää irroittaa asiayhteydestään. Tai vaihtoehtoisesti skaalata tilastot tuemaan omia mielipiteitä.
Jossain Tom Clancyn romaanissa väitettiin, että politiikkoa ei kiinnosta kokonaisuudet vaan se kuinka saa revittyä omaa julkisuutta ja erinomaisuutta pönkittävää lausuntoa jostain pienestä nyanssista.
Kuhan pohdin, Kari…
Tämä on oikein oppikirjaesimerkki kirjasta ”Kuinka tilastoilla valehdellaan”. Skaaloja ei ole pelkästään venytetty ja katkottu
hurjasti, vaan lisäksi niitä on venytetty eri tavoin eri kysymysten
kohdalla. Lisäksi ”epäkiinnostavat” puolueiden vastaukset ovat hävinneet jonnekin.
Olisikohan toimittaja RKP:n kannattaja?
Kiitos kommenteista!
Suomen Kuvalehden toiminta on tosiaan raivostuttavaa. Kun kyselyssä ei ole syntynyt kunnon mielipide-eroja, toimittaja on tehnyt niitä väkisin tilastoja vääristämällä.
Olisin odottanut tällaista toimintaa iltapäivälehdiltä, mutta en Suomen Kuvalehdeltä.
Hei, tuossahan on vielä se ongelma, että asteikko ei todennäköisesti ole lineaarinen*, jolloin keskiarvoja voisi esittää. Pitäisi poimia moodi, eli yleisin vastaus: 1, 2, 3, 4 tai 5. Mutta sittenhän eroja ei ainakaan tulisi…
*) Vaihtoehdot näyttävät todennäköisesti tältä:
Vaikuttaa erittäin vähän äänestyspäätökseen
Vaikuttaa vähemmän äänestyspäätökseen
??? (vaikuttaa vähän, muttei kuitenkaan paljoa), kenties en osaa sanoa
Vaikuttaa enemmän äänestyspäätökseen
Vaikuttaa erittäin paljon äänestyspäätökseen
Masentava tulkinta tutkimuksen tuloksista.
Oivallinen lisähuomio. Tällaisen kyselyn keskiarvotulokset ovat yhtä tarkkoja kuin apinan tikkatauluheitto.
Kävin Kuvalehden sivuilla. Siellä oli dataakin.
http://suomenkuvalehti.fi/jutut/kotimaa/sk-tutki-naista-palveluista-suomalaiset-ovat-huolissaan
Itse kyselyn asteikko oli 1-4.
4= Vaikuttaa erittäin paljon
3= Vaikuttaa jonkin verran
2= Vaikuttaa vähän
1= Ei vaikuta lainkaan
Sen lisäksi oli vaihtoehto ”en osaa sanoa”.
Tämä oli muutettu 5 portaiseksi asteikoksi. Hei haloo! Onko siellä Kuivalehdessä tilastoista ketään ymmärtävää? ”En osaa sanoa” ei ole tälle asteikolle sopiva muuttujan arvo. Asteikko on neliportainen ja ääripäät ovat 1 ja 4.
Voi apua. Ihmisten mielipiteitä on siis kysytty neliportaisella, ei-lineaarisella asteikolla. Tästä on sitten kiskottu lopullisia tuloksia kahden desimaalin tarkkuudella viisiportaiselle lineaariselle asteikolle – jota on sitten skaalattu ja rajattu omien tarpeiden mukaan.
Ehkä minun täytyisi lähteä tilastotieteen kurssille, koska en ole kuullutkaan näin kätevästä metodista.
”Lineaarisella” keskustelussa tarkoitettu ilmeisesti jatkuvaa, joka on diskreetin jakauman vastakohta.
Timo on näköjään täällä jo ollutkin, tulin linkittämään hänen tekstiään: http://timosuvanto.blogspot.fi/2012/09/poikkitieteellista-tilastointia.html
Lineaarinen tarkoittaa sitä, että muuttujan arvojen välimatkat ovat yhtä pitkiä. Olettamus on tässä täysin absurdi, koska todellinen muuttuja on vain järjestysasteikollinen. Se että muutujille annetaan numeroarvot kuten alla, ei tee asteikosta välimatka-asteikollista eli sellaista, jossa peräkkäisten arvojen välit ovat yhtä suuret.
4= Aivan varmasti
3= Melko varmasti
2= Ei ehkä äänestäisi
1= Varmasti ei äänestäisi
Diskreetti- ja jatkuva jakauma ovat sitten eri juttu.
Itse en tiedä mitään tilastotieteestä, mutta näin sanoo myös minun arkijärkeni: lineaarinen asteikko on tehty tasavälein.
Sen sijaan mutu-tuntumaa kuvaava mielipideasteikko ei ole lineaarinen, koska jokaisen omissa mielikuvissa arvosanojen välimatkat ovat erilaisia.
(Omasta mielestäni on muuten valtava ero arvoilla ”3: jonkin verran” ja ”4: erittäin paljon”, kun taas on hyvin pieni ero arvoilla ”3: jonkin verran” ja ”2: vähän”. Asteikko ei siis minun korvaani ole lainkaan lineaarinen.)
Minulla on lyhyt sivuaine tilastotieteestä. Opintokokonaisuuden tärkein mieleenjäänyt seikka oli, että oikeisiin tilastohommiin hankitte sitten oikean tilastotieteilijän. Vakavasti puhuen, jo vähäiselläkin tilastotieteen opiskelulla pystyy ainakin epäilemään hyvin monia tutkimuksia. Ja vähäiselläkin tilastotieteen ymmärryksellä pystyy välttämään ne kaameimmat virheet: tietynlaisen aineiston käsittelyn väärillä menetelmillä (tässä se olisi tietysti keskiarvojen laskeminen järjestysasteikollisesta muuttujasta) ja tulosten venyttäminen sopiviksi asteikkoa vääristämällä.
Hyvä tarkennus! Pelkät tilastotieteen perusteet jo auttavat ymmärtämään, miten tilastoilla voidaan valehdella.
Pitäisiköhän muuten peruskoulun oppimäärässä olla hitunen tilastotiedettä? (En tosin enää muista, oliko sitä edes lukiossa.)
Peruskoulun oppimäärässä on palanen tilastotiedettä matematiikassa. Olen itse kerran opettanut ysiluokkalaisille tämän jakson ja suurin osa heistä oppi perusteet tilastojen lukemisesta vaivattomasti. Ehkä nämä opit unohtuvat aikuisikään mennessä muiden matematiikan taitojen tavoin.
Voi pahus, me aikuiset tarvitsemme siis kertauskurssin asiasta. Yläasteen oppimäärä ei selvästikään riitä. 🙁
Tajuavatkohan ihmiset, kuinka helposti heitä voi johtaa harhaan tilastoilla? Entä kuinka monen äänestyspäätös nojaa johonkin pseudotilastoon, joka on rakennettu täysin väärin?