Mitä ”tilastollinen merkitsevyys” tarkoittaa?

Tutkimustuloksista käytetään usein termiä ”tilastollisesti merkitsevä”. Mutta mitä se oikeastaan tarkoittaa?

© Shutterstock

Käsitteellä ”tilastollisesti merkitsevä” tarkoitetaan sitä, että tutkimuksen tulos ei johdu pelkästään sattumasta.

Kun tutkijat haluavat esimerkiksi testata lääkettä, testi yleensä suoritetaan koeryhmällä ja tuoksia verrataan identtisen kontrolliryhmän tuloksiin. Kontrolliryhmään kuuluvat saavat tehotonta lääkettä eli lumelääkettä.

Tutkijat ovat etukäteen määritelleet niin sanotun p-arvon, joka ilmoittaa todennäköisyyden sille, että kahden ryhmän tulosten väliset erot eivät johdu pelkästään sattumasta.

Tutkimuksen jälkeen tutkijat kysyvät itseltään: Millä todennäköisyydellä havaittu ero – tai suurempi ero – ryhmien välillä olisi syntynyt, jos molemmille olisi annettu lumelääkettä? Jos tämä todennäköisyys on pienempi kuin p-arvo, ero on ”tilastollisesti merkitsevä”.

Tämä ei välttämättä tarkoita sitä, että lääkkeen vaikutus on suuri, vaan ainoastaan sitä, että se näyttää olevan sitä kyseisen tutkimuksen perusteella.

Juustonsyöjät tukehtuvat lakanoihin

Tutkijat voivat lisätä tulosten varmuutta laajentamalla koeryhmää. Silloin on kuitenkin vaikeampi valvoa tuloksiin vaikuttavia mahdollisia ulkopuolisia tekijöitä.

Hyvin suurista datamääristä voidaan löytää tilastollisia korrelaatioita sellaisten asioiden välillä, joilla ei ole itse asiassa ole yhtään mitään tekemistä toistensa kanssa. Esimerkiksi Yhdysvalloissa on löydetty yhteys juustonkulutuksen kehityksen ja lakanoihinsa tukehtuneiden ihmisen välillä.

5 prosenttia on yleisin p-arvo tieteellisissä tutkimuksissa. Se tarkoittaa, että tulosten sattumanvaraisuus saa olla enintään viisi prosenttia.