Wat is de p-waarde?
Het begrijpen, gebruiken (SPSS) en interpreteren van de p-waarde
Als je voor je scriptie wetenschappelijke artikelen hebt gelezen, is de kans heel groot dat je wel eens een p-waarde bent tegengekomen. De p-waarde wordt heel vaak gebruikt voor hypothese-toetsing in de statistiek. Het is daarom handig als je weet hoe je het moet interpreteren en hoe je p-waardes moet rapporteren in je scriptie.
Een hypothetisch voorbeeld over hypothesetoetsing
Om p-waarden goed te kunnen begrijpen, moet je weten wat we verstaan onder hypothese toetsing. Elk wetenschappelijk onderzoek begint met een hypothese. Een simpel hypothetisch voorbeeld. Stel dat iemand claimt dat mannen gemiddeld langer zijn dan vrouwen. Een tweede persoon is de advocaat van de duivel en zegt dat er geen verschil in gemiddelde lengte is tussen mannen en vrouwen. In de wetenschap moeten we net als de tweede persoon altijd kritisch zijn en gaan we er (heel pessimistisch) van uit dat we geen verschil in gemiddelde lengtes gaan vinden. De stelling van de tweede persoon noemen we dan de nulhypothese. We willen de eerste stelling dat mannen gemiddeld langer zijn dan vrouwen onderzoeken, dit is onze alternatieve hypothese. Om dit te toetsen meet je vervolgens de lengte bij 50 mannen en 50 vrouwen. Je berekent van beide groepen de gemiddelde lengte en je ziet dat de gemiddelde lengte van de mannen 14 cm groter is dan die van de vrouwen. Maar is dit ook statistisch significant?
Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000). Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is. We zeiden aan het begin dat de er volgens de nulhypothese geen verschil in lengte is (0 cm). De kans dat we toch zo’n groot verschil vinden (14 cm) ervan uitgaande dat er geen verschil is in lengte, is de gevonden p-waarde. Anders gezegd, in 1 op de 1000 studies zouden we dit verschil of groter vinden puur op basis van toeval als de nulhypothese waar zou zijn. Als we een statistische significantie hanteren van 0,05 dan kunnen we de nulhypothese verwerpen.
Valkuilen
In de wetenschap is het gebruikelijk dat p-waarden < 0,05 statistisch significant zijn. Er wordt veel waarde toegeschreven aan statistische significantie. Zo worden studies die geen significant verschil weten aan te tonen minder vaak gepubliceerd. Probeer toch te vermijden dat je gaat zoeken naar significante resultaten. Op basis van kansen (5%) vind je namelijk al 1 significante uitkomst bij 20 statistische toetsen. Bedenk dus van te voren je statistische plan en voorkom p-hacking.
Hoe vermeld ik de p-waarden in mijn scriptie?
Als je je scriptie in het Engels schrijft, gebruik dan een punt in plaats van een komma (bijvoorbeeld p < .01). Je ziet dat we ook geen 0 zetten voor de punt in dit geval. Dit komt doordat een p-waarde per definitie nooit groter kan zijn dan 1! In het Nederlands gebruik je een komma (bijvoorbeeld p < 0,01). SPSS geeft nog wel eens p < .000, noteer voor p-waarden kleiner dan 0,001 in dat geval p < 0,001.
Statistische significantie vs. relevantie
Verder is het belangrijk om niet alleen de gevonden p-waarden te vermelden, maar ook de gevonden verschillen. Bij grote steekproefgroottes vind je namelijk al snel significante uitkomsten, maar hoeven de daadwerkelijke verschillen helemaal niet zo indrukwekkend te zijn. Vaak is het dan veel informatiever om de betrouwbaarheidsintervallen te vermelden. Dit is het onderwerp van een volgende blog.