Omgaan met Confounders: Stratificatie
De Betekenis van Confounding en het Corrigeren Middels Stratificatie
Als je observationeel onderzoek doet naar de invloed van blootstelling aan een bepaalde factor (determinant) op een uitkomstvariabele, moet je altijd rekening houden met confounders. Als je dit niet doet, vind je mogelijk een te sterk of te zwak verband tussen de blootstelling en de uitkomst. Het zijn dus in feite verstorende variabelen. Hier leggen we uit wat confounders zijn en hoe je kan corrigeren voor confounders met behulp van stratificatie.
Wat zijn confounders precies?
Je spreekt van een confounder als een variabele aan drie voorwaarden voldoet:
- het moet invloed hebben op je uitkomstvariabele, oftewel het vormt een risicofactor. De uitkomstvariabele is de afhankelijke variabele. Je onderzoekt onafhankelijk variabelen (determinanten) die hier een verband mee hebben. Bijvoorbeeld, als je onderzoek doet naar het effect van een behandeling op overleving, is overleving je uitkomstvariabele en de behandeling je determinant.
- het heeft verband met de blootstelling die je onderzoekt;
- het moet geen gevolg zijn van de determinant of onderdeel zijn van de causale keten.
Corrigeren voor confounders: stratificatie
Dit is tot nu toe allemaal heel theoretisch dus laten we het aan de hand van een voorbeeld uitleggen. Stel dat je onderzoek doet naar het effect van koffiedrinken op het krijgen van een hartaanval. In dit geval is de blootstelling of determinant koffie drinken en de uitkomst is het wel of niet krijgen van een hartaanval.1 Je bekijkt 150 mensen die een hartaanval hebben gehad en 150 mensen die geen hartaanval hebben gehad. We berekenen in deze tabel de odds ratio (OR). Dit is een maat om het effect van een binaire determinant op een binaire uitkomst te bepalen. Odds ratios komen in een volgende blog uitgebreider aan de orde.
Hartaanval (n = 150) |
Geen hartaanval (n = 150) |
OR |
|
---|---|---|---|
Koffie | 90 | 60 | |
Geen koffie | 60 | 90 | |
Odds | 90/60 | 60/90 | 2.25 |
We vinden dus een odds ratio van 2,25 voor het verband tussen koffie drinken en het krijgen van een hartaanval. Met andere woorden, de odds op het krijgen van een hartaanval voor mensen die koffie drinken is 2,25 keer zo hoog als de odds voor mensen die geen koffie drinken. Moeten we hieruit concluderen dat koffie drinken geassocieerd is met het krijgen van een hartaanval? Laten we stratificatie toepassen om te corrigeren voor mogelijke confounders. Stratificatie wil zeggen dat je de determinant (bijv. wel/geen koffie) verdeelt in strata (subgroepen) waarin de confounder niet meer varieert. Dit is een strategie om te corrigeren voor confounding nadat je data hebt verzameld. Als we de groep verdelen in rokers en niet-rokers, krijgen we de volgende tabel:
Rokers (n = 150 |
Niet rokers (n = 150) |
|||||
---|---|---|---|---|---|---|
Hartaanval | Geen hartaanval | OR | Hartaanval | Geen hartaanval | OR | |
Koffie | 80 | 40 | 10 | 20 | ||
Geen koffie | 20 | 10 | 40 | 80 | ||
Odds | 80/20 | 40/10 | 1,0 | 10/40 | 20/80 | 1,0 |
We zien nu dat zowel voor rokers als voor niet-rokers het verband tussen koffie drinken en het krijgen van een hartaanval een OR van 1,0 heeft! Is roken dan nu een confounder? Roken heeft een verband met de determinant (rokers drinken meer koffie dan niet-rokers) en met de uitkomst (hartaanval). Daarnaast is roken geen direct gevolg van de determinant: koffie drinken leidt niet direct tot roken. Roken voldoet dus aan alle bovenstaande voorwaarden van een confounder en verstoort het verband tussen koffie drinken en het krijgen van een hartaanval.
Hoe weet ik nu of er sprake is van confounding?
Als je ziet dat de odds ratio van de totale groep zonder stratificatie (crude odds ratio, want niet gecorrigeerd voor confounders) grofweg meer dan 10% verschilt met de stratum-specifieke odds ratios, kun je ervan uitgaan dat er sprake is van confounding. Dit is dus hier het geval.
Kan ik alleen stratificeren met binaire variabelen?
Niet per se. Je kan continue variabelen ook verdelen in categorieën waarin je kan stratificeren. Je kan bijvoorbeeld leeftijd verdelen in leeftijdsgroepen (< 50 jaar, ≥ 50 jaar) om zo te controleren of dit een confounder is.
Wat als ik meerdere confounders heb?
In dat geval kan het handiger zijn om een andere strategie toe te passen dan stratificatie, bijvoorbeeld multivariaat analyses zoals logistische regressie. Hier komen we een andere keer op terug. Als je te veel strata toepast, kan dit namelijk leiden tot hele kleine aantallen binnen de strata.
Hoe maak ik strata in SPSS?
Gebruik hiervoor Analyze – Descriptive Statistics – Crosstabs. Kies voor Rows je determinant en voor Columns je uitkomstvariabele. Om te stratificeren, kun je de stratificatie-variabele toevoegen als Layer.