Inzicht in de relevantie van de berekening van de steekproefgrootte | Digital Travel
Onderzoek wordt verricht om een oplossing te vinden voor een bepaald medisch probleem (geformuleerd als een onderzoeksvraag die op haar beurt) op basis van statistiek. In een ideale situatie zou de gehele bevolking moeten worden bestudeerd, maar dit is bijna onmogelijk. Afgezien van de volkstelling, die bij elke persoon van de bevolking wordt uitgevoerd, worden alle andere studies uitgevoerd op een beperkt aantal personen uit de betrokken populatie, de zogenaamde “steekproefpopulatie”. De verkregen gegevens worden geanalyseerd en er worden conclusies getrokken die worden geëxtrapoleerd naar de bestudeerde bevolking. Het doel van dit hoofdartikel is te wijzen op de noodzaak en het belang van de berekening van de steekproefgrootte, die moet worden uitgevoerd voordat aan een studie wordt begonnen.
Het belang van de berekening van de steekproefgrootte kan niet genoeg worden benadrukt. Een onderzoek kan voor verschillende doeleinden worden uitgevoerd. Het kan worden uitgevoerd om een verschil vast te stellen tussen twee behandelingsregimes in termen van vooraf gedefinieerde parameters zoals gunstige effecten, bijwerkingen, en risicofactoren van deze regimes. Zij kan ook worden uitgevoerd om de gelijkenis tussen groepen aan te tonen. Soms kan het doel zijn een bepaalde schatting in de populatie te maken, zoals de prevalentie van een ziekte. Wat het doel ook moge zijn, een precieze en nauwkeurige conclusie kan alleen worden getrokken met een passende steekproefgrootte. Een kleinere steekproef zal een resultaat opleveren dat misschien niet krachtig genoeg is om een verschil tussen de groepen aan te tonen en de studie kan vals negatief blijken te zijn, wat tot een type II-fout leidt. Een studie met een kleine steekproef is om voor de hand liggende redenen heel verleidelijk, maar het is een verspilling van tijd en geld, aangezien het resultaat steevast niet overtuigend zal zijn. Heel vaak wordt tot een kleine steekproefgrootte willekeurig besloten op basis van het gemak van de onderzoekers, de beschikbare tijd en de middelen, wat resulteert in een nulproef omdat er onvoldoende proefpersonen zijn onderzocht. Moher e.a. hebben in de literatuur gewezen op de omvang van studies met een te kleine steekproefgrootte die tot null trials leiden. In een studie vonden zij dat van de 102 null trials slechts 36% 80% power had om een relatief verschil van 50% tussen groepen te detecteren. Alleen voor een zeldzame ziekte of indicatie is een underpowered studie gerechtvaardigd, vanwege de logistiek, omdat de gegevens van zo’n studie nuttig zijn bij meta-analyses.
Een zeer grote steekproefgrootte is ook niet aan te bevelen, omdat dit zijn eigen gevolgen heeft. Ten eerste is het een verspilling van de beperkte beschikbare middelen in termen van tijd en geld wanneer een antwoord nauwkeurig kan worden gevonden uit een kleinere steekproef. Ten tweede kan het werven van meer proefpersonen dan nodig ook onethisch worden genoemd, aangezien de patiënten aan een studie deelnemen met vertrouwen en een altruïstisch motief, dat niet verkeerd mag worden gebruikt. Ten derde zal bij gerandomiseerd gecontroleerd onderzoek aan meer mensen een betere behandeling worden geweigerd en zullen zij een placebo of een inferieure behandeling krijgen met de bijbehorende bijwerkingen of toxiciteit als gevolg van de inherente opzet van het onderzoek. Deze geldige redenen zijn voldoende om een juiste schatting van de steekproefgrootte te rechtvaardigen vóór het begin van elke studie.
Hoewel de berekening van de steekproefgrootte kan variëren naar gelang van het type studieopzet, blijft het basisconcept hetzelfde. De drie belangrijkste factoren waarmee rekening moet worden gehouden, zijn α-fout, β-fout en klinisch significant verschil of de effectgrootte. Type I-fout of α-fout is het niet aanvaarden van de nulhypothese wanneer deze in werkelijkheid waar is. Gewoonlijk wordt deze vastgesteld op 5%. De steekproefgrootte moet worden vergroot als deze waarde moet worden verlaagd. Type II-fout of β-fout is het niet verwerpen van de nulhypothese wanneer deze niet waar is. Volgens afspraak kan deze op 20%, 10% of 5% worden gesteld. De power van het onderzoek is gelijk aan 1 type II-fout; daarom moet elk onderzoek ten minste 80% power hebben. De steekproefgrootte neemt toe wanneer de power van het onderzoek wordt verhoogd van 80% tot 90% of 95%. De derde factor is de effectgrootte. Een klein klinisch significant verschil is moeilijk vast te stellen en vereist een grotere steekproefgrootte in vergelijking met een studie met een groter klinisch significant verschil. De andere factoren die in aanmerking moeten worden genomen zijn de standaardafwijking voor kwantitatieve metingen, de foutenmarge en het uitvalpercentage. Deze waarden zijn bekend uit de literatuur of kunnen worden bepaald door een proefonderzoek of door redelijk giswerk. Het getal dat we na deze berekeningen krijgen is niet het exacte getal, maar een richtsnoer bij benadering voor de steekproefgrootte. Soms moet de aldus berekende steekproefgrootte worden aangepast in verband met haalbaarheid, zoals financiële middelen, duur van de studie en beschikbare proefpersonen. Maar er mag geen grote verschuiving optreden in de steekproefgrootte op deze punten. De basis van de steekproefgrootte die in een bepaalde studie is gekozen, moet ten behoeve van de lezers worden vermeld in het gedeelte “materiaal en methoden” van het verslag. Moher e.a. stelden in 1994 vast dat slechts 32% van de nulproeven berekeningen van de steekproefgrootte in de gepubliceerde artikelen vermeldde. De redacteuren zijn nu bijzonder streng in het rapporteren van de berekeningsgrondslagen van de steekproefomvang in gepubliceerde artikelen. Een verdere discussie over de principes van de berekening van de steekproefomvang valt buiten het bestek van dit redactioneel. De twee artikelen van Malhotra et al, en Gogate in dit nummer van Indian Journal of Ophthalmology, evenals enkele andere belangrijke artikelen zullen echter verder inzicht verschaffen in het begrip van de berekening van de steekproefgrootte.
Elke grote fout in de berekening van de steekproefgrootte zal de power en de waarde van een studie beïnvloeden. “Veel voorkomende fouten in de steekproefgrootte omvatten het niet uitvoeren van berekeningen, het maken van onrealistische aannames, het niet rekening houden met potentiële verliezen tijdens het onderzoek en het niet onderzoeken van de steekproefgrootte over een reeks aannames. Redenen voor studies met onvoldoende steekproefgrootte die geen statistische significantie bereiken, zijn onder meer het niet uitvoeren van berekeningen van de steekproefgrootte, het selecteren van de steekproefgrootte op basis van gemak, het niet verzekeren van voldoende financiering voor het project en het niet efficiënt gebruiken van de beschikbare financiering.”
Concluderend, het berekenen van de steekproefgrootte is een zeer belangrijk aspect van elke studie. Het moet worden gedaan op het moment dat een studie wordt gepland, op basis van het type onderzoeksvraag en studieopzet. Het is raadzaam om ook in dit stadium van de studie de hulp van een statisticus in te roepen. Auteurs moeten gedetailleerde informatie verstrekken over de berekening van de steekproefgrootte die zij hebben gebruikt bij de publicatie van hun artikelen. Veel nihilstudies kunnen door een kleinere steekproefomvang underpowered zijn om het gewenste verschil op te sporen. De underpowered studies moeten voorzichtig worden geïnterpreteerd en de “afwezigheid van bewijs” in deze studies mag niet worden opgevat als “bewijs van afwezigheid”.