Articles

Die Bedeutung der Berechnung des Stichprobenumfangs verstehen | Digital Travel

Forschung wird betrieben, um eine Lösung für ein bestimmtes medizinisches Problem (formuliert als Forschungsfrage, die ihrerseits) auf der Grundlage von Statistiken zu finden. Im Idealfall sollte die gesamte Bevölkerung untersucht werden, aber das ist fast unmöglich. Mit Ausnahme der Volkszählung, bei der jede einzelne Person der Bevölkerung befragt wird, werden alle anderen Studien an einer begrenzten Anzahl von Personen aus der betreffenden Bevölkerung durchgeführt, die als „Stichprobenpopulation“ bezeichnet wird. Die gewonnenen Daten werden analysiert, und es werden Schlussfolgerungen gezogen, die auf die untersuchte Bevölkerung extrapoliert werden. Der Zweck dieses Leitartikels ist es, die Notwendigkeit und Bedeutung der Berechnung des Stichprobenumfangs hervorzuheben, die vor Beginn einer Studie durchgeführt werden sollte.

Die Bedeutung der Berechnung des Stichprobenumfangs kann nicht hoch genug eingeschätzt werden. Eine Untersuchung kann zu verschiedenen Zwecken durchgeführt werden. Sie kann durchgeführt werden, um einen Unterschied zwischen zwei Behandlungsschemata in Bezug auf vordefinierte Parameter wie positive Wirkungen, Nebenwirkungen und Risikofaktoren dieser Schemata festzustellen. Sie kann auch durchgeführt werden, um die Ähnlichkeit zwischen Gruppen nachzuweisen. Manchmal kann der Zweck auch darin bestehen, eine bestimmte Schätzung in der Bevölkerung zu erreichen, wie etwa die Prävalenz einer Krankheit. Welches Ziel auch immer verfolgt wird, man kann nur mit einer angemessenen Stichprobengröße eine präzise und genaue Schlussfolgerung ziehen. Eine kleinere Stichprobe führt zu einem Ergebnis, das möglicherweise nicht ausreichend ist, um einen Unterschied zwischen den Gruppen festzustellen, und die Studie kann sich als falsch negativ erweisen, was zu einem Fehler vom Typ II führt. Eine Studie mit einer kleinen Stichprobe ist aus offensichtlichen Gründen recht verlockend, aber sie ist eine Verschwendung von Zeit und Geld, da das Ergebnis unweigerlich nicht schlüssig sein wird. Sehr oft wird eine kleine Stichprobengröße willkürlich auf der Grundlage der Bequemlichkeit der Forscher, der verfügbaren Zeit und der Ressourcen festgelegt, was zu einer Null-Studie aufgrund einer unzureichenden Anzahl von untersuchten Personen führt. Moher et al. wiesen in der Literatur auf das Ausmaß von Studien hin, bei denen die Stichprobengröße zu gering ist und die zu Nullversuchen führen. In einer Studie stellten sie fest, dass von 102 Null-Studien nur 36 % eine Aussagekraft von 80 % hatten, um einen relativen Unterschied von 50 % zwischen den Gruppen festzustellen. Nur bei seltenen Krankheiten oder Indikationen ist eine Studie mit zu geringer Aussagekraft aus logistischen Gründen gerechtfertigt, da die Daten aus einer solchen Studie bei der Meta-Analyse hilfreich sind.

Eine sehr große Stichprobengröße wird ebenfalls nicht empfohlen, da sie ihre eigenen Konsequenzen hat. Erstens ist es eine Verschwendung der begrenzten verfügbaren Ressourcen in Form von Zeit und Geld, wenn eine Antwort mit einer kleineren Stichprobe genau gefunden werden kann. Zweitens kann die Rekrutierung von mehr Probanden als erforderlich auch als unethisch bezeichnet werden, da die Patienten an einer Studie mit Vertrauen und einem altruistischen Motiv teilnehmen, das nicht missbraucht werden sollte. Drittens wird in randomisierten kontrollierten Studien mehr Menschen eine bessere Behandlung vorenthalten und sie erhalten ein Placebo oder eine minderwertige Behandlung mit den damit verbundenen Nebenwirkungen oder Toxizitäten aufgrund des inhärenten Designs der Studie. Diese triftigen Gründe reichen aus, um eine ordnungsgemäße Schätzung des Stichprobenumfangs vor Beginn einer Studie zu rechtfertigen.

Auch wenn die Berechnung des Stichprobenumfangs je nach Art des Studiendesigns variieren kann, bleibt das Grundkonzept dasselbe. Die drei Hauptfaktoren, die berücksichtigt werden müssen, sind der α-Fehler, der β-Fehler und der klinisch signifikante Unterschied oder die Effektgröße. Der Fehler vom Typ I oder α-Fehler bedeutet, dass die Nullhypothese nicht akzeptiert wird, obwohl sie tatsächlich wahr ist. Normalerweise wird er auf 5 % festgelegt. Wenn dieser Wert gesenkt werden soll, muss die Stichprobengröße erhöht werden. Fehler vom Typ II oder β-Fehler bedeutet, dass die Nullhypothese nicht zurückgewiesen wird, wenn sie nicht wahr ist. Er kann vereinbarungsgemäß auf 20%, 10% oder 5% festgelegt werden. Die Aussagekraft einer Studie ist gleich 1 Typ-II-Fehler; daher sollte jede Studie eine Aussagekraft von mindestens 80 % haben. Die Stichprobengröße erhöht sich, wenn die Aussagekraft der Studie von 80 % auf 90 % oder 95 % erhöht wird. Der dritte Faktor ist die Effektgröße. Ein kleiner klinisch signifikanter Unterschied ist schwer zu erkennen und erfordert einen größeren Stichprobenumfang als eine Studie mit einem größeren klinisch signifikanten Unterschied. Weitere Faktoren, die berücksichtigt werden müssen, sind die Standardabweichung bei quantitativen Messungen, die Fehlermarge und die Abbruchrate. Diese Werte sind entweder aus der Literatur bekannt oder können durch eine Pilotstudie oder durch vernünftige Schätzungen ermittelt werden. Die Zahl, die wir nach diesen Berechnungen erhalten, ist keine genaue Zahl, sondern ein ungefährer Richtwert für den Stichprobenumfang. Manchmal muss der so berechnete Stichprobenumfang an die Machbarkeit angepasst werden, z. B. an die finanziellen Mittel, die Dauer der Studie und die verfügbaren Probanden. Die Stichprobengröße sollte sich jedoch nicht wesentlich ändern. Die Grundlage für die in einer bestimmten Studie gewählte Stichprobengröße muss im Abschnitt „Materialien und Methoden“ der Arbeit angegeben werden, damit die Leser davon profitieren können. Moher et al. stellten 1994 fest, dass nur 32 % der Null-Studien die Berechnung des Stichprobenumfangs in den veröffentlichten Arbeiten angaben. Die Herausgeber legen nun besonderen Wert auf die Angabe der Grundlage für die Berechnung des Stichprobenumfangs in veröffentlichten Arbeiten. Eine weitere Diskussion über die Grundsätze der Stichprobenberechnung würde den Rahmen dieses Editorials sprengen. Die beiden Artikel von Malhotra et al. und Gogate in dieser Ausgabe des Indian Journal of Ophthalmology sowie einige andere wichtige Artikel werden jedoch weitere Einblicke in das Verständnis der Berechnung des Stichprobenumfangs geben.

Jeder größere Fehler bei der Berechnung des Stichprobenumfangs beeinträchtigt die Aussagekraft und den Wert einer Studie. „Zu den häufigen Fehlern bei der Berechnung des Stichprobenumfangs gehören, dass keine Berechnungen durchgeführt werden, dass unrealistische Annahmen getroffen werden, dass mögliche Verluste während der Studie nicht berücksichtigt werden und dass der Stichprobenumfang nicht über eine Reihe von Annahmen hinweg untersucht wird. Zu den Gründen für Studien mit unzureichendem Umfang, die keine statistische Signifikanz erreichen, gehören die Nichtdurchführung von Berechnungen des Stichprobenumfangs, die Auswahl des Stichprobenumfangs nach dem Zufallsprinzip, die unzureichende Finanzierung des Projekts und die unzureichende Nutzung der verfügbaren Mittel.“

Zusammenfassend lässt sich sagen, dass die Berechnung des Stichprobenumfangs ein sehr wichtiger Aspekt einer jeden Studie ist. Sie sollte zum Zeitpunkt der Planung einer Studie auf der Grundlage der Art der Forschungsfrage und des Studiendesigns vorgenommen werden. Es ist ratsam, auch in dieser Phase der Studie die Hilfe eines Statistikers in Anspruch zu nehmen. Die Autoren müssen bei der Veröffentlichung ihrer Arbeiten detaillierte Angaben zur Berechnung des Stichprobenumfangs machen. Viele Null-Studien können aufgrund eines geringeren Stichprobenumfangs zu schwach sein, um den gewünschten Unterschied festzustellen. Diese Studien sollten mit Vorsicht interpretiert werden, und das „Fehlen von Beweisen“ in diesen Studien sollte nicht als „Beweis für das Fehlen von Beweisen“ angesehen werden.