サンプルサイズ計算の関連性を理解する | Digital Travel
研究は、特定の医療問題(順番に研究質問として定式化)に対する解決策を見つけるために、統計に基づいて行われます。 理想的には、全人口を調査する必要がありますが、これはほとんど不可能です。 国勢調査は人口一人一人を対象に行われますが、それ以外の研究は、「標本集団」と呼ばれる対象者の中から選ばれた限られた人を対象として行われます。 得られたデータは分析され、結論が導き出され、それが研究対象の集団に外挿されるのである。 この論説の目的は、研究を始める前に行うべきサンプルサイズ計算の必要性と重要性を強調することである
サンプルサイズ計算の重要性は強調しすぎることはない。 研究は、さまざまな目的のために実施することができます。 例えば、2つの治療レジメンの有益な効果、副作用、危険因子などの事前定義されたパラメータの違いを確立するために行われることがある。 また、グループ間の類似性を証明するために行われることもある。 時には、ある疾患の有病率など、母集団におけるある種の推定を達成することを目的とする場合もある。 どのような目的であれ、適切なサンプルサイズがあって初めて正確な結論を導き出すことができるのです。 標本数が少ないと、群間の差を検出するのに十分な検出力が得られず、偽陰性になる可能性があり、第二種の過誤につながる。 小さなサンプルでの研究は、明らかな理由から非常に魅力的ですが、結果は必ず結論に至らないため、時間とお金の無駄です。 研究者の都合、利用可能な時間、資源に基づいて小さなサンプルサイズが恣意的に決定されることが非常に多く、研究対象者の数が不十分であるために無効な試験となる。 Moherらは、文献上、無効試験に至るパワー不足の研究の大きさを強調しています。 ある研究では、102の無効試験のうち、群間相対差50%を検出する検出力が80%あったのは36%のみであったという。 稀な疾患や適応症の場合のみ、そのような試験からのデータはメタアナリシスで役立つため、ロジスティクスの観点から検出力不足な試験が正当化されます
非常に大きなサンプルサイズも、それ自身の結果をもたらすため推奨されません。 第一に、より少ないサンプルから正確に答えを見つけることができるのに、時間とお金という限られた利用可能なリソースを浪費することになる。 第二に、必要以上の被験者を集めることは、非倫理的と見なされます。なぜなら、患者は信頼と利他的な動機で研究に参加しており、それを誤って利用してはならないからです。 第三に、無作為化比較試験において、より良い治療法を受けられず、プラセボやそれに伴う副作用や毒性を伴う劣悪な治療法を受けることになる人が増えることである。 これらの正当な理由は、あらゆる研究の開始前に適切なサンプルサイズの推定を正当化するのに十分です。
サンプルサイズの計算は研究デザインの種類によって異なるかもしれませんが、基本的な概念は同じままです。 考慮すべき3つの主な要因は、α-誤差、β-誤差、臨床的に有意な差または効果量です。 タイプIエラーまたはαエラーとは、帰無仮説が実際には真であるにもかかわらず、それを受け入れることができないことである。 通常、5%に設定される。 この値を下げたい場合は、サンプルサイズを大きくする必要がある。 第2種過誤またはβ-過誤とは、帰無仮説が真でないときに、それを棄却できないことである。 慣例的に、20%、10%、5%のいずれかに設定される。 研究の検出力は、II型誤差の1に等しいので、どのような研究でも少なくとも80%の検出力が必要である。 検出力が80%から90%、95%に上がるとサンプルサイズは大きくなります。 第三の要因は効果量である。 臨床的に有意な差が小さいと同定が難しく、臨床的に有意な差が大きい研究に比べ、より大きなサンプルサイズが必要となります。 その他に考慮しなければならないのは、量的測定の標準偏差、誤差、消耗率などである。 これらの値は、文献から知るか、パイロットスタディや合理的な推測によって決定することができます。 これらの計算の結果得られた数値は、正確な数値ではなく、サンプルサイズのおおよその目安になります。 このようにして算出されたサンプルサイズは、資金、研究期間、利用可能な被験者などの実現可能性を考慮して調整する必要がある場合もあります。 しかし、このようなカウントでサンプルサイズが大きくずれることはないはずです。 特定の研究で選択されたサンプルサイズの根拠は、読者のために、論文の「材料と方法」のセクションで提供されなければなりません。 Moherらは、1994年に、わずか32%の無効な試験が、発表された論文でサンプルサイズの計算を報告していることを発見しました。 現在、編集者は、発表論文におけるサンプルサイズ計算の根拠を報告することにこだわっている。 サンプルサイズ計算の原理についてこれ以上議論することは、この論説の範囲外である。 しかし、本号のIndian Journal of Ophthalmologyに掲載されたMalhotraらとGogateの2つの論文、およびその他の主要な論文は、サンプルサイズ計算の理解においてさらなる洞察を与えてくれるでしょう。 “よくあるサンプルサイズのミスには、計算を行わない、非現実的な仮定をする、研究中の潜在的な損失を考慮しない、様々な仮定にわたってサンプルサイズを調査しない、などがあります。 統計的有意性を達成できない不十分なサイズの研究の理由には、サンプルサイズの計算を行わなかったこと、利便性に基づいてサンプルサイズを選択したこと、プロジェクトに十分な資金を確保できなかったこと、利用可能な資金を効率的に使用しなかったことなどがあります」
結論として、サンプルサイズの計算はあらゆる研究において非常に重要であると言えます。 これは、研究課題の種類や研究デザインに基づいて、研究を計画する際に行う必要があります。 この段階でも、統計学者の助けを借りることが望ましい。 著者は論文を発表する際に、使用したサンプルサイズの計算に関する詳細な情報を提供する必要があります。 多くのヌル研究は、サンプルサイズが小さいため、目的の差を検出するための検出力が不足している可能性があります。 検出力不足の研究は慎重に解釈すべきであり、これらの研究における「証拠がない」ことを「証拠がないことの証拠」と受け止めるべきではない
。