この 有効サンプルサイズ計算機 は、 統計 研究デザイン。特にデータポイントが独立していない、あるいは同一に分布していない場合に、データセット内の観測値が推定値の精度に実際にどれだけ寄与しているかを研究者が理解するのに役立ちます。
これは次のような分野では不可欠です。 臨床 試行、世論調査、実験計画、ベイズ統計など。計算機は、クラスタリングや重み付けといったデータ構造の影響を反映して実際のサンプルサイズを調整し、正確な結論とより妥当な信頼区間を保証します。
このツールは、 統計・研究用計算機.
有効サンプルサイズ計算の式
有効なサンプル サイズには状況に応じてさまざまな計算式がありますが、調査やクラスター化されたデータで最も広く使用されているのは次の式です。
n_eff = n / (1 + (n – 1) * ρ)
どこ:
- n_eff = 有効サンプルサイズ(調整サンプルサイズ)
- n = 実際のサンプルサイズ(観察数または回答者数)
- ρ = クラス内相関係数(ICC)またはデザイン効果(クラスター内の類似性の尺度)
ベイズ統計、特に MCMC (マルコフ連鎖モンテカルロ) では、式は次のようになります。
n_eff = N / (1 + 2 * Σρ_k)
どこ:
- N = サンプルの総数
- ρ_k = ラグkにおける自己相関
このバージョンでは、連続するサンプル間の相関関係を考慮した後、データに含まれる独立したサンプルの数を推定します。
クイックリファレンス用の一般用語表
契約期間 | 意味 | いつ使用するか |
---|---|---|
n_eff | 有効サンプルサイズ | レポートや統計的有意性の解釈に使用する |
n | 生のサンプルサイズまたは実際のサンプルサイズ | 収集された回答またはデータポイントの総数 |
ρ | クラス内相関係数または設計効果 | クラスター化または層別化されたデータを分析するときに使用します |
N | MCMC抽出の総数(ベイズ設定) | シミュレーションの出力を分析するときに使用します |
Σρ_k | 異なるラグにおける自己相関の合計 | 繰り返しの相関関係を補正するために使用する 測定結果 またはシミュレーション |
有効サンプルサイズ計算の例
800 人の回答者を対象に調査を実施したが、クラスタリング (同じ世帯の複数の人を調査するなど) により、ICC が 0.05 と推定されたとします。
式の使用:
n_eff = 800 / (1 + 799 * 0.05)
n_eff = 800 / (1 + 39.95) ≈ 19.54
したがって、800 人が回答したとしても、クラスタリングを考慮すると有効なサンプル サイズは約 20 のみとなり、推定値の精度に大幅な影響を及ぼします。
最も一般的な FAQ
データが統計にどれだけ貢献しているかを判断するのに役立ちます 電力特にデータ ポイントが関連していたり依存していたりする場合は、これが当てはまります。
データに繰り返し測定、クラスター(学校や病院など)、または観測が独立していないシミュレーションが含まれる場合に使用します。
可能ですが、結果の信頼区間が広くなり、統計的検出力が低下します。独立した観察数を増やすか、研究デザインを調整した方が良いでしょう。