–
–
- 有效样本量计算器 是一个有价值的工具,用于 统计 和研究设计。它可以帮助研究人员了解数据集中有多少观测值实际上对其估计的精度有所贡献,尤其是在数据点并非独立或同分布的情况下。
这对于以下领域至关重要: 临床 试验、民意调查、实验设计和贝叶斯统计。计算器会调整实际样本量,以反映数据结构(例如聚类或加权)的影响,从而确保结论的准确性和更有效的置信区间。
此工具属于 统计和研究计算器.
有效样本量计算器公式
根据具体情况,有效样本量有不同的公式,但最广泛用于调查或聚类数据的公式是:
n_eff = n / (1 + (n – 1) * ρ)
地点:
- n_eff = 有效样本量(调整后的样本量)
- n = 实际样本量(观察值或受访者数量)
- ρ = 类内相关系数 (ICC) 或设计效应(衡量聚类内相似性的指标)
在贝叶斯统计中,特别是在 MCMC(马尔可夫链蒙特卡洛)中,公式为:
n_eff = N / (1 + 2 * Σρ_k)
地点:
- N = 样本总数
- ρ = 滞后 k 处的自相关
此版本在考虑连续样本之间的相关性后,估计您的数据值多少个独立样本。
快速参考通用术语表
按揭年数 | 意 | 何时使用 |
---|---|---|
n_eff | 有效样本量 | 在报告中或解释统计意义时使用 |
n | 原始或实际样本大小 | 收集到的响应或数据点的总数 |
ρ | 组内相关系数或设计效应 | 在分析聚类或分层数据时使用 |
N | MCMC 抽取总数(在贝叶斯设置中) | 在分析模拟输出时使用 |
Σρ_k | 不同滞后处的自相关总和 | 用于校正重复的相关性 测量 或模拟 |
有效样本量计算器示例
假设您进行了一项有 800 名受访者的调查,但由于聚类(例如调查来自同一家庭的多个人),ICC 估计为 0.05。
使用公式:
n_eff = 800 / (1 + 799 * 0.05)
n_eff = 800 / (1 + 39.95) ≈ 19.54
因此,即使有 800 人做出回应,考虑到聚类,有效样本量也只有 20 左右,这会极大地影响估计的准确性。
最常见的常见问题解答
计算有效样本量的目的是什么?
它有助于确定你的数据有多少真正有助于统计 功率,尤其是当数据点相关或依赖时。
什么时候应该使用有效样本量而不是实际样本量?
当您的数据涉及重复测量、集群(如学校或医院)或观察结果不独立的模拟时使用它。
如果我的有效样本量较低,我还可以使用常规统计方法吗?
可以,但结果的置信区间会变宽,统计功效也会降低。最好增加独立观察的数量,或者调整研究设计。