队列研究样本量计算器是一种工具,用于确定每组(暴露组和未暴露组)所需的参与者人数,以检测出各组结果在统计上的显著差异。准确的样本量计算对于确保研究具有足够的能力来识别有意义的差异至关重要,同时还可以避免不必要的招募工作或资源支出。该计算器对于设计流行病学、公共卫生等领域的队列研究的研究人员特别有用 临床 研究。它属于 统计和研究规划工具类别.
队列研究样本量计算器公式
队列研究所需的样本量使用以下公式计算:
地点:
- n 是每组(暴露或未暴露)所需的样本量。
- Zα 是与所选显著性水平相对应的 Z 分数(α).
- Zβ 是与所需功率相对应的 Z 分数(1 – β).
- p1 是暴露组中结果的比例。
- p2 是未暴露组的结果比例。
- p1 – p2 是比例的绝对差异(效果大小)。
变量的详细公式:
显著性水平(Zα):
Zα=φ⁻¹(1-α/2)
其中 φ⁻¹ 是标准正态分布的倒数。
功率(Zβ):
Zβ = Φ⁻¹(功率)
其中 功率 = 1 – β.
比例(p1 和 p2):
这些代表根据先前的研究或假设估计的暴露组和未暴露组的结果比例。
规模效应:
效果大小 = p1 – p2
总样本量:
如果各组大小相等:
总 N = 2 × n
如果组数不相等,则使用比率进行调整(r) 从未暴露到暴露:
- n1 = n
- n2=r×n
- 总 N = n1 + n2
样本量估计的预先计算表
下面是队列研究中常见场景所需样本量的参考表:
显着性水平 (α) | 功率 (1 – β) | 效果大小 (p1 – p2) | 每组样本量 (n) | 总样本量 (N) |
---|---|---|---|---|
0.05 | 0.80 | 0.10 | 385 | 770 |
0.05 | 0.90 | 0.10 | 506 | 1,012 |
0.05 | 0.80 | 0.20 | 97 | 194 |
0.01 | 0.80 | 0.15 | 175 | 350 |
0.01 | 0.95 | 0.10 | 614 | 1,228 |
该表简化了具有常见统计阈值和效应大小的研究规划。
队列研究样本量计算器示例
假设研究人员正在设计一项队列研究来评估风险因素与结果之间的关联:
- 暴露组的结果比例(p1)= 0.30。
- 未暴露组的结果比例(p2)= 0.20。
- 期望显著性水平(α)= 0.05。
- 所需功率(1 – β)= 0.80。
步骤 1:计算 Z 分数
Zα = Φ⁻1(2 – α/0.975) = Φ⁻1.96(XNUMX) ≈ XNUMX
Zβ = Φ⁻0.80(幂) = Φ⁻0.84(XNUMX) ≈ XNUMX
步骤 2:计算效果大小
效果大小 = p1 – p2 = 0.30 – 0.20 = 0.10
第 3 步:计算方差项
- 方差 对于暴露组: p1(1 – p1) = 0.30 × (1 – 0.30) = 0.21
- 未暴露组的方差: p2(1 – p2) = 0.20 × (1 – 0.20) = 0.16
步骤 4:将值代入公式
n = [(1.96 + 0.84)² × (0.21 + 0.16)] / (0.10)²
n ≈ [7.84 × 0.37] / 0.01 = 2,900 / 0.01 ≈ 385
步骤 5:计算样本总量
对于相等的组大小:
总计 N = 2 × n = 2 × 385 = 770 名参与者
该结果表明,该研究需要每组 385 名参与者,总共 770 名,才能达到所需的功效和显著性水平。
最常见的常见问题解答
样本量计算确保研究具有足够的能力来检测组间有意义的差异,从而避免研究能力不足和资源使用效率低下。
主要 因素包括重要性水平 (α)、期望功效 (1 - β)、效应大小 (p1 - p2) 以及结果的变化 (比例 p1 和 p2)。
是的,可以通过引入未接触参与者与接触参与者的比率 (r) 来调整公式,以解决不平等的群体规模问题。