目标样本量计算器是一个强大的工具,用于确定您的研究或实验所需的样本量。它可以帮助您在收集足够的数据以得出具有统计意义的结论和最大限度地减少影响之间取得平衡 次、所需的努力和资源。有了正确的样本量,无论您是比较两组、测试新产品的有效性还是进行科学研究,您都可以自信地从数据中获取见解。
目标样本量计算器公式
使用目标样本量计算器计算所需样本量(n)的公式如下:
n = (2 * σ² * (Zα + Zβ)²) / Δ²
地点:
- n 是每组(A 和 B)所需的样本量。
- σ 是您正在测量的指标的估计标准偏差。
- Zα 是与您选择的显着性水平 (α) 相对应的标准正态分布的临界值。
- Zβ 是与所需功效 (1 - β) 相对应的标准正态分布的临界值。
- Δ 是最小可检测效应大小,这是您希望能够检测为具有统计显着性的指标中的最小差异。
让我们通过一个例子来了解如何计算双样本的样本量 A / B测试 使用提供的公式。
目标样本量计算器示例
想象一下,您正在运行 A/B 测试,以确定更改电子商务网站上“立即购买”按钮的颜色是否会带来更高的转化率。您想要测试新颜色(版本 B)是否优于当前颜色(版本 A)。以下是计算的详细信息:
- 估计标准差 (σ):您估计转化率的标准差为 0.1。
- 显着性水平 (α):您选择 95% 的置信水平,因此 α = 0.05。
- 幂 (1 - β):您需要 0.80 的幂,因此 β = 0.20。
- 最小可检测效应大小 (Δ):您希望能够检测到转化率 5% 的相对增长具有统计显着性。
现在,让我们将这些值代入公式中:
n = (2 * (0.1)² * (Zα + Zβ)²) / (0.05)²
95% 置信水平 (α = 0.05) 的 Zα 约为 1.96,幂为 0.80 (β = 0.20) 的 Zβ 约为 0.84。
n = (2 * (0.01) * (1.96 + 0.84)²) / (0.0025)
现在,计算范围内的值 括弧:
n = (2 * 0.01 * (2.80)²) / 0.0025 n = (0.02 * 7.84) / 0.0025 n ≈ 15.68 / 0.0025 n ≈ 6272
因此,您需要每组(A 和 B)中有大约 6272 个用户的样本量来运行 A/B 测试,置信度为 95%,功效为 0.80,并且能够检测到 5% 的相对增加转化率具有统计显着性。
样本量表
为了让您的生活更轻松,下面列出了各种置信水平和功效值的常用样本大小:
置信度 (α) | 功率 (1 - β) | 所需样本量 (n) |
---|---|---|
90% | 0.10 | |
90% | 0.20 | |
95% | 0.10 | |
95% | 0.20 | |
99% | 0.10 | |
99% | 0.20 |
只需插入 σ 和 Δ 值即可估算特定场景所需的样本量。
最常见的常见问题解答
A1: 显着性水平 (α) 表示出现第一类错误的概率,即在不存在显着影响的情况下错误地得出存在显着影响的结论的可能性。 α 的常见值为 0.05 (5%) 和 0.01 (1%)。
A2: 功效 (1 - β) 是在显着效应确实存在时正确检测到显着效应的概率。它量化了您的研究找到有意义结果的能力。通常需要较高的功率值(例如,0.80)。
A3: 您可以根据您所在领域的先前数据或研究来估计 σ。如果您没有历史数据,您可能需要进行试点研究来估计 σ。