错误发现率 (FDR) 计算器可帮助您估算统计显著结果中出现假阳性的可能性。它广泛应用于同时检验多项假设的科学研究,例如基因表达研究、心理调查或数据科学模型。FDR 并非严格控制任何假阳性的概率(这在大型测试中可能过于苛刻),而是专注于限制 率 错误,使其在当今的研究中实用且被广泛接受。
此工具属于 统计测试和分析计算器 类别。
错误发现率计算器公式
FDR的基本公式:
FDR = 误报/(误报+真实报)
地点:
- 误报(FP):错误地声明为显著的测试数量
- 真正例(TP):正确识别的显著结果的数量
FDR 百分比:
预测错误率 (%) = [预测值 / (预测值 + 预测收益)] × 100
Benjamini–Hochberg 手术(用于多个 假设检验):
如果你测试 m 假设并得到排序的 p 值:p₁ ≤ p₂ ≤ ... ≤ pₘ,并且 q 是你的 FDR 阈值(例如 0.05),找到最大的 k 其中:
pₖ≤(k/m)×q
然后拒绝所有小于或等于 pₖ 的 p 值。
当您同时测试多个变量时,此方法可以在发现和对误报的控制之间取得平衡。
参考表:常见场景
真阳性(TP) | 误报 (FP) | FDR(十进制) | 失败率(%) |
---|---|---|---|
90 | 10 | 0.10 | 10% |
50 | 25 | 0.33 | 33% |
100 | 5 | 0.047 | 4.7% |
75 | 15 | 0.167 | 16.7% |
60 | 40 | 0.40 | 40% |
该表可帮助研究人员和分析师快速评估不同发现条件下的预期错误率。
错误发现率计算器示例
假设您进行了一项研究并发现:
- 80 个结果具有统计学意义
- 其中 60 例为确诊病例
- 后来发现其中 20 个是假阳性
使用FDR公式:
FDR = 20 / (20 + 60) = 0.25 或 25%
这意味着您的 1 个重要结果中,有 4 个可能是错误的发现。
使用 Benjamini–Hochberg:
假设你检验了 100 个假设,显著性阈值为 q = 0.05,并对 p 值进行排序。你发现第 12 个最小的 p 值 (p₁₂) 为 0.045。
检查:0.045 ≤ (12 / 100) × 0.05 = 0.006 吗?
不。所以这个 p 值不符合 FDR 条件。
假设第三个 p 值 (p₃) 为 3,且 (0.001/3) × 100 = 0.05。由于 0.0015 ≤ 0.001,因此您可以拒绝前 0.0015 个假设,因为它们具有统计学显著性,且 FDR 低于 3%。
最常见的常见问题解答
FDR 适用于允许少量错误发现的情况,尤其是在基因研究等大规模测试中。FWER 甚至会控制一个错误,这可能过于严格。
是的。FDR 可以在特征选择或测试多个模型参数(涉及多重比较)时提供帮助。
原始方法是围绕 p 值构建的,但其他统计指标(如 q 值或后验概率)可以使该概念适应不同的模型。