A 集群样本大小计算器 是一个用于 统计 确定集群抽样设计所需的样本数量。集群抽样通常用于进行简单随机抽样不切实际或成本太高的情况,尤其是在大群体中。与直接选择个体不同,集群抽样 人口 将其分为组(或集群),然后选择集群样本。这种抽样方式经常用于教育、医疗保健、社会科学和市场研究等领域。
集群样本大小计算器可帮助研究人员在给定所需的置信水平、误差幅度和估计的人口比例的情况下确定适当的集群数量和集群内的个体数量,以获得可靠且统计有效的结果。
聚类样本量计算器公式
整群抽样的样本量可以使用以下公式计算:
*n = (Z² * p * (1-p) * (1 + (m-1)ICC)) / (d²)
地点:
- n:所需样本总量。
- Z:与所需置信水平相对应的 Z 分数(例如,1.96% 置信度为 95)。
- p:具有感兴趣特征的人口估计比例。
- (1-p):p 的补数,或者不包含感兴趣特征的比例。
- m:平均簇大小(每个簇内的个体数量)。
- 国际刑事法院:聚类内相关系数,衡量同一聚类内个体的相似程度。
- d:估计中所需的误差幅度或精度。
该公式考虑了数据的聚类结构,并确保计算出的样本量保持统计 功率 对于研究是必要的。
常见采样场景的预先计算表
下表说明了不同因素如何影响集群抽样所需的样本量。该表可帮助用户了解不同置信水平、人口比例和误差幅度对样本量计算的影响。
置信度 | 比例(p) | 平均簇大小 (m) | ICC(集群内相关性) | 误差幅度(d) | 样本量 (n) |
---|---|---|---|---|---|
95%(Z=1.96) | 0.50 | 30 | 0.05 | 0.05 | 384 |
95%(Z=1.96) | 0.30 | 25 | 0.10 | 0.05 | 357 |
99%(Z=2.58) | 0.70 | 20 | 0.02 | 0.01 | 1386 |
90%(Z=1.64) | 0.60 | 40 | 0.15 | 0.03 | 411 |
95%(Z=1.96) | 0.80 | 50 | 0.08 | 0.04 | 210 |
该表可以帮助您估计人口比例、聚类大小和 ICC 的变化如何影响获得可靠结果所需的样本量。
集群样本大小计算器示例
让我们考虑一个研究人员进行学校表现研究的例子。研究人员计划使用整群抽样方法并估计以下参数:
- Z=1.96 (置信度为 95%)
- p = 0.60 (预计通过考试的学生比例)
- 米 = 25 (每所学校或每组学生的平均人数)
- ICC = 0.05 (因为同一所学校的学生表现往往相似)
- d = 0.05 (期望的误差幅度)
利用整群抽样的公式,我们可以计算出所需的样本量:
n = (3.8416 * 0.24 * 2.2) / 0.0025
n = 2.0337 / 0.0025 ≈ 813.48
因此,研究人员大约需要 814集群 (学校)在指定的误差范围和置信水平内取得具有统计意义的结果。
最常见的常见问题解答
这款 聚类内相关系数 (ICC) 测量同一簇内个体之间的相似度。ICC 越高,表示同一簇内的个体越相似,这意味着可能需要更少的簇才能获得可靠的结果。相反,ICC 越低,表示簇内的变异性越大,需要更大的样本量才能确保结果准确。
这款 平均簇大小 (m) 显著影响所需样本量。较大的平均簇大小(每个簇的个体数较多)通常会减少所需的簇总数。但是,如果 ICC 较高,则较大的簇也可能会增加维持统计功效所需的样本量。
这款 信心水平 表示您希望样本准确代表总体的程度。更高的置信度(例如 99% 而不是 95%)会增加 Z 分数,从而增加样本量。这确保了更高的可靠性,但代价是需要更多样本才能达到相同的误差幅度。