这是一篇关于如何计算单次传递的平均值和标准差,不存储任何数据。一旦获得这两个统计数据,您就可以估计置信区间。 95% 的置信区间为[mean - 1.96*stdev, mean + 1.96*stdev]
,假设数据呈正态分布且有大量数据点。
对于较少数量的数据点,您的置信区间为[mean - c(n)*stdev, mean + c(n)*stdev]
where c(n)
取决于您的样本量和置信度。对于 95% 的置信水平,以下是您的值c(n)
for n
= 2, 3, 4, ..., 30
12.70620、4.302653、3.182446、2.776445、2.570582、2.446912、2.364624、2.306004、2.262157、2.228139、2.200985、2.178813、2 .160369、2.144787、2.131450、2.119905、2.109816、2.100922、2.093024、2.085963、2.079614、2.073873、2.068658、2.063899、2.05 9539, 2.055529, 2.051831, 2.048407, 2.045230
这些数字是g(0.025, n-1)
where g
是具有 n 个自由度的 t 分布的逆 CDF。如果您想要 99% 的置信区间,请将 0.025 替换为 0.005。一般来说,对于置信水平1-alpha
, use alpha/2
.
这是R生成上述常量的命令。
n = seq(2, 30); qt(0.025, n-1)
这是一个博客文章解释为什么上面的数字不像您预期的那么接近 1.96。