目录:
为了估计人口,统计学家使用代表人口的随机样本。例如,如果你对50名随机美国女性进行称重,你可以根据她们的平均体重估算所有美国女性的体重。当样本结果偏离真实总体值时,会发生采样错误。也就是说,如果你的50名女性在平均体重为150磅时平均体重为135磅,那么你的抽样误差是-15(观察到的实际减去),这意味着你低估了15分的真实值。由于真实值很少知道,因此统计学家使用其他估计值(如标准误差和置信区间)来估计抽样误差。
步
计算您测量的百分比。例如,如果您想知道某个学校吸烟的学生比例是多少,那么随机抽取样本(比方说n,我们的样本量等于30),让他们填写匿名调查并计算百分比说吸烟的学生。为了便于说明,让我们说六名学生说他们吸烟了。然后吸烟的百分比=(#吸烟者)/(测量的学生总数)x 100%= 6/30 x 100%= 20%。
步
计算标准误差。因为我们不知道吸烟学生的实际百分比,所以我们只能通过计算标准误差来估计抽样误差。在统计中,我们使用比例p而不是百分比进行计算,因此我们将20%转换为一定比例。将20%除以100%,得到p = 0.20。大样本大小的标准误差(SE)= sqrt p x(1 - p)/ n,其中sqrt x表示取x的平方根。在这个例子中,我们得到SE = sqrt 0.2 x(0.8)/ 30 = sqrt 0.00533 …? 0.073。
步
创建置信区间。下限:估计比例 - 1.96 x SE = 0.2 - 1.96(0.073)= 0.0569上限:估计比例+ 1.96 x SE = 0.2 + 1.96(0.073)= 0.343因此我们可以说我们对吸烟者的真实比例有95%的信心学生吸烟的比例介于0.0569和0.343之间,或占百分比,5.69%或34.3%。这种广泛的传播表明存在相当大的采样误差的可能性。
步
测量每个人以计算确切的抽样误差。让学校的所有学生完成匿名调查并计算他们吸烟的学生百分比。假设有800名学生中的120人说他们吸烟,那么我们的百分比是120/800 x 100%= 15%。因此,我们的“抽样误差”=(估计) - (实际)= 20 - 15 = 5.越接近零,我们的估计越好,我们的抽样误差就越小。然而,在现实世界中,您不太可能知道实际值,并且必须依赖SE和置信区间进行解释。