当前位置: 首页 » 行业资讯 » 热点 » 正文

总体和样本

32023-09-30 11:00:18

现实生活中有太多的现象都可以用正态分布来表示,如成年人的身高分布,正态曲线中间高两边低,大部分是中等身高,像姚明这种身高极其少。为什么会有这种现象,中心极限定理阐述了其中的原因,该定理是统计学最专业部分的开端,说它是统计学的灵魂并不为过。总体和样本作为一家饮料公司的老板,为了能生产出让每个客户都满意

标签: sdf

现实生活中有太多的现象都可以用正态分布来表示,如成年人的身高分布,正态曲线中间高两边低,大部分是中等身高,像姚明这种身高极其少。为什么会有这种现象,中心极限定理阐述了其中的原因,该定理是统计学最专业部分的开端,说它是统计学的灵魂并不为过。

总体和样本

作为一家饮料公司的老板,为了能生产出让每个客户都满意的饮料,肯定会很渴望知道每一个客户的口味偏好。但是,客户数量非常庞大,需要花费大量的金钱和时间来做全员调查研究,这是不现实的。所以,从客户群体中选择一部分具有代表性的消费者作为样本,对样本人群的口味进行调研,是更合适的方法。

无论是科学家还是企业家,在研究问题时,都存在时间和金钱的限制,所以最好的办法是从研究对象中选取一部分来进行研究。研究对象的整个群体称为总体,从中选取的一部分称为样本,如图 8-1 所示。

图8-1样本和总体

抽样

从整体中选取样本的过程称为抽样。抽样的目的是研究对象总体的特征,如果希望推断的结果更加准确,抽取的样本就应该尽量和总体的特征相近。统计学发展到今天,有很多抽样设计方法,本节介绍应用最为广泛的随机抽样方法。其意义是,在选取样本时,能保证总体中的每个个体都有同样的机会被选中。

作为饮料公司的调研员,希望用简单的随机抽样方法去调研目标人群的口味喜好,可能尝试过如下选取规则。

1. 周末在超市门口无规则地选取一部分人做访谈。这样的方法会让那些只进行网购不进超市的人群永远没有机会得到访谈,这个样本的限制条件是愿意走入实体超市的人群,而真实的总体是实体店和网店的全部顾客。

2. 运用扫码技术进行有奖征集,在饮料瓶上印刷二维码,顾客扫码后填写调查问卷。这个方法会遗漏潜在客户,没买过该品牌饮料的客户没有机会接受调研,同时这个方法也会遗漏对奖品不感兴趣的客户,这个样本的限制条件是对奖品感兴趣的老客户,无法观察到总体的特征。

3. 在所有的大型综合性网站投放调查问卷,由于信息不对称和投放经费限制,不可能在所有网站全部投放,那么喜欢上垂直细分类网站的客户会被遗漏,同样综合性网站中也不是每个人都能看到调查问卷。最后这个样本的限制条件是经常登录综合性网站且被广告投放送达的人。

在现实世界中,完美的随机抽样是很难找到的,总会有一些原因造成样本和总体之间的偏差,这就是抽样误差。抽样误差越大,对总体的判断就越不准确。抽样误差越小,对总体的判断就越精确。

幸运的是,随着信息科技的发展,有很多工具可以用来进行随机抽样,只要能用计算机存储的总体数据就可以进行随机抽样。下面介绍用 Excel 对总体进行随机抽样的方法。

用Excel进行抽样

某银行给 150 个客户发放个人贷款,贷款发放后的 3 个月,银行要对这一批客户计算逾期率,并且要核查逾贷款期率与个人征信分数是否相关。所有客户的个人征信分如图8-2所示。

图 8-2 150 个贷款客户的个人征信分

现在需要从 150 个客户中随机抽取 30 个客户,用 Excel 来实现随机抽样,步骤如下。

步 骤 1单击【数据】→【数据分析】按钮,打开【数据分析】对话框。

步 骤 2在【数据分析】对话框的【分析工具】列表框中选择【抽样】选项,单击【确定】按钮,打开【抽样】对话框。

步 骤 3在【抽样】对话框中设置相关参数。

(1)单击【输入区域】编辑框右侧的折叠按钮,选择总体数据所在的 A2:C151 单元格区域。

注意: Excel 的抽样工具只能做数值抽样,因此抽样范围应选取客户编号而不是客户姓名。也不可以对征信分抽样,一个征信分可能对应多个客户,只有客户编号才是和客户一一对应的。

(2)在【抽样方法】选项区域中选中【随机】单选按钮,并将【样本数】设置为 30。

(3)在【输出选项】选项区域中选中【输出区域】单选按钮,然后单击右侧的折叠按钮,选择要存放结果的单元格(如 E2)。最后单击【确定】按钮关闭对话框,如图 8-3 所示。

图 8-3 抽样设置

从散点图中可以直观看出变量之间的关系,如图 7-61 所示。如果所有点之间的关系可以近似地表现为一条直线,那么就称为数据线性相关。

在 F2 单元格输入以下公式,并向下向右复制填充到 F3:G31 单元格区域,补全客户信息,如图 8-4 所示。

=VLOOKUP($E2,$A:$C,COLUMN()-4,0)

图 8-4 随机抽样结果

免责声明:本网转载合作媒体、机构或其他网站的公开信息,并不意味着赞同其观点或证实其内容的真实性,信息仅供参考,不作为交易和服务的根据。转载文章版权归原作者所有,如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。联系本站网管,谢谢。

合作