四、计算题
1.某班学生统计学期末考试成绩数据如表3-1所示。
表3-1 某班同学统计学期末考试成绩表
(1)绘制频数分布直方图;
(2)填制累积频数分布表;
(3)绘制累积频数分布图;
(4)计算均值、方差及标准差。[东北财经大学2012研]
解:(1)绘制的频数分布直方图如图3-1所示。
图3-1 某班学生统计学期末考试成绩频数分布图
(2)完整的累积频数分布表如表3-2所示。
表3-2 某班学生统计学期末考试成绩频数分布表
(3)累积频数分布图如图3-2及图3-3所示。
图3-2 某班学生统计学期末考试成绩向上累积频数分布图
图3-3 某班学生统计学期末考试成绩向下累积频数分布图
(4)均值计算过程如表3-3所示。
表3-3 某班学生统计学期末考试成绩平均数计算表
由表3-3及均值计算公式可得,
方差计算过程如表3-4所示。
表3-4 某班学生统计学期末考试成绩方差计算表
由表3-4和方差计算公式可得
标准差
2.某位职员每天上班有两种方法:公共交通和自己开车。每种方法所需的时间记录的样本数据如表3-5所示。时间以分钟为单位。
表3-5
(1)哪种方法更好?试解释之。
(2)画出每种方法的箱图。两个箱图的比较结果是否支持你的结论?[中央财大2004研]
解:(1)公共交通所需时间的平均数与标准差分别为:
自己开车所需时间的平均数与标准差分别为:
两种上班方式所需时间的平均数相等。但是自己开车所需时间的标准差比公共交通所需时间的标准差小,即自己开车比公共交通所需时间的离散程度较小。所以选择自己开车上班较为合理。
(2)将公共交通所需时间从小到大进行排序:25,28,29,29,32,32,33,34,37,41,则最大值为41;最小值为25;中位数=(32+32)/2=32;下四分位数的位置=(10+1)/4=2.75,故下四分位数=28×0.25+29×0.75=28.75;上四分位数的位置=3×(10+1)/4=8.25,故上四分位数=34×0.75+37×0.25=34.75。
同理可得,自己开车所需时间的最大值为35,最小值为29,中位数为32,下四分位数为30.75,上四分位数为33.25。则两种上班方式所需时间的箱图如图3-4所示。
图3-4 箱图
由箱图可以看出,上班时采取公共交通和自己开车所需时间的中位数是相同的,从其离散程度来看,自己开车上班所需时间比较集中(箱子较短),而采取公共交通的上班时间则比较分散。从分布形状上看,自己开车上班所需的时间大体上为对称分布(中位数在箱子的中间位置)。
3.某家商场为了了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1:初中,2:高中或中专,3:大专,4:本科及以上。调查结果如表3-6所示。
表3-6
(1)上表中的数据属于什么类型?
(2)制作一张频数分布表。
(3)绘制一张条形图,反映顾客的学历分布。
解:(1)表中的数据属于顺序数据。
(2)制作频数分布表,如表3-7所示。
表3-7 频数分布表
(3)绘制条形图,如图3-5所示。
图3-5 条形图
4.已知一组15名工人的资料,如表3-8所示。
表3-8
要求:
(1)按照性别、文化程度和技术级别分别对数据进行分组。
(2)以组距为10岁,20岁以下、60岁以上各为一组,编制频数分布表。
解:(1)按照性别进行分组,如表3-9所示。
表3-9
按照文化程度进行分组,如表3-10所示。
表3-10
按技术等级进行分组,如表3-11所示。
表3-11
(2)按年龄编制频数分布表,如表3-12所示。
表3-12
5.抽样调查某地区50户居民的月消费品支出额数据资料,如表3-13所示(单位:元)。
表3-13
要求:
(1)试根据上述资料编制频数分布表。
(2)编制向上和向下累积频数、频率分布表。
解:(1)编制频数分布和频率分布表,如表3-14所示。
表3-14 居民户月消费品支出额频数分布和频率分布表
(2)编制向上累积和向下累积频数以及频率分布表,如表3-15、3-16所示。
表3-15 居民户月消费品支出额向上累积表
表3-16 居民户月消费品支出额向下累积表
6.抽样调查某省50户城镇居民平均每人全年可支配收入资料,如表3-17所示。
表3-17 居民年人均可支配收入
要求:
(1)试根据上述资料编制频数分布表;
(2)根据所编制的频数分布表绘制直方图。
解:(1)由题中数据可得频数分布表,如表3-18所示。
表3-18 频数分布表
(2)利用Excel可绘制直方图,如图3-6所示。
图3-6