[经济学]统计学第四版各章练习题答案2009.doc

资源描述

《[经济学]统计学第四版各章练习题答案2009.doc》由会员分享，可在线阅读，更多相关《[经济学]统计学第四版各章练习题答案2009.doc（46页珍藏版）》请在三一文库上搜索。

1、附录1：各章练习题答案第1章统计和统计数据1.1 （1）数值变量。（2）分类变量。（3）数值变量。（4）顺序变量。（5）分类变量。1.2 （1）总体是“所有IT从业者”，样本是“所抽取的1000名IT从业者”，样本量是1000。（2）数值变量。（3）分类变量。1.3 （1）总体是“所有的网上购物者”。（2）分类变量。第2章数据的图表展示2.1 （1）属于顺序数据。数分布表如下：（2）频数分布表如下：服务质量等级评价的频数分布服务质量等级家庭数（频率）频率%A1414B2121C3232D1818E1515合计100100 （3）条形图如下：（4）帕累托图如下：2.2 （1）频数分布表如下

2、：40个企业按产品销售收入分组表按销售收入分组（万元）企业数（个）频率（%）向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0 （2）某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.02.3 频数分布表如下：某百

3、货公司日商品销售额分组表按销售额分组（万元）频数（天）频率（%）2530303535404045455046159610.015.037.522.515.0合计40100.0 直方图如下：2.4 （1）频数分布表如下： 100只灯泡使用寿命非频数分布按使用寿命分组（小时）灯泡个数（只）频率（%）650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100 （2）直方图如下：从直方图可以看出，灯泡使用寿命的分布基本上是对称的。（3）茎叶图如下：65186614

4、5686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147茎叶图与直方图所反映的数据分布是一致的，不同的是茎叶图中保留了原始数据。2.5 （1）食品重量的频数分布表如下：按重量分组频率（包）404224244344467464816485017505210525420545685658105860460623合计100 （2）食品重量的频数分布的直方图如下：（3）从直方图可以看出，食品重量的分布基本上是对称分布。2.6 （1）频数

5、分布表如下：按重量误差分组频数/个10202203033040840507506013607097080680902合计50（2）直方图如下：从直方图可以看出，零件重量误差的分布基本上是对称的。2.7 （1）属于数值型数据。（2）为绘制直方图，首先对数据进行分组，将数据用5作为组距进行分组，得到的频数分布表如下：分组天数（天）-25-206-20-158-15-1010-10-513-50120545107合计60（3）根据分组数据绘制的直方图如下：从直方图可以看出，该城市12月份气温的分布基本上是对称的，温度在-10-5度之间的天数最多。2.8 （1）成人自学考试年龄分布的直方图如下：（2）

6、从直方图可以清楚地看出，成人自学考试人员年龄的分布为右偏，也就是年龄在21岁24岁的人占绝大比例，而年龄在40岁以上的人所占的比例很小。2.9 （1）两个班考试成绩的茎叶图如下：A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003（2）中茎叶图可以看出，A班考试成绩的分布比较集中，且平均分数较高；B班考试成绩的分布比A班分散，且平均成绩较A班低。2.10

7、散点图如下：2.11 （1）对比条形图如下：环形图如下（内环为甲班的成绩）：（2）从对比条形图可以看出，甲班考试成绩在中等水平的人数较多，而优秀和良好的人数则较少，不及格的人数也比乙班要多。乙班则不同，考试成绩为优秀和良好的人数较多，而中等以下的人数则较少。这说明乙班学生的平均成绩比甲班要好。从环形图的百分比中也可以清楚地看出这一点。（3）两个班考试成绩的雷达图如下：从雷达图的形状可以看出，两个班考试成绩没有相似性。2.12 （1）国产车和进口车销售量的对比条形图如下：（2）国产车和进口车销售量的环形图如下：2.13 （1）国内生产总值的线图如下：（2）第一、二、三产业国内生产总值的线图如下：

8、2004年国内生产总值构成的饼图如下：2.14 各城市各月份的平均相对湿度的箱线图如下：从箱线图可以看出，各城市的月平均相对湿度有较大差异。离散程度较大的城市主要是北京和长春（箱子较大）；离散程度较小的是成都、广州和武汉（箱子较小）；相对湿度最大的城市主要有成都、广州、南京和武汉（中位数较大）；相对湿度最小的城市是兰州（中位数较小）；相对湿度分布比较对称的城市主要是北京、武汉、广州和兰州等（中位数大体上在箱子中间，最大值和最小值与箱子的距离大体相等）；相对湿度不对称的城市主要有南京、郑州等。相对湿度存在极值的城市主要是长春和西安。第3章数据的概括性度量3.1 （1）众数：。中位数：，。平均数

9、：。（2），。，。（3）（4）由于平均数小于中位数和众数，所以汽车销售量为左偏分布。3.2 （1）从表中数据可以看出，年龄出现频数最多的是19和23，所以有两个众数，即和。将原始数据排序后，计算的中位数的位置为：，第13个位置上的数值为23，所以中位数。（2），。，。（3）平均数。（4）偏态系数：。峰态系数：。（5）分析：从众数、中位数和平均数来看，网民年龄在2324岁的人数占多数。由于标准差较大，说明网民年龄之间有较大差异。从偏态系数来看，年龄分布为右偏，由于偏态系数大于1，所以偏斜程度很大。由于峰态系数为正值，所以为尖峰分布。3.3 （1）茎叶图如下：茎叶数据个数55166 7 8371

10、 3 4 8 85（2）。（3）由于两种排队方式的平均数不同，所以用离散系数进行比较。第一种排队方式：；。由于，表明第一种排队方式的离散程度大于第二种排队方式。（4）选方法二，因为第二种排队方式的平均等待时间较短，且离散程度小于第一种排队方式。3.4 （1）。，。（2），。，。（3）。3.5 （1）。.原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。3.6 （1）平均数计算过程见下表：按利润额分组组中值企业数2003002501947503004003503010500400500450421890050060055018990060

11、0以上650117150合计12051200。标准差计算过程见下表：按利润额分组组中值企业数2003002501931212.3593033.5300400350305878.3176348.740050045042544.322860.15006005501815210.3273785.2600以上6501149876.3548639.2合计120102721.51614666.7。（2）偏态系数和峰态系数的计算过程见下表：按利润额分组组中值企业数20030025019-104771226.5 18509932589.2 30040035030-13520652.3 1036628411.8

12、 40050045042533326.9 12442517.1 5006005501833765928.7 4164351991.6 600以上65011122527587.6 27364086138.8 合计12038534964.4 51087441648.4 偏态系数：。峰态系数：。3.7 （1）两位调查人员所得到的平均身高应该差不多相同，因为均值的大小基本上不受样本大小的影响。（2）两位调查人员所得到的身高的标准差应该差不多相同，因为标准差的大小基本上不受样本大小的影响。（3）具有较大样本的调查人员有更大的机会取到最高或最低者，因为样本越大，变化的范围就可能越大。 3.8 （1）要比较

13、男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为，男生体重的离散系数为，所以女生的体重差异大。（2）男生：（磅），（磅）；女生：（磅），（磅）；（3）假定体重为对称分布，根据经验法则，在平均数加减1个标准差范围内的数据个数大约为68%。因此，男生中大约有68%的人体重在55kg到65kg之间。（4）假定体重为对称分布，根据经验法则，在平均数加减2个标准差范围内的数据个数大约为95%。因此，女生中大约有95%的人体重在40kg到60kg之间。3.9 通过计算标准分数来判断：；。该测试者在A项测试中比平均分数高出1个标准差，而在B项测试中只高出平均分数0.5个标准差，由于A项测试的标

14、准分数高于B项测试，所以A项测试比较理想。3.10 通过标准分数来判断，各天的标准分数如下表：日期周一周二周三周四周五周六周日标准分数Z3-0.6-0.20.4-1.8-2.20周一和周六两天失去了控制。3.11 （1）应该采用离散系数，因为它消除了不同组数据水平高低的影响。（2）成年组身高的离散系数：；幼儿组身高的离散系数：；由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。3.12 （1）应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时，应该采用离散系数。（2）下表给出了用Excel计算一些主要描述统计量。方法A方法B方法C平均16

15、5.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准差2.13标准差1.75标准差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128从三种方法的集中趋势来看，方法A的平均产量最高，中位数和众数也都高于其他两种方法。从离散程度来看，三种方法的离散系数分别为：，。方法A的离散程度最小。因此应选择方法A。3.13 （1）用方差或标准差来评价投资的风险。（2）从直方图可以看出，商业类股票收益率的离散程度较小，说明投资风险也就较小。（3）从投资风险角度看，应该选择风险较小的商业类股票。当然，选择哪类

16、股票还与投资者的主观判断有很大关系。第4章抽样与参数估计4.1 （1）已知：，。样本均值的抽样标准差。（2）估计误差。4.2 （1）已知：，。样本均值的抽样标准差。（2）估计误差。（3）由于总体标准差已知，所以总体均值的95%的置信区间为：，即（115.8，124.2）。4.3 已知：，。由于总体标准差已知，所以总体均值的95%的置信区间为：，即（87818.856，121301.144）。4.4 （1）已知：，。由于为大样本，所以总体均值的90%的置信区间为：，即（79.026，82.974）。（2）已知：，。由于为大样本，所以总体均值的95%的置信区间为：，即（78.648，83.352

17、）。（3）已知：，。由于为大样本，所以总体均值的99%的置信区间为：，即（77.940，84.096）。4.5 （1）已知：，。由于总体标准差已知，所以总体均值的95%的置信区间为：，即（24.11，25.89）。（2）已知：，。由于为大样本，所以总体均值的98%的置信区间为：，即（113.17，126.03）。（3）已知：，。由于为大样本，所以总体均值的90%的置信区间为：，即（3.136，3.702）。4.6 （1）已知：总体服从正态分布，。由于总体服从正态分布，所以总体均值的95%的置信区间为：，即（8646.97，9153.03）。（2）已知：总体不服从正态分布，，。虽然总体不服从正

18、态分布，但由于为大样本，所以总体均值的95%的置信区间为：，即（8734.35，9065.65）。（3）已知：总体不服从正态分布，未知，。虽然总体不服从正态分布，但由于为大样本，所以总体均值的90%的置信区间为：，即（8760.97，9039.03）。（4）已知：总体不服从正态分布，未知，。虽然总体不服从正态分布，但由于为大样本，所以总体均值的99%的置信区间为：，即（8681.95，9118.05）。4.7 已知：，当为0.1、0.05、0.01时，相应的、。根据样本数据计算得：，。由于为大样本，所以平均上网时间的90%的置信区间为：，即（2.88，3.76）。平均上网时间的95%的置信区间

19、为：，即（2.79，3.85）。平均上网时间的99%的置信区间为：，即（2.63，4.01）。4.8 已知：总体服从正态分布，但未知，为小样本，。根据样本数据计算得：，。总体均值的95%的置信区间为：，即（7.11，12.89）。4.9 已知：总体服从正态分布，但未知，为小样本，。根据样本数据计算得：，。从家里到单位平均距离的95%的置信区间为：，即（7.18，11.57）。4.10 （1）已知：，。由于为大样本，所以零件平均长度的95%的置信区间为：，即（148.87，150.13）。（2）在上面的估计中，使用了统计中的中心极限定理。该定理表明：从均值为、方差为的总体中，抽取容量为的随机样

20、本，当充分大时（通常要求），样本均值的抽样分布近似服从均值为、方差为的正态分布。4.11 （1）已知：总体服从正态分布，但未知，为大样本，。根据样本数据计算得：，。该种食品平均重量的95%的置信区间为：，即（100.87，101.77）。（2）根据样本数据可知，样本合格率为。该种食品合格率的95%的置信区间为：，即（0.82，0.98）。4.12 已知：总体服从正态分布，但未知，为小样本，。根据样本数据计算得：，。总体均值的99%的置信区间为：，即（15.64，16.62）。4.13 已知：总体服从正态分布，但未知，为小样本，。根据样本数据计算得：，。网络公司员工平均每周加班时间的90%的置信

21、区间为：，即（10.36，16.76）。4.14 （1）已知：，。总体总比例的99%的置信区间为：，即（0.32，0.70）；（2）已知：，。总体总比例的95%的置信区间为：，即（0.78，0.86）；（3）已知：，。总体总比例的90%的置信区间为：，即（0.46，0.50）。4.15 已知：，为0.1和0.05时，相应的，。总体总比例的90%的置信区间为：，即（0.18，0.28）。总体总比例的95%的置信区间为：，即（0.17，0.29）。4.16 已知：，估计误差，。应抽取的样本量为：。4.17 （1）已知：，。应抽取的样本量为：。（2）已知：，未知，。由于未知，可用使用0.5。应抽取的

22、样本量为：。（3）已知：，。应抽取的样本量为：。4.18 （1）已知：，。总体中赞成该项改革的户数比例的95%的置信区间为：，即（0.51，0.77）。（2）已知：，。应抽取的样本量为：。第5章假设检验5.1 （1）研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”，所以原假设与备择假设应为：，。（2）如果不能拒绝原假设，表示没有充分的统计证据支持该开发小组认为新型弦线的抗拉强度得到了提高。（3）如果有充足的理由拒绝原假设，表示开发小组可以相信新型弦线的抗拉强度超过了1035Mpa，因此可以进一步采取推广措施。5.2 （1）该组织想要证实的假设是“每个月平均销售的

23、汽车数量不足14辆”，所以提出的假设形式为，。（2）当不能拒绝原假设时，该组织认为没有充分的理由怀疑汽车销售管理者的说法。（3）当可以拒绝原假设时，该组织有充分的统计证据断定汽车销售管理者的声明不真实。5.3 （1），。（2）样本数据表明应该拒绝原假设时，意味着该生产线生产的玻璃纸平均横向延伸率不符合规格，必须对生产线进行调整。（3）样本数据无法支持拒绝原假设时意味着质量控制监督人员没有充分的理由认为该生产线所处状态不正常，无需停产调整。5.4 （1）发生第一类错误指的是实际上奖励计划并未提高销售人员的平均销售额，而公司董事长却认为它提高了销售人员的平均销售额，这将导致公司错误的推行新的奖励计

24、划，却无法获得更高的销售额。（2）发生第二类错误指的是实际上奖励计划提高了销售人员的平均销售额，公司董事长却没有意识到，这将使公司错过推行新的奖励计划的机会，也就无法进一步提高销售额。5.5 （1）检验的临界值是，拒绝法则是：如果1.645，就拒绝。（2）检验统计量，所以拒绝原假设，认为新纤维的平均强力超过了6克。5.6 （1）。22.0时，检验统计量，不拒绝原假设。（3）23.5时，检验统计量，不拒绝原假设。（4）22.8时，检验统计量，不拒绝原假设。5.7 （1）拒绝规则是：如果1.96或-1.96，则拒绝。（2）检验统计量。（3）在5%的显著性水平下，不能拒绝原假设。5.8 建立原假设与

25、备择假设为：，；检验统计量-2.33，拒绝原假设，认为该厂机器的平均开工成本的确有所下降。5.9 建立原假设与备择假设为：，；，所以不拒绝原假设，也就是没有充分的理由怀疑该厂生产的工艺品框架宽与长的平均比例不是0.618。5.10 （1）。如果和都大于等于5。（2）1.96，所以拒绝原假设，认为该医生的声明并不属实。第6章相关与回归分析6.1 （1）散点图如下：从散点图可以看出，产量与生产费用之间为正的线性相关关系。（2）利用Excel的“CORREL”函数计算的相关系数为。（3）首先提出如下假设：，。计算检验的统计量当时，。由于检验统计量，拒绝原假设。表明产量与生产费用之间的线性关系显

26、著。6.2 （1）散点图如下：从散点图可以看出，复习时间与考试分数之间为正的线性相关关系。（2）利用Excel的“CORREL”函数计算的相关系数为。相关系数，表明复习时间与考试分数之间有较强的正线性相关关系。6.3 （1）表示当时的期望值为10。（2）表示每增加一个单位，平均下降0.5个单位。（3）时，。6.4 （1）。表示，在因变量取值的变差中，有90%可以由与之间的线性关系来解释。（2）。表示，当用来预测时，平均的预测误差为0.5。6.5 （1）散点图如下：从散点图可以看出，运送距离与运送时间之间为正的线性相关关系。（2）利用Excel的“CORREL”函数计算的相关系数为。相关系数，表

27、明运送距离与运送时间之间有较强的正线性相关关系。（3）由Excel输出的回归结果如下表：回归统计Multiple R0.948943R Square0.900492Adjusted R Square0.888054标准误差0.480023观测值10方差dfSSMSFSignificance F回归分析116.6816216.6816272.395852.79E-05残差81.8433790.230422总计918.525Coefficients标准误差t StatP-valueIntercept0.1181290.3551480.332620.74797X Variable 10.003585

28、0.0004218.5085752.79E-050.002613得到的回归方程为：。回归系数表示运送距离每增加1公里，运送时间平均增加0.003585天。6.6 （1）散点图如下：从散点图可以看出，人均GDP与人均消费水平为正的线性相关关系。（2）利用Excel的“CORREL”函数计算的相关系数为。相关系数接近于1，表明人均GDP与人均消费水平之间有非常强的正线性相关关系。（3）由Excel输出的回归结果如下表：回归统计Multiple R0.998128R Square0.996259Adjusted R Square0.995511标准误差247.3035观测值7方差分析dfSSMSF

29、Significance F回归181444969814449691331.6922.91E-07残差530579561159.01总计681750764Coefficients标准误差t StatP-valueIntercept734.6928139.54035.2650940.003285X Variable 10.3086830.00845936.492362.91E-07得到的回归方程为：。回归系数表示人均GDP每增加1元，人均消费水平平均增加0.308683元。（4）判定系数。表明在人均消费水平的变差中，有99.6259%是由人均GDP决定的。.（5）首先提出如下假设：，由于Sign

30、ificance F，拒绝原假设，表明人均GDP与人均消费水平之间的线性关系显著。（6）（元）。（7）当时，。置信区间为：即（1990.7，2565.5）。预测区间为：即（1580.3，2975.9）。6.7 （1）散点图如下：从散点图可以看出，航班正点率与被投诉次数之间为负的线性相关关系。（2）由Excel输出的回归结果如下表：回归统计Multiple R0.868643R Square0.75454Adjusted R Square0.723858标准误差18.88722观测值10方差分析dfSSMSFSignificance F回归分析18772.5848772.58424.5918

31、70.001108残差82853.816356.727总计911626.4Coefficients标准误差t StatP-valueIntercept430.189272.154835.9620290.000337X Variable 1-4.700620.947894-4.959020.001108得到的回归方程为：。回归系数表示航班正点率每增加1%，顾客投诉次数平均下降4.7次。（3）回归系数检验的P-Value=0.001108），拒绝原假设，回归系数显著。（4）（次）。（5）当时，。置信区间为：即（37.7，70.7）。预测区间为：即（7.6，100.8）。6.8 Excel输出的回

32、归结果如下：Multiple R0.7951R Square0.6322Adjusted R Square0.6117标准误差2.6858观测值20方差分析dfSSMSFSignificance F回归1223.1403223.140330.93322.79889E-05残差18129.84527.2136总计19352.9855Coefficients标准误差t StatP-valueIntercept49.31773.805012.96120.0000X Variable 10.24920.04485.56180.0000由上表结果可知，出租率与月租金之间的线性回归方程为：。回归系数表示：

33、月租金每增加1元，出租率平均增加0.2492%。，表明在出租率的变差中被出租率与租金之间的线性关系所解释的比例为63.22%，回归方程的拟合程度一般。估计标准误差表示，当用月租金来预测出租率时，平均的预测误差为2.6858%，表明预测误差并不大。由方差分析表可知，Significance F=2.79889E-05回归方程的线性关系显著。回归系数检验的P-value=0.0000，表明回归系数显著，即月租金是影响出租率的显著性因素。6.9 （1）方差分析表中所缺的数值如下方差分析表如下：变差来源dfSSMSFSignificance F回归11422708.61422708.6354.277

34、2.17E-09残差1040158.074015.807总计111642866.67（2）根据方差分析表计算的判定系数。表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。（3）相关系数可由判定系数的平方根求得：。（4）回归方程为：。回归系数表示广告费用每增加一个单位，销售量平均增加1.420211个单位。（5）由于Significance F2.17E-09，表明广告费用与销售量之间的线性关系显著。6.10 Excel输出的回归结果如下：回归统计Multiple R0.968167R Square0.937348Adjusted R Square0.916463标准误差3.809

35、241观测值5方差分析dfSSMSFSignificance F回归分析1651.2691651.269144.883180.006785残差343.5309414.51031总计4694.8Coefficients标准误差t StatP-valueIntercept13.625414.3994283.0970860.053417X Variable 12.3029320.3437476.6994910.006785由上述结果可知：回归方程为，回归系数表明，每增加一个单位平均增加2.3029个单位；判定系数，表明回归方程的拟合程度较高；估计标准误差，表明用来预测时平均的预测误差为3.8092。

36、6.11 （1）检验统计量：。（2）。（3）由于，所以拒绝原假设。（4）根据相关系数与判定系数之间的关系可知，。（5）提出假设：，由于，拒绝，线性关系显著。 6.12 （1）当时，。当，。的平均值的95%的置信区间为：即（15.95，18.05）。（2）预测区间为：即（14.65，19.35）。6.13 Excel输出的回归结果如下：回归统计Multiple R0.947663R Square0.898064Adjusted R Square0.881075标准误差108.7575观测值8方差分析dfSSMSFSignificance F回归分析1625246.3625246.352.860

37、650.000344残差670969.211828.2总计7696215.5Coefficients标准误差t StatP-valueIntercept-46.291864.89096-0.713380.502402X Variable 115.239772.0961017.2705330.000344得到的线性回归方程为：。当时，。当，。（2）销售收入95%的置信区间为：即（270.65，685.04）。第7章时间序列分析和预测7.1 （1）时间序列图如下：从时间序列图可以看出，国家财政用于农业的支出额大体上呈指数上升趋势。（2）年平均增长率为：。（3）。7.2 （1）时间序列图如下：（2）2001年的预测值为：（3）由Excel输出的指数平滑预测值如下表：年份单位面积产量指数平滑预测误差平方指数平滑预测误差平方19811451198213721451.06

展开阅读全文

[经济学]统计学第四版 各章练习题答案2009.doc

[经济学]统计学第四版各章练习题答案2009.doc