东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx

上传人:飞猪 文档编号:32974 上传时间:2025-07-09 格式:DOCX 页数:237 大小:4.99MB
下载 相关 举报
东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx_第1页
第1页 / 共237页
东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx_第2页
第2页 / 共237页
东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx_第3页
第3页 / 共237页
东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx_第4页
第4页 / 共237页
东北财经大学432统计学专业硕士历年考研真题及详解含复试历年真题.docx_第5页
第5页 / 共237页
点击查看更多>>
资源描述

1、目 录第一部分 初试历年真题及详解2011年东北财经大学统计学院432统计学专业硕士考研真题 2011年东北财经大学统计学院432统计学专业硕士考研真题及详解 2012年东北财经大学统计学院432统计学专业硕士考研真题 2012年东北财经大学统计学院432统计学专业硕士考研真题及详解 2013年东北财经大学统计学院432统计学专业硕士考研真题 2013年东北财经大学统计学院432统计学专业硕士考研真题及详解 2014年东北财经大学统计学院432统计学专业硕士考研真题 2014年东北财经大学统计学院432统计学专业硕士考研真题及详解2015年东北财经大学统计学院432统计学专业硕士考研真题 (回

2、忆 版)2015年东北财经大学统计学院432统计学专业硕士考研真题 (回忆 版) 及详解2016年东北财经大学统计学院432统计学专业硕士考研真题 (完整手 抄版)2016年东北财经大学统计学院432统计学专业硕士考研真题 (完整手 抄版) 及详解2017年东北财经大学432统计学专业硕士考研真题 2017年东北财经大学432统计学专业硕士考研真题及详解第二部分 复试历年真题2014年东北财经大学统计学院应用统计硕士复试真题(回忆版) 2015年东北财经大学统计学院应用统计硕士复试真题(回忆版) 2016年东北财经大学统计学院应用统计硕士复试真题第一部分 初试历年真题及详解2011年东北财经大

3、学统计学院432统计学专业硕士考研真题更多考研资料 v/q:344647 公众号/小程序:顺通考试资料2011年东北财经大学统计学院432统计学专业硕士考研真题及详解一、概念 (举例解释下列概念) (20分)1 总体答:总体 (population) 是包含所研究的全部个体 (数据) 的集合 ,它通常由所研究的一些个体组成。组成总体的每个元素称为个体。 比如 ,要检验一批灯泡的使用寿命 ,这批灯泡构成的集合就是总体 ,每 个灯泡就是一个个体。2 样本答:样本(sample)是从总体中抽取的一部分元素的集合 ,构成样本 的元素的数目称为样本量。比如 ,从一批灯泡中随机抽取100个 ,这100 个

4、灯泡就构成了一个样本, 100就是这个样本的样本量。3 参数答:参数(parameter)是用来描述总体特征的概括性数字度量 ,它是 研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体 平均数、总体标准差、总体比例等。4 统计量答:统计量 ( statistic) 是用来描述样本特征的概括性数字度量。它 是根据样本数据计算出来的一个量, 由于抽样是随机的, 因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、 样本比例等。二、选择 (在下列各题中选择出一个或一个以上的正确选项) ( 16分)1 按照所采用的计量尺度不同 ,可以将统计数据分为 ( ) 。A分类数

5、据B顺序数据C截面数据D数值型数据 【答案】ABD【解析】按照所采用的计量尺度不同 ,可以将统计数据分为分类数 据、顺序数据和数值型数据。分类数据表现为类别 ,但不区分顺序 ,是 由定类尺度计量形成的;顺序数据表现为类别 ,但有顺序 ,是由定序尺 度计量形成的;数值型数据表现为数值 ,是由定距尺度和定比尺度计量 形成的 ,也可称为定量数据。2 下列哪些图形不适用于品质型数据的频数分布显示 ( ) 。A条形图B直方图C茎叶图D箱线图 【答案】BCD【解析】 品质型数据的图示方法包括条形图、帕累托图、饼图、环 形图等;顺序数据的图示方法包括条形图、帕累托图、饼图、环形图、 累积分布图等;数值型数据

6、的图示方法包括条形图、帕累托图、饼图、 环形图、累积分布图、直方图、茎叶图、箱线图、线图、散点图、气泡 图、雷达图等。3 描述数据频数分布集中趋势的统计量有 ( ) 。A方差B众数C 中位数D平均数 【答案】BCD【解析】集中趋势是指一组数据向某一中心值靠拢的程度 ,它反映 了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量有 众数、 中位数、分位数、平均数等。方差是描述数据离散程度的统计 量。4 时间序列中的观察值可分解为哪几个构成要素 ( ) 。A长期趋势B季节波动C循环波动D不规则波动【答案】ABCD【解析】时间序列是同一现象在不同时间上的相继观察值排列而成 的序列。时间序列的

7、成分可以分为四种 ,即趋势、季节性或季节波动、 周期性或循环波动、随机性或不规则波动。趋势也称为长期趋势 ,是指 时间序列在长时期内呈现出来的某种持续向上或持续下降的变动;季节 变动是指时间序列在一年内重复出现的周期性波动;周期性波动或循环 波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变 动。周期性通常是由于经济环境的变化而引起的;随机性或不规则波动 是由于一些偶然性的因素产生的。5 假设检验中的两类错误指的是 ( ) 。A登记错误B测量错误C拒真错误D采伪错误 【答案】CD【解析】假设检验所犯的错误有两种类型 ,一类错误是原假设H0为 真却被拒绝了 ,犯这种错误的概率用表示

8、所以也称错误或弃真错 误;另一类错误是原假设为伪却没有被拒绝 ,犯这种错误的概率用表 示 ,所以也称错误或取伪错误。6 哪种频数分布状态下平均数、众数和中位数是相等的 ( ) 。A对称的钟形分布B左偏的钟形分布C右偏的钟形分布DU形分布 【答案】A【解析】在频数对称且单峰分布的状态下 ,平均数、众数、 中位数 相等。7 参数估计中评价估计量的三个标准是 ( ) 。A无偏性B有效性C对称性D一致性 【答案】ABD【解析】统计学家给出的评价估计量的标准主要有三个:无偏性、 有效性、一致性。无偏性是指如果对同一个总体反复多次抽样 ,则要求 各个样本所得出的估计量 (统计量) 的平均值等于总体参数;

9、有效性是 指由于估计量与总体之间必然存在着一定的误差 ,衡量这个误差大小的 一个指标就是方差 ,方差越小 ,估计量对总体的估计也就越准确 ,该估 计量也就越有效;一致性是指当样本量逐渐增加时 ,样本的估计量 (统 计量) 能够逐渐逼近总体参数。8 在进行参数估计之前 ,首先应该确定一个适当的样本容量 ,决 定样本容量大小的因素包括 ( ) 。A置信水平B边际误差C总体方差D分布类型 【答案】ABC【解析】决定样本容量大小的因素有以下三点: ( 1) 受总体方差数 值大小的影响。总体方差大 ,抽样误差大 ,则样本容量应大一些 ,反 之 ,则可少抽取一些; (2) 可靠性程度的高低。可靠性越高 ,

10、所需的 样本容量就越大; ( 3) 允许误差的大小。若要求推断比较精确 ,允许 误差应该低一些 ,随之抽取的样本容量则多一些;反之 ,样本容量可少 一些。三、简答 ( 15分)1 造成统计数据误差的原因有哪些?如何减少和控制统计数据中 的误差?答:统计数据的误差是指通过调查搜集到的数据与研究对象真实结 果之间的差异。数据的误差有两类:抽样误差和非抽样误差 ,其造成原 因及减少和控制方法如下:抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差 ,是由抽样的随机性导致的。通过增加样本量可以减小抽样误差 ,当 样本量大到与总体单位相同时 ,也就是抽样调查变成普查时 ,抽样误差 就减小到零。非

11、抽样误差是指除抽样误差之外的, 由于其他原因引起的样本观察 结果与总体真值之间的差异。非抽样误差包括抽样框误差、 回答误差、无回答误差、调查员误差、测量误差等。非抽样误差控制的重要方面是 调查过程的质量控制。这包括调查员的挑选、调查员的培训、督导员的 调查专业水平、对调查过程进行控制的具体措施、对调查结果进行检验 评估、对现场调查人员进行奖惩的制度等。2 比较众数、 中位数和平均数的异同之处。答:众数是一组数据中出现次数最多的变量值; 中位数是一组数据 排序后处于中间位置上的变量值;平均数是一组数据相加后除以数据的 个数得到的结果。三者的联系表现为:众数、 中位数和平均数都是反映数据集中趋势

12、的测度值 ,当数据的分布对称时 ,众数、 中位数和平均数相等。三者的区别表现为:众数是一组数据分布的峰值 ,不受极端值的影 响。其缺点是具有不惟一性 ,一组数据可能有一个众数 ,也可能有多个 众数 ,也可能没有众数。众数只有在数据量较多时才有意义 ,当数据量 较少时 ,不宜使用众数。众数主要适合作为分类数据的集中趋势测度 值。 中位数是一组数据中间位置上的代表值 ,不受数据极端值的影响。 当一组数据的分布偏斜程度较大时 ,使用中位数也许是一个好的选择。 中位数主要适合作为顺序数据的集中趋势测度值。平均数是针对数值型 数据计算的 ,而且利用了全部数据信息 ,它是实际中应用最广泛的集中 趋势测度值

13、但平均数的主要缺点是易受数据极端值的影响 ,对于偏态 分布的数据 ,平均数的代表性较差。3 从总体中抽取样本 ,主要有哪些抽样方法?各种抽样方法的特 点及适用场合是什么?答:从总体中抽取样本的方式分为两类:概率抽样和非概率抽样。概率抽样也称随机抽样 ,是指遵循随机原则进行的抽样 ,总体中每 个单位都有一定的机会被选入样本。经常采用的概率抽样有简单随机抽 样、分层抽样、整群抽样、系统抽样、多阶段抽样等。非概率抽样是相 对于概率抽样而言的 ,指抽取样本时不是依据随机原则 ,而是根据研究 目的对数据的要求 ,采用某种方式从总体中抽出部分单位对其实施调 查。非概率抽样主要有方便抽样、判断抽样、 自愿

14、样本、滚雪球抽样、 配额抽样等。概率抽样是依据随机原则抽选样本 ,样本统计量的理论分布是存在的 ,若调查的结果要求对总体的有关参数进行估计 ,并对估计的精度提 出了要求 ,这时应选取概率抽样 ,如调查不同年龄层段的消费水平等。非概率抽样的特点是操作简单、时效快、成本低 ,而且对于抽样中 的统计学专业技术要求不是很高。非概率抽样适合探索性的研究 ,调查 的结果用于发现问题 ,为更深入的数量分析提供准备。非概率抽样也适 合市场调查中的概念测试 ,如产品包装测试、广告测试等 ,这时不需要 将调查结果投影到总体的情况。四、论述 (24分)1 系统论述统计活动的基本程序、统计方法的构成内容及应用范 围。

15、答: ( 1) 统计活动的基本程序包括:统计设计、统计调查、统计 整理、统计资料的表现形式、统计分析。 统计设计是统计工作的初始阶段 ,即统计工作实际进行之前的准 备阶段 ,是根据统计研究的目的 ,对统计工作各个环节的统筹考虑和安 排。 统计调查就是按照统计设计和调查方案 ,有计划、有组织地向调查单位搜集统计资料的工作过程。 统计整理 ,是指根据统计研究目的 ,将统计调查所取得原始资料 进行科学的分类汇总 ,或对已经加工的次级资料进行再加工 ,为统计分 析准备系统化、条理化的综合资料的工作过程。 统计资料通过整理 ,最后以指标及指标体系、统计表和统计图等 形式表现出来。 统计分析是指根据研究的

16、目的 ,运用统计方法 ,以统计资料为依据 ,结合具体情况 ,对客观事物进行科学的分析 ,揭示其本质和规律 性 ,提出解决问题和矛盾的方法的一种活动。(2) 统计方法可分为描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、 图表描述、概括与分析 等统计方法。主要包括数据的频数分析、集中趋势分析、离散程度分 析、数据的分布及一些基本的统计图形。推断统计是研究如何利用样本 数据来推断总体特征的统计方法。该方法是以概率形式来决断数据之间 是否存在某种关系 ,包括总体参数估计和假设检验 ,常用方法有Z检 验、T检验、卡方检验等。描述统计和推断统计二者彼此联系 ,相辅相成 ,描述统计是推断

17、统 计的基础 ,推断统计是描述统计的升华。具体研究中 ,是采用描述统计 还是推断统计 ,应视具体的研究目的而定 ,如研究的目的是要描述数据 的特征 ,则需描述统计;若还需对多组数据进行比较或需以样本信息来 推断总体的情况 ,则需用推断统计。例如 ,在教育领域中 ,在对某幼儿 园大班开展一项识字教改实验 ,期末进行一次测试 ,并对测试所得数据 进行统计分析。如果只需了解该班儿童识字的成绩(平均数及标准差)及 其分布 ,此时 ,应采用描述统计方法;若还需进一步了解该实验班与另 一对照班(未进行教改实验)儿童的识字成绩有无差异 ,从而判断教改实验是否有效时 ,除了要对两个班的成绩进行描述统计之外 ,

18、还需采用推 断统计方法。五、计算1 一项调查获如下容量为20的样本数据: ( 15分)要求:( 1) 确定该数据的中位数(2) 以04、59、 10 14等为组限 ,绘制等距式频数分布表及累积 频数分布表。( 3) 绘制频数分布直方图和累积频数分布图。(4) 指出该数据所属的频数分布类型。解: ( 1) 将数据按照升序重新排序 ,结果如下:中位数位置 (201) /210.5所以中位数为: ( 88) /28 ,即m0.58。(2)等距式频数分布表( 3) 频数分布直方图如下:频数分布直方图累计频数分布图如下:向上累积频数分布图向下累积频数分布图(4) 把数据代入公式可得:SK0.796说明该

19、频数分布中等右偏 ,K0.081说明该频数分布为尖峰分布 ,即与正态分布相比 ,该数据分布更集中。2 下面是两个变量的5次观察值: ( 10分)要求:( 1) 就上述数据绘制散点图。(2) 观察散点图 ,指出x与y之间存在何种可能的关系? ( 3) 计算相关系数并解释其计算结果的含义。解: ( 1)(2) 观察散点图可知 ,x与y之间可能存在线性相关关系。( 3) 相关系数0.5r0.8 ,说明x与y之间存在中度正相关的线性关系。3 甲乙两个班级统计学考试成绩资料如下: ( 15分)甲班的平均分数为75分 ,标准差为7分; 乙班的考试成绩频数分布 表如下:要求:( 1) 计算乙班的平均考试分数

20、2) 计算乙班考试分数的方差及标准差。( 3) 计算乙班考试分数的离散系数。(4) 比较甲乙两个班级考试分数的离散程度的大小。 解: ( 1) 乙班平均考试分数计算过程如下表所示:乙班平均考试分数的分组数据表由上表中数据可得(2) 方差计算过程如下表所示:由上表中数据可得:(3)(4),说明两个班的统计学考试成绩相比较, 甲班的成绩较集中, 乙班 的成绩较分散。4 从一个标准差为6的总体中 ,随机抽取了一个容量为45的样本, 并计算得样本均值为30。试以95%的置信度给出总体均值的置信区间 (Z0.0251.96) 。 ( 5分)_解: 由题意可知 ,x30 , 6 ,n45 ,参数估计使

21、用z统计量, 所以总体均值的置信区间为:即 (28.247 ,31.753) 。5 某城市某种工业产品产量资料如下表所示: ( 15分)要求:( 1) 绘制时间序列动态图(2) 计算该城市该种工业产品产量各年的环比增长率和定基增长 率。( 3) 计算该城市该种工业产品产量从2005年到2009年4年间的平均 增长率。(4) 运用最小二乘法确定趋势直线方程ytb0b1t。解: ( 1) 绘制的时间序列动态图如下:工业产品产量序列动态图(2) 计算该城市该种工业产品产量各年的环比增长率和定基增长率 的过程如下表所示:( 3) 该城市该种工业产品产量从2005年到2009年4年间的平均增长 率为(4

22、) 根据最小二乘法求解b0和b1的公式 ,得所以yt 26513.9 13.9t。6 两种商品基期和报告期的销售量及销售价格数据如下表所示: ( 15分)要求:( 1) 计算两种商品的拉氏价格指数。(2) 计算两种商品的帕氏价格指数。( 3) 比较拉氏价格指数与帕氏价格指数计算结果的差异 ,并指出产 生差异的原因。解: ( 1) 两种商品的拉氏价格指数为:(2) 两种商品的帕氏价格指数为:( 3) 比较 ( 1) 和 (2) 的计算结果可知 ,拉氏价格指数与帕氏价格 指数计算结果不同 ,产生差异的原因是权数确定的时期不同:拉氏价格 指数将权数的同度量因素固定在基期;帕氏价格指数将权数的同度量因

23、 素固定在报告期。2012年东北财经大学统计学院432统计学专业硕士考研真题2012年东北财经大学统计学院432统计学专业硕士考研真题及详解一、选择 (40分)1 对于 (缺数据) 一个由12名学生构成的样本 ,询问他们钱包里 有多少零花钱 ,他们的回答如下 (元) :( 1) 这些数据的均值为 ( )A 60.05B49.80C 60.00D44.08(2) 这些数据的中位数为 ( )A45.00B40.00C 104.00D 60.00( 3) 这些数据的众数为 ( )A 104.00B44.00C 5.00D40.00【答案】略2 统计学期中考试非常简单 ,为了评估简单程度 ,教师记录了

24、9名 学生交上考试试卷的时间如下 (分钟) :( 1) 这些数据的极差为 ( )A 3.00B3.00C41.00D41.00 【答案】C【解析】数据按从小到大排序结果如下:极差最大值最小值601941。(2) 这些数据的除以样本自由度的方差为 ( )A 150.00B150.00C260.00D260.00【答案】A【解析】设样本方差为S2 ,根据未分组数据和分组数据计算样本方 差的公式分别为:未分组数据:分组数据:本题为未分组数据 ,代入公式即得答案A。( 3) 这些数据的除以样本自由度的标准差为 ( )A29.60B 12.25C12.25D29.60【答案】B【解析】标准差是方差的算术

25、平方根。(4) 这些数据的离散系数为 ( )A 3.81B0.31C3.81D0.31 【答案】D【解析】离散系数也称为变异系数 ,它是一组数据的标准差与其相 应的平均数之比。其计算公式为:_VSS/x 12.25/39.330.313 汽车销售人员每年销售的汽车数量是服从正态分布的 ,标准差 是15 ,抽取400名销售员组成的随机样本 ,发现每年平均销售量是75 辆。( 1) 总体均值的置信度为95% (Z0.0251.96) 的估计区间为 ( )A ( 74.93 ,75.07)B ( 73.53 ,76.47)C ( 76.47 ,73.53)D ( 75.07 ,74.93) 【答案】

26、B【解析】在大样本条件下 ,总体服从正态分布 ,总体均值在置 信水平下的置信区间可以写为:即得答案为B项。(2) 总体均值的置信度为95.45% (Z0.022752.00) 的估计区间为 ( )A ( 74.25 ,75.75)B ( 75.75 ,74.25)C ( 73.50 ,76.50)D ( 76.50 ,73.50) 【答案】C【解析】按照上题解析中的公式 ,代入数据即得答案为C项。( 3) 欲在缩小估计区间宽度的同时 ,提高置信度 ,惟一途径为 ( )A 以样本标准差替代总体标准差B减少样本容量C 以样本中位数替代样本均值D增加样本容量 【答案】D【解析】 由 ( 1) 题解析

27、中的公式可知 ,要提高置信度 ,只能扩大区 间宽度 ,或者增加样本容量 ,故本题答案是D项。二、简答 ( 50分)1 统计中用以描述数据频数分布集中趋势的统计量主要有哪些? 各自有何特点? ( 10分)答: ( 1) 集中趋势 ( central tendency) 是指一组数据向某一中心值 靠拢的程度 ,它反映了一组数据中心点的位置所在。描述数据频数分布 集中趋势的统计量主要有两大类:一类是数值平均数 ,它们是根据全部 数据计算得到的代表值 ,主要包括算数平均数、调和平均数及几何平均 数。 算术平均数也称为均值 ,是一组数据相加后除以数据的个数得到 的结果 ,包括简单算数平均数和加权算数平均

28、数。算术平均数是对数值 型数据计算的 ,而且利用了全部数据信息 ,是实际中应用最广泛的集中 趋势测度值。其主要缺点是易受数据极端值的影响 ,对于偏态分布的数 据 ,代表性较差。 调和平均数也称为倒数平均数 ,是总体各单位标志值倒数的算术 平均数的倒数。社会经济统计中使用的调和平均数往往具有特定 (经 济) 意义 ,通常是加权算术平均数的变形。主要是用来解决在无法掌握 总体单位数 (频数) 的情况下 ,只有每组的变量值和相应的标志总量 , 而需要求得平均数的实际问题。 几何平均数。几何平均数是指n个观察值连乘积的n次方根。计算 几何平均数要求各观察值之间存在连乘积关系 ,主要适用于对比率、指 数

29、等进行平均 ,计算平均发展速度等。(2) 另一类是位置代表值 ,是根据数据所处位置直接观测或根据与特定位置有关的部分数据来确定的代表值 ,主要有众数和中位数等。 众数 (mode) 是一组数据中出现次数最多的变量值 ,用Mo表 示。众数是一组数据分布的峰值 ,不受极端值的影响。其缺点是具有不 惟一性 ,一组数据可能有一个众数 ,也可能有两个或多个众数 ,也可能 没有众数。众数只有在数据量较多时才有意义 ,当数据量较少时 ,不宜 使用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数 (median) 是一组数据排序后处于中间位置上的变量值, 用Me表示。 中位数是一组数据中间位置上的代表

30、值 ,不受数据极端值 的影响。当一组数据的分布偏斜程度较大时 ,使用中位数也许是一个好 的选择。 中位数主要适合作为顺序数据的集中趋势测度值。2 总体与样本的联系与区别是什么?总体参数与样本统计量有何 异同之处? ( 10分)答: ( 1) 总体与样本的含义 总体 (population) 是包含所研究的全部个体 (数据) 的集合 , 它通常由所研究的一些个体组成。样本 ( sample) 是从总体中抽取的一 部分单位 ,作为总体的代表加以研究 ,样本所包含的总体单位数称为样 本容量 ( sample size) 。样本来自于总体 ,可以根据样本提供的信息推 断总体的特征。 参数 (param

31、eter) 是用来描述总体特征的概括性数字度量 ,它是 研究者想要了解的总体的某种特征值。统计量 ( statistic) 是用来描述样 本特征的概括性数字度量。(2) 总体参数与样本统计量的异同区别:总体参数是总体指标的统称 ,从总体中计算得到 ,代表总体特征, 由于总体数据通常未知 ,所以总体参数是一个未知的常数 ,但不 是变量;样本统计量是根据样本数据计算出来的用于对数据分析检验的 一个量, 由于抽样是随机的, 因此样本统计量是一个变量 ,是样本的函 数。 由于样本是已经抽出来的 ,所以样本统计量总是已知的。此外 ,总 体参数常用希腊字母表示 ,样本统计量常用英文字母表示。联系:从数值计

32、算上讲 ,当总体大小已知并与实验观测的总次数相 同时 ,样本统计量与总体参数是同一统计指标;当总体为无限时 ,样本 统计量与总体参数不同 ,但样本统计量可以在某种程度上作为总体参数 的估计值 ,通过样本统计量 ,对总体参数作出预测和估计。3 统计中用以描述品质型数据频数分布的图形主要有哪些?各自 有何特点? ( 10分)答: 品质型数据包括分类数据和顺序数据。描述分类数据频数分布 的图形主要有条形图、帕累托图、饼图等;描述顺序数据频数的图形除 了以上几种 ,还有累积频数分布图。条形图(bar chart)是用宽度相同的条形的高度或长短来表示数据多少 的图形。条形图可以横置或纵置 ,纵置时也称为

33、柱形图(column chart)。 此外 ,条形图有简单条形图、对比条形图等形式。帕累托图(Pareto chart)是按各类别数据出现的频数多少排序后绘制 的柱形图。通过对柱形图的排序 ,容易看出哪类数据出现得多 ,哪类数 据出现得少。帕累托图在质量控制研究中有广泛应用。对于不同类型的 缺陷、失效方式和其他感兴趣的类 ,可以用帕累托图观察各个类的影响 顺序。饼图(pie chart)是用圆形及圆内扇形的角度来表示数值大小的图形。 它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例 ,对于研究结构性问题十分有用。对于顺序数据 ,还可以计算累积频数和累积频率(百分比)。根据累

34、积频数或累积频率 ,可以绘制累积频数分布或频率图。4 什么叫P值?P值在假设检验的决策过程中有何作用? ( 10分)答:P值就是当原假设为真时所得到的样本观察结果或更极端结果 出现的概率。如果P值很小 ,说明这种情况发生的概率很小 ,而如果出 现了 ,根据小概率原理 ,我们就有理由拒绝原假设。P值越小 ,我们拒 绝原假设的理由就越充分。利用P值 ,我们可以精确地反映决策的风险度 ,按照我们所需要的 显著性水平进行判断和决策。具体做法就是用P值和事先确定的显著性 水平进行比较 ,一般地 ,用X表示检验的统计量 ,当H0为真时 ,可由样 本数据计算出该统计量的值C ,根据检验统计量X的具体分布 ,

35、可求出P 值。具体地说:左侧检验的P值为检验统计量X小于样本统计值C的概率 ,即P P XC;右侧检验的P值为检验统计量X大于样本统计值C的概率 ,即P P XC;双侧检验的P值为检验统计量X落在样本统计值C为端点的尾部区域 内的概率的2倍:P2PXC或P2PXC。若X服从正态分布和t分布 ,其分布曲线是关于纵轴对称的 ,故其P 值可表示为PP | X | C。计算出P值后 ,将给定的显著性水平与P值比较 ,就可作出检验结论:如果P值 ,则在显著性水平下拒绝原假设;如果P值 ,则在显著性水平下接受原假设。在实践中 ,当P值时 ,也即统计量的值 C刚好等于临界值 ,为慎重起见 ,可增加样本容量

36、重新进行抽样检 验。5 什么是拒真错误?什么是采伪错误?犯拒真错误的概率与犯采 伪错误的概率有何联系与区别? ( 10分)答: ( 1) 定义:拒真错误是假设检验中的第一类错误 ,是指原假 设H0为真却被我们拒绝了 ,犯这种错误的概率用表示 ,所以也称错 误。采伪错误是假设检验中的第二类错误 ,是指原假设不正确而接受原 假设的错误 ,犯这种错误的概率用表示 ,所以也称错误。(2) 区别: 由部分来推断总体 ,判断有可能正确 ,也有可能不正确 ,错误和错误是假设检验中存在的两类不同的错误。在双侧检验 时是两个尾部的拒绝域面积之和 ,在单侧检验时是单侧拒绝域的面积。 只取单尾 ,假设检验时值一般

37、不知道 ,在一定情况下可以测算出 ,如 已知两总体的差值、样本含量和检验显著性水平。 由于检验统计量是随 机变量 ,有一定的波动性 ,有时原假设H0并不正确 ,在正常的情况下, 计算的统计量仍有一定的概率落入接受域内 ,从而错误地接受了原假 设H0。是限制犯第二类错误的保证 ,又称为检验的污染。根据不同的 检验问题 ,对于与大小的选择有不同的考虑。( 3) 联系:在样本容量不变的条件下 ,犯错误的概率与犯错误的 概率常常呈现反向的变化 ,即如果减小犯错误的概率 ,就会增大犯错 误的机会;若减小犯错误的概率 ,就会增大犯错误的机会。要使犯 错误的概率与犯错误的概率同时变小 ,只有增大样本量。但样

38、本量不 可能没有限制 ,否则就会使抽样调查失去意义, 因此 ,在假设检验中,就有一个对两类错误进行控制的问题。一般来说 ,哪一类错误所带来的后果越严重 ,危害越大 ,在假设检验中就应当把哪一类错误作为首要的 控制目标。在假设检验中 ,通常首先控制犯错误 ,这样做最主要的原 因是 ,从实用的观点看 ,原假设是什么常常是明确的 ,而备择假设是什 么则常常是模糊的。三、计算 ( 60分)1 某班学生统计学期末考试成绩数据如下表所示: (20分) 某班学生统计学期末考试成绩频数分布表要求:( 1) 绘制频数分布直方图;(2) 填制累积频数分布表;( 3) 绘制累积频数分布图;(4) 计算均值、方差及标

39、准差。解: ( 1) 绘制频数分布直方图如下:某班学生统计学期末考试成绩频数分布图 (2) 完整的累积频数分布表如下:某班学生统计学期末考试成绩频数分布表( 3) 累积频数分布图如下:某班学生统计学期末考试成绩向上累积频数分布图某班学生统计学期末考试成绩向下累积频数分布图 (4) 均值计算过程如下:由上表及均值计算公式可得:方差计算过程如下:由方差计算公式可得:标准差2 下面是一个单因素方差分析表 ,请填充表中空格。 ( 10分)单因素方差分析表解: 由方差分析恒等式:总变差平方和组间变差平方和组内变 差平方和可知:组间差异总差异组内差异564495.7357512.23506983.50 组

40、间差异自由度59257组内差异的均方差异 (组内方案) 57512.23/228756. 12 组间差异的均方差异 (组间方案) 506983.50/578894.45 F组间方差/组内方差8894.45/28756. 120.31填充完整的单因素方差分析表如下:单因素方差分析表3 某生产线生产出的零件尺寸服从正态分布 ,其标准规格为 6mm。为检验生产线工作状态是否正常 ,随机抽取了一个容量为10的样 本 ,算得样本均值为6.4mm ,样本方差为0.09。要求:以0.05的显著性 水平检验生产线状态正常的假设t0.025 ( 9) 2.262。 ( 10分)解: 由于零件尺寸服从正态分布 ,

41、总体方差未知 ,且样本量较小, 所以应采用t统计量。_已知条件为: 0 6 ,x6.4 , s20.09 ,n 10 , 0.05 建立假设检验 ,设:H0 :6H1 :6当0.05, 自由度n19时, 由题干可知t/2 ( 9) 2.262。 因为t t/2 ,样本统计量落入拒绝域 ,故拒绝H0 ,接受H1 ,说明0.05的显著性 水平下 ,生产线工作状态不正常。5 两种商品基期和报告期的销售量及销售价格数据如下表所示: (20分)要求:( 1) 计算两种商品的拉氏价格总指数;(2) 计算两种商品的帕氏价格总指数;( 3) 比较拉氏价格总指数与帕氏价格总指数计算结果的差异 ,并指出产生差异的原因;(4) 计算两种商品的价格理想指数。解:( 1) 两种商品的拉氏价格总指数为:(2) 两种商品的帕氏价格总指数为:( 3) 产生差异的原因: 权数确定的时期不同:拉氏价格指数将权数的同度量因素固定在 基期;帕氏价格指数将权数的同度量因素固定在报告期。 拉氏指数与帕氏指数的同度量因素水平和计算结果的差异 ,表明 它们具有不完全相同的经济分析意义。以价格指数为例 ,拉氏价格指数 以基期商品销售量作为同度量因素 ,这说明它是在基期的销售数量和销 售结构的基础上来考察各种商品价格的综合变动程度的;而帕氏价格指 数以报告期商品销

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究生考试 > 专业课

宁ICP备18001539号-1