《统计与统计案例》复习指导(a版).doc.pdf

上传人:tbuqq 文档编号:5622858 上传时间:2020-07-06 格式:PDF 页数:3 大小:113.23KB
返回 下载 相关 举报
《统计与统计案例》复习指导(a版).doc.pdf_第1页
第1页 / 共3页
《统计与统计案例》复习指导(a版).doc.pdf_第2页
第2页 / 共3页
《统计与统计案例》复习指导(a版).doc.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《《统计与统计案例》复习指导(a版).doc.pdf》由会员分享,可在线阅读,更多相关《《统计与统计案例》复习指导(a版).doc.pdf(3页珍藏版)》请在三一文库上搜索。

1、统计与统计案例复习指导(A版) 山东 尹征 统计是研究如何合理收集、整理、分析数据以及由数据分析结果作出决策的科学,为人们 认识世界提供了重要的思维模式和解决问题的方法. 通过对统计和统计案例的学习,使我们理 解了统计思想与确定性思想的差异,认识体会了统计思想在解决实际问题屮的作用. 一、随机抽样 简单随机抽样、系统抽样和分层抽样的共同特点是在抽样过程中每一个个体被抽取的概率 相等,体现了这些抽样方法的客观性和公平性. 一般地,当总体屮的个体数较少时,常采用简 单随机抽样;当总体屮的个体数较多时,常采用系统抽样;当已知总体由差异明显的几部分组 成时,常采用分层抽样. 当然,采用抽样方法解决实际

2、问题时,三种抽样方法经常交叉起来使 用. 应用抽样方法时要注意以下儿点: (1)用随机数表法抽样时,对个体所编的号码位数要相等. 当问题所给位数不等时,以 位数较多的为准,在位数较少的数前而添“ o ”,凑齐位数 . N (2)用系统抽样法抽样吋,如果总体容量N能被样本容量n整除,抽样间隔为k=-; n 如 果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔. 卞 (3)用分层抽样法抽样吋,分成的各层标准耍一?致,互不重叠;各层抽取的比例都等 于样本容量在总体中的比例,即上. N 二、用样本估计总体 1.用样本的频率分布估计总体分布 总体分布是指总体取值的分布规律,这种分

3、布一般是不知晓的?我们往往用样本的频率分 布去估计总体分布 ?一般地,样本容量越大,估计越梢确,用样本频率分布去估计总体分布的 基本步骤是:从总体小抽取合适的样本;分纽统计样本数据;计算各组的频率=, ,频 数. ,作频率分布表;画频率分布肓方图. 频率分布表能使我们清楚地知道数据分样本容量 布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量所占比例大小的角度 来表示数据分布的规律 . 把频率分布直方图各个矩形的上端的中点用线段连接起来,就得到频 率分布折线图 . 这样,通过样木频率分布就可以人致估计出总体的分布?要特别指出的是 : 频率 分布直方图中,矩形面积=频率. 在样本数

4、据较少吋,也常用茎叶图表示数据?茎叶图刻画数据有两个优点:一是所有的信 息都可以从图中得到;二是茎叶图便于记录和表示?但当数据位数较多时,使川茎叶图就不够 方便了 . 2.用样木的数字特征估计总体的数字特征 (1)众数、中位数和平均数都是描述数据的“集中趋势”的数字特征. 它们各冇优缺点 , 耍深刻理解和把握它们在反映样本数据上的特点,结合实际情况,灵活选用. (2)方差和标准差都是用來描述一组数据波动情况的特征数,常用來比较两组数据的 波动大小.方差较人的波动较大,方差较小的波动较小. 打_ _ 工(兀一兀)(兀一刃 (兀 -匚)吃 0 厂亍) 2 /=! /=! 式为:厂 a = y-bx

5、 . 三、回归分析 1.线性回归分析 (1)两个变量线性相关关系的判断 判断解释变量X与预报变量y是否具有线性相关关系,一种常见的简便可行的方法就是作出散 点图,从点的分布特征来判定是否线性相关:如果这些点人致分布在通过散点图屮心的一条直 线附近,那么就说这两个变量Z问具有线性相关关系,这条直线叫做回归直线. 应 该注意冋归 直线是指各样本点与此直线在整体上是最贴近的那一?条直线,它只能有一 ?条,且过样木点的 中心G,亍). 但是如果作图不准,出现误差,就很难判断两个变量Z间是否线性相 关. 因此,给定样木数据(引yj(i = l,2, ,n),单纯由散点图判定其是否大致在一条直线附近 主观

6、性太强,所以常用相关系数r来衡最两个变量之间线性关系的强弱的具体计算公 H _ I 通常当Irl人于0. 川 _、(n 一、 29 2 2 i=l 八 i=l 丿 7 5时,认为两个变量有很强的线性相关关系. (2)线性回归分析的方法、步骤 利用回归分析的方法对具有线性相关关系的变量进行研究的步骤为: 画出两个变量的散点 图;求回归直线方程;用回归直线方程进行预报?英中求回归直线的方程是关键?而 求回归 直线的最好方法是“最小二乘法”,即对于线性冋归模型y=bx+a来说,估计模型屮的未知参数 6和厶的最好方法就是用最小二乘法估计6和6 ,英计算公式为 2.非线性回归分析 对非线性回归问题进行回

7、归分析时,也需要価出已知数据的散点图,通过与各种函数(如 指数函数、对数函数、幕函数等)的图象作比较,选择一种与这些散点拟合得最好的函数, 然 后采用适当的变量代换,将问题化为线性回归的问题來解决. 3.两个不同回归模型拟合效果的比较 (1)建立回归模型 建立回归模型的棊本步骤是:确定研究对象,明确哪个变量是解释变虽,哪个变虽是预 报变量;画出确定好的解释变量和预报变量的散点图,观察它们Z间的关系(如是否存在线 性相关关系等);山经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性 回归方程按一定规则佔计回归方程屮的参数(如最小二乘法);得出结果示分析 残差图是否有异常(个别数据对应

8、残芳过人,或残差呈现不随机的规律性等),若存在异常, 则检查数据是否有误,或模型是否合适等. 建立回归模型应特別注意以下问题:回归方程只适用于我们所研究的样本的总体; 我 们所建立的回归方程一般都冇时间性;样本取值的范围会影响回归方程的适用范围,一般不 能超过这个适川范围,否则将没有实川价值;不能期望回归方程得到的预报变量就是预报变 量的精确值 . 事实上,它是预报变虽的可能取值的平均值. n n 一兀)(必一)工 兀 n it 工(兀 - 兀尸xf-nx 2Z=1 /=! (2)比较两个不同回归模型的拟合效果 建立起回归模型后,利用残差分析的方法來比较两个不同回归模型的拟合效果?其方法 是:

9、对于给定的样木点3, 必), (兀2,儿),儿)而得到的两个回归方程: F = / (上心和9=g? 厉,分别计算两个冋归方程的残差平方和 聲二();?- 刃)与二 () 1-猪)2, 若e ( i)e(2) ,则外)二 / (上 反之, 仝=/(x, a)的拟合效果不如严) =g(x, b)的好. 我们也可以利用相关指数/?2来比较拟合效果,/?2取值越大,说明残差平方和越小,也就 是说模型的拟合效果越好. 四、独立性检验 在日常生活屮,经常会面临一些需要推断的问题. 在对这些问题作出推断时,我们不能仅 凭主观意愿作出结论,需要通过实验來收集数据,并依独立性检验的原理做出合理地推断. 若要推

10、断的论述为H、:“X与Y冇关系”,判断结论成立的可能性的方法是: (1)三维柱形图与二维条形图可用于粗略地判断两个分类变量是否有关系. %1在三维柱形图中,主对角线上两个柱形高的乘积ad与副对角线上两个柱形高的乘积枕 相差越大,两个分类变量X与Y有关系的可能性就越大 . %1在二维条形图中,可以估计图形满足x=x,的个体中具有y = y,的个体所占的比例 , 也可以估计满足条件X二兀2的个体中具有丫二必的个体所占的比例,两个比例相差越大,X 与Y冇关系的可能性就越大 . 但是三维柱形图和二维条形图无法精确地给出所得结论的可靠程 度,因而只做粗略估计,而不做具体运算. (2)可以利用独立性检验来考察两个分类变量是否有关系,并能较精确地给出这种判断 的可靠程度 . 具体做法是:根据观测数据计算检验随机变量K?的值匕其值越人,说明“X 与Y冇 关系”成立的口J能性越大 . 独立性检验的 - 般步骤是:假设两个分类变量X与丫无关系;计算岀K?的观测值k = - : 把k的值与临界值比较确定X与Y有关系的程度或无 (a + b )(c + d )(a + c )(b + d) 关系.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1