华中科技大学统计学课件.ppt

上传人:本田雅阁 文档编号:2796893 上传时间:2019-05-18 格式:PPT 页数:622 大小:4.97MB
返回 下载 相关 举报
华中科技大学统计学课件.ppt_第1页
第1页 / 共622页
华中科技大学统计学课件.ppt_第2页
第2页 / 共622页
华中科技大学统计学课件.ppt_第3页
第3页 / 共622页
华中科技大学统计学课件.ppt_第4页
第4页 / 共622页
华中科技大学统计学课件.ppt_第5页
第5页 / 共622页
点击查看更多>>
资源描述

《华中科技大学统计学课件.ppt》由会员分享,可在线阅读,更多相关《华中科技大学统计学课件.ppt(622页珍藏版)》请在三一文库上搜索。

1、统计学原理,?,唐跃志 tangyz_ Tel:027-62589359,参考教材,黄良文、曾五一 统计学原理。 贾俊平、何效群、金勇进 统计学。 佐和隆光 数量经济分析基础,统计学原理,学习目标,了解统计的作用。 掌握统计学的基本原理和基本方法。 使用统计方法,对所研究的对象,进行数量分析。,统计学原理,总目录,Ch1 统计学的对象和方法 Ch2 统计数据与统计调查 Ch3 数据的整理与描述 Ch4 统计分布的数值特征 Ch5 抽样和抽样分布 Ch6 统计推断 Ch7 相关与回归分析 Ch8 统计指数 Ch9 时间序列分析 Ch10 统计预测与预警分析,统计学原理,Ch1 统计学的对象和方法

2、,统计学原理,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),主要介绍: 统计与统计学,统计的历史,统计的作用,统计的特点,统计的基本方法。,Ch1 主要内容,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1 学习目的,1,掌握统计学的对象和性质 2,掌握统计学的基本范畴 3,掌握统计学的方法,Ch1 统计学的对象和方法 1.1 统计与统计学 1.

3、2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1 统计学的对象和方法,统计学原理,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),1.1 统计与统计学,1.1.1 统计与统计研究对象 1.1.2 统计(研究对象数据)的特点 1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5

4、统计学的产生和发展(new),返回,一、统计问题 在了解什么是统计之前,先看几个问题。 【例1-1】市场研究。面对变化多端、杂乱无章的市场数据,作为一个理性的投资者,最迫切最需要掌握的,理所当然就是市场的变化规律。但是,怎样去认识掌握这个多变的市场运动规律呢?这个市场规律,有什么特点?,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,【例1-2 】市场经济国家收入的负幂分配现象。也称为帕累托统计分布规律。意大利经济学家帕累托发现,各国的经济制度虽然不同,但收入分配却有共同的规律,它可以写成 N= N0 X -b,b0. N0其中为人口总数,X为收入水平,N为收

5、入不少于X之人数。 市场经济国家的收入分配,为什么存在帕累托分布规律?帕累托分布规律是怎样发现的?帕累托分布现象,是偶然的现象还是必然的现象?,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,【例1-3】市场经济国家收入的两级分化问题。帕累托的研究还发现,如果将社会人口由富人到穷人依次排列,占人口比重较大的低收入人口,没有取得与人口比重相应的社会收入,相反,占人口比重较小的高收入人口,却取得了社会收入的较大份额。这种现象也叫收入的两级分化。 为什么会出现收入的两级分化?帕累托分布规律与收入的两级分化是什么关系? 【例1-4】如何去发现存在于客观现象内部的、类似

6、于帕累托分布律的其他统计规律?等等。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,如何去发现任意领域的经验规律? (不知因果关系) 第1步 “猜测” ! 第2步科学总结! 第3步统计! “猜测”!科学总结! 统计!,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,二,统计 就是以客观现象的数量关系和数量特征为研究对象,通过搜集、整理、归纳和分析等手段,探索总结客观数据现象的内在规律性,以达到对客观事物的科学认识,并最终获得客观现象规律性表现的统计解释。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统

7、计研究对象,二,统计 统计是认识最直接、最有效的手段。 统计是科学总结的基础。 统计的用途很广。 统计学是经济研究最常用的工具。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,1.1.1 统计与统计研究对象,三,统计数据和统计定律 利用统计方法搜集到的现象数据,叫做统计数据; 利用统计数据归纳发现的经验规律,叫统计定律。 帕累托分布和收入的两级分化,就是统计归纳发现的经济现象的统计定律。 统计定律,是客观规律的近似反映。,Ch1 统计学的对象和方法 1.1 统计与统计学,四,统计研究对象 统计的研究对象: 是客观现象的数量关系和数量特征,客观统计数据。 客观

8、现象的统计数据,是统计研究的基础和出发点。没有统计数据,就无法进行统计研究。 统计的作用,就是利用统计数据,充分发现、提出现象的统计规律性,并试图问为什么有此规律。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,五,统计过程与统计学 统计学, 就是关于如何搜集、整理、归纳和分析客观数据的方法论科学。或者说,统计学是关于数据分析的科学,是关于研究现象数量表现的科学。 统计过程 搜集数据.整理数据.归纳数据.分析数据. 其中: 1,数据搜集:主要通过调查与实验,来获得所需要的数据。 2,数据的整理:通过数据的分组或者分类技术,获得现象的差异性认识。 3,数据的归

9、纳、展示:主要是利用图表技术,展示现象的特征特点。 4,数据分析:通过各种分析方法,寻找现象之间的相互联系。,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,六,统计的历史作用 英国的威廉配第(W.Petty,16231687),利用统计方法,研究了十七世纪中叶的英国、法国、荷兰的“财富和力量”对比; 英国的约翰格朗特(J.Graurt,16201674),则利用统计图表,研究并发现了一系列人口演变规律; 法国的拉普拉斯(P.S.Laplace,17491827),利用统计数据,推算了法国的人口数; 比利时的凯特勒(A.Quetelet,17961874) ,

10、应用概率统计,研究了犯罪、人口、寿命等社会问题的成因; 英国学者高尔顿(F.Galton,18761937)与皮尔逊 (K.Pearson,18571936) ,则利用了统计技术,研究并发现了遗传学领域的“回归”定律;,Ch1 统计学的对象和方法 1.1 统计与统计学,1.1.1 统计与统计研究对象,返回,统计学是研究数量表现的学科。但它的研究对象却有自身的特点。 数量性:统计数据是反映客观现实的具体数量,而非抽象的量。 总体性:统计数据是反映现象总体数量特征的数据,其研究及成果是一个总体研究,而非个别研究。 变异性:统计研究的是同类现象总体的数量特征;但这些总体单位的特征表现是有差异的;其差

11、异的来源是随机因素,而非特定原因。,1.1.2 统计(研究对象统计数据)的特点,Ch1 统计学的对象和方法 1.1 统计与统计学,返回,一、统计学的特点 统计学是研究数据数量表现的学科。 统计是一个定量研究。这个定量研究,具有客观、精确和可检验的特点,所以,统计方法就成为实证研究的最重要方法。 统计学可以应用于所有的领域。 在统计学基础上,发展起来的应用学科相当多。,1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学,二、统计学的作用 统计的作用,概括起来一般为以下三点: 1,理论安排。 几乎所有的科学实验,都把统计方法作为认知的有效手段。比如,在实验前,利用统计方法,

12、做出科学的实验安排。 2,理论归纳。 在实验中,依靠统计分析显示事物之间的关系及规律性。特别是,当人们对现象的规律一无所知或者知之甚少时,统计可以帮助我们找到的规律的线索,指明研究的方向,并利用规律,解决前进过程中出现的新情况新问题。 3,理论检验。 在实验后,对实验结果做出解释,并检验它的正确性。,1.1.3 统计学的作用,Ch1 统计学的对象和方法 1.1 统计与统计学,返回,1.2 统计学的分科,1.2.1 描述统计学与推断统计学 1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new)

13、 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、描述统计与推断统计 统计学早期的研究方法,侧重于对现象总体数量特征的描述和对比,称为描述统计学。 20世纪20年代以后,其研究方法发展为,以随机抽样为基础,对总体数量特征的推断,称为推断统计学。,1.2.1 描述统计与推断统计,Ch1 统计学的对象和方法 1.2 统计学的分科(new),二、描述统计与推断统计的关系,1.2.1 描述统计与推断统计,Ch1 统计学的对象和方法 1.2 统计学的分科(new),返回,一、理论统计学与应用统计学 理论统计学,是把研究对象一般化、抽象化,以概率论为基础,对统计方法加以论证。理论统计

14、学的中心内容是统计推断,实质上是用归纳方法,研究随机变量的一般规律。例如,统计分布理论,统计估计与假设检验理论,相关与回归分析,方差分析,时间序列分析,随机过程理论,等等。 应用统计学,是从研究领域和专门的问题出发,针对研究对象的性质,采用适当的指标体系和统计方法,解决所要研究的问题。例如,工程统计,医学统计,社会统计,经济统计,等等。,1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.2 统计学的分科(new),二、理论统计学与应用统计学的区别: 第一,理论统计学以方法为中心,建立统计指标体系,并在各种方法项下阐明所能解决的问题; 方法问题. 应用统计学则以问题为中心,建立

15、专门的统计指标体系,并在各种问题项下阐明所能解决的问题。 问题方法. 第二,理论统计学从事随机变量的数学分析;应用统计学不仅从事数量分析,还要进行质量分析。,1.2.2 理论统计学与应用统计学,Ch1 统计学的对象和方法 1.2 统计学的分科(new),返回,1.3 统计学与其他学科的关系,1.3.1 统计学与数学的关系 1.3.2 统计学与其他学科的关系,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、统计学与数学的关系 统计学几乎可以应用于所有领

16、域。统计学是研究数据数量表现的学科,但它与数学有本质的区别与联系。 二、统计学与数学的联系: 统计学使用大量的数学知识。 数学为统计理论、统计方法的发展提供了数学基础。 不能将统计学等同于数学。,1.3.1 统计学与数学的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),三、统计学与数学的区别: 数学研究的是抽象的数量关系,统计学研究具体、实际的数量关系; 数学研究的是没有量纲或者单位的抽象数,统计学研究具体实物或者有单位的数据; 统计学与数学的逻辑方法不同, 数学使用的是演绎方法; 统计学使用的是演绎与归纳相结合的方法,但以归纳方法为主。,1.3.1 统计学与数学的

17、关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),四、数学与统计学的逻辑体系,1.3.1 统计学与数学的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),返回,一、统计学与与其他学科的关系 ,1.3.2 统计学与其他学科的关系,Ch1 统计学的对象和方法 1.3 统计学与其他学科的关系(new),返回,1.4 统计学的方法,1.4.1 大数定律的方法论意义 1.4.2 统计研究基本方法 1.4.3 理论假设与现实统计的距离,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new

18、) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、大数定律: 统计研究现象总体的数量特征,所用方法与数量的总体性有关,其依据是大数定律。 大数定律,亦称大数法则;它是指大量随机现象的平均结果一定是稳定的。比如:在一定时期内,每个人的身高是不一样的;但是社会人群的平均身高值,却会在相当长的一段时间内,维持一个比较稳定的数值。,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,二、大数定律的几何解释 研究方向,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,三、大数定律的方法论意义 现象总体的某种规律,只

19、有该现象总体的数量足够多的时后,才能显现出来; 现象的某种总体规律,通常以平均数的形式表现出来; 所研究现象总体包含的单位数越多,平均数就越能正确的反映这些现象的规律性; 各单位的共同倾向决定着平均数的水平,而单位对平均数离差的影响则不大。,1.4.1 大数定律的方法论意义,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,一、统计学的基本方法 统计研究方法,主要有:实验设计,大量观察,统计描述,统计推断。其中,统计推断,又包括参数估计和假设检验。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,二、实验设计: 就是设计实验的合理程序,使得搜集到的数据满足

20、统计分析的需要。 实验设计三原则: 重复性原则:即允许在相同条件下重复进行多次实验。 随机性原则:在实验设计中,对实验对象的分配和实验次数都是按随机安排的。 区组化原则:利用类型分组技术,对实验对象按有关标志顺序排队,然后依次将各单位随机地分配到各组,使各组组内标志值的差异相对扩大,而组间的差异相对的小。 具体方法: 室内实验法; 市场实验法;,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,三、大量观察法: 就总体中的全部或者足够多的单位进行观察,并加以综合研究。 具体方法: 普查; 抽样调查; 统计报表调查; 重点调查。,1.4.2 统计学的基本方法,Ch1

21、 统计学的对象和方法 1.4 统计学的方法,四、统计描述: 对数据进行登记,审核,整理,归类,计算出能反映总体数量特征的综合指标,并加以分析,从中抽出有用的信息,用表格和图像表示出来。 具体方法: 分组法:研究总体差异。 综合指标法:用指标反映特征。 统计模型法:用数学方程模拟客观现象。 具体内容: 搜集数据; 整理数据 ; 描述数据特征; 找出数据的基本规律。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,五、统计推断: 以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理方法。 具体方法: 参数估计法:在一定置信(风险)下,用样本数据去估计总体数

22、量特征。 假设检验法:在一定置信标准(风险假设)下,用样本数据去检验总体数量特征。如果样本数据满足假设要求则假设得证;反之,否定假设。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,六、统计方法使用的一般原则: 一个具体的统计问题,应该使用何种统计方法,与统计问题所处的研究阶段有关。 统计研究过程的各个阶段,从统计资料的搜集、数据的整理汇总,以至统计分析检验,都有专门的方法。 在资料搜集时,对于无法从实验取得资料的现象,一般应用大量观察法;对于可以通过实验取得资料的现象,一般应建立在合理的试验设计基础上;在数据的整理和汇总时,则多使用统计描述法;而在统计分析和

23、检验时,则主要使用统计推断法。,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,七、统计方法使用原则图解:,1.4.2 统计学的基本方法,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,一、理论与现实的距离问题: 统计分析的前提是,假定现象规律和数据规律存在高度的对称性。在此前提下,才有可能通过部分数据的归纳,总结出现象的规律性;并以此为依旧,检验原有假设的正确与否。但事实上,实证结果与理论假设常常存在较大的偏差。 是什么原因造成如此大的偏差呢?这里的解释无外乎有两种:一是统计数据的代表性不够,出现了通常讲的统计假象;二是理论本身就存在不足,或者干脆有错

24、误,因此,理所当然就存在偏差问题。因此,从这个意义上说,统计可以对理论进行实证检验。,1.4.3 理论假设与统计现实的距离,Ch1 统计学的对象和方法 1.4 统计学的方法,返回,1.5 统计学的产生和发展,1.5.1 政治算术社会经济统计 1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),返回,一、政治算术社会经济统计的历史 政治算术学派,产生于17世纪的英国。该学派代表人物,是威廉配第(W.Petty,1623-1687)和约翰格

25、朗特(J.Graurt,1620-1674)。,1.5.1 政治算术社会经济统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),二、威廉配第(W.Petty,1623-1687) 在政治算术一书中,开天辟地地使用数量对比的方法,分析了十七世纪中叶,英国、法国、荷兰三国的“财富和力量”状况,论证当时英国的国际地位并不悲观。因为他在政治算术中提出了“劳动价值论”的观点,马克思称他为“政治经济学之父”;又因为他第一个用数字、重量和尺度,作为论据的方法来论证想说明的问题,又被后人称为统计学的创始人。,1.5.1 政治算术社会经济统计,Ch1 统计学的对象和方法 1.5 统计学的产生

26、和发展(new),三、约翰格朗特(J.Graurt,1620-1674) 通过大量的观察,研究并发现了一系列人口统计规律。 如,男婴出生多于女婴,基本上为14:13;男性的死亡率高于女性;新生儿在大城市的死亡率较高;一般疾病和事故的死亡率较稳定,而传染病的死亡率波动较大;等等。在对死亡表的自然和政治观察中,格朗特根据当时伦敦发表的人口公报,分析了人口出生和死亡的关系,如性别比例关系,不同死因的死亡人数占死亡人数的比重等。在具体分析方法中,他采用了具有现代统计学意义的数量分析法;在方法论上,开创了现代统计分析方法的先河。因此被认为是统计学的正宗。,1.5.1 政治算术社会经济统计,Ch1 统计学

27、的对象和方法 1.5 统计学的产生和发展(new),返回,一、概率论数理统计的历史 政治算术学派,以社会经济现象为研究对象,属于实质性科学,至于统计方法,仅仅属于所使用的工具而已。到了18世纪,作为数学分支的概率论,被引入统计学,形成了数理统计学派,从而使统计学方法产生了重大进步。 数理统计,是以随机现象为研究对象。它是对统计方法的科学性进行论证的一个专门性学科。 代表人物有法国数学家拉普拉斯(P.S.Laplace,17491827) ,比利时统计学家阿道夫凯特勒(A.Quetelet,17961874) ,。,1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发

28、展(new),二、拉普拉斯(P.S.Laplace,17491827) 他以大数定律为桥梁,将概率论与政治算术联系起来,通过对法国17991802年间30个县市人口的抽样资料,推算了法国的人口数,并指出其可能的误差区间,这在统计方法论上,具有开创性意义。 三、阿道夫凯特勒(A.Quetelet,17961874) 凯特勒发展了大量观察法。凯特勒指出,随机偶然现象中存在必然规律,这些规律可以通过大量观察、实验显示出来,其具体存在形式就是概率。凯特勒还广泛应用概率论,研究社会问题,如犯罪、人口、寿命等问题。由于其在应用数理统计在实际工作中的贡献,有人推崇他为现代统计学之父。,1.5.2 概率论数理

29、统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),四、数理统计方法的发展 在社会科学和自然科学等各个领域得到了广泛应用。数理统计学早期的研究方法,侧重于对现象总体数量特征的描述和对比,称为描述统计学。20世纪20年代以后,其研究方法发展为,以随机抽样为基础,对总体数量特征的推断,称为推断统计学。,1.5.2 概率论数理统计,Ch1 统计学的对象和方法 1.5 统计学的产生和发展(new),返回,Ch1 内容小结,1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),Ch1

30、 统计学的对象和方法,Ch2 统计数据与统计调查 介绍如何把一个研究对象,抽象成一个数据集。以及通过何种方法去获得所需要的数据。,下一章,Ch1 统计学的对象和方法 1.1 统计与统计学 1.2 统计学的分科(new) 1.3 统计学与其他学科的关系(new) 1.4 统计学的方法 1.5 统计学的产生和发展(new),思考与练习,1.1、什么是统计?统计有何作用? 1.2、统计学的研究对象是什么?统计研究对象有何特点? 1.3、什么叫统计定律?统计定律在认识中有何作用? 1.4、什么是统计工作过程?其包含哪些内容? 1.5、如何理解统计学与数学的关系? 1.6、什么是大数定律?大数定律的方法

31、论意义是什么? 1.7、什么是实验设计?实验设计要遵循哪些原则? 1.8、什么是统计分组?什么是统计模型? 1.9、什么是统计推断?它和统计描述的关系任何? 1.10、结合统计工作过程,简述统计方法使用的基本原则。 1.11、从历史的发展来看,统计学的性质有哪些变化? 1.12、如何理解理论假设与统计现实的距离问题?,Ch1 统计学的对象和方法,Ch3 统计的整理与描述,统计学原理,3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),介绍如何整理数据,以及利用何种技术描述整

32、理的结果。 统计整理的目的,就是要把无规的数据变成有规的数据。 数据整理,通常包括:数据的预处理、分类或者分组、汇总等内容,它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 有规的数据的描述,通常是用统计图和统计表来完成。,Ch3 主要内容,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),Ch3 学习要求,1,掌握统计整理的程序 2,掌握统计分组(类)技术 3,掌握统计图(表)技术,Ch3 统计的整理与描述 3.1 统计数据的预处理(

33、new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),Ch3 统计的整理与描述,3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),统计学原理,3.1 统计数据的预处理,3.1.1 数据的审核与筛选 3.1.2 统计数据的排序 3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描

34、述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),返回,一,统计整理综述 统计整理的目的: 无规的数据变成有规的数据。 数据整理: 数据的预处理分类或分组汇总编制统计图表。 它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 数据的审核和筛选,是统计整理的基础。 有规的数据的描述,通常是用统计图(表)来完成。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,审核与筛选目的 以保证数据的质量,为下一步的整理分析打好基础。 从不同的渠道取得的统计数据,其审核的内容和方法有所不同; 不同类型的统计数据,在审核内容和方法上有

35、所差异。 数据的审核与筛选,包括原始数据和第二手数据的审核与筛选。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),三,原始数据审核 审核内容:完整性和准确性。 完整性审核,主要是检查应调查的单位是否有遗漏,所有的调查项目或指标是否填写齐全等。 准确性审核,主要包括两个方面:一是检查数据资料,是否真实地反映了客观实际情况,内容是否符号实际;二是检查数据是否有错误,计算是否正确等。 审核数据准确性的方法,主要有逻辑检查和计算检查。 逻辑检查,主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无矛盾。逻辑检查,主要用于品质数据的审核。

36、 计算检查,是检查调查表中的各项数据在计算方法上有无错误。计算检查,主要用于数值数据的审核。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,第二手数据审核 内容:完整性和准确性,适用性和时效性。 首先要弄清数据的来源、数据的口径以及有关的背景材料,以确定这些数据,是否符合分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。 对数据的时效性进行审核,有些时效性很强的问题,如果所取得的数据过于滞后,就失去了研究的意义。 一般来说,应尽可能使用最新的数据。数据经过审核后,确认适合实际需要,才能进行进一步的加工整理。,3.1.1 数据的审核与筛选

37、,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),五,数据筛选 对审核过程中发现的错误应及时纠正。当数据中发现的错误不能纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。 数据筛选,包括两方面内容:一是将某些不符合要求的数据或者有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。 数据的筛选,在市场调查中有特殊的意义。,3.1.1 数据的审核与筛选,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,一,数据的排序 数据的排序,就是按一定的顺序将数据进行排列。简言之,就是对于一个给定的序i和给定序列

38、 xi : i=1,2,n. (3.1.1) 如何确定一组具体的数据 Y1 ,Y2 ,Y3 , ,Ym-1 ,Ym ;, n m. 的某一个数值,在这个xi序列中的位置。 一般地,值相同数据占据相同的位置,值不同数据则有不同的序。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,排序的目的 通过排序,发现数据的一些明显特征和趋势,找到解决问题的线索。除此外,排序还有助于对数据检查纠错,为重新归类或者分组提供依据。 在某些场合,排序本身就是分析的目的之一。例如,了解谁是中国家电生产的三巨头,对于家电生产商而言是非常重要的信息。美国财富杂志每年都要排出

39、世界500强企业,通过这一信息,经营者不仅可以了解自己所处的地位,清楚自己的差距,还可以了解竞争对手的状况,从而有效地制定企业发展的规划和战略目标。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),三,数据的排序方式 数据序列,一般有三种排列,即递增序列、递减序列和随机序列。 递增序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.2) 递减序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.3) 随机序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.4)

40、 即各个xi的i只表示它们是不同的数值,共有n个数据,除此以外,别无其他的意思。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,数据的一般排序方式 一般序列,主要是递增序列或随机序列。 排序后的标志变量,通称为标志变量序列。 标志变量序列一般是指递增序列。它一般表示是 xi : i=1,2,n. (3.1.5) 其中:i代表序号,通常为升序自然数排列。 对于标志变量序列,当然有, x1 x2 x3 x4 x5 xn-1 xn ; 。,3.1.2 统计数据的排序,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,一,排序的方法 数

41、据的排序,首先要确定排序的标志,然后根据标志的特点,确定排序的方法。 原则是:根据标志值的大小,来确定数据序的方向,然后根据序的方向,确定某一个数据在这个序中的位置。简言之,就是 先确定标志序, 然后确定数据序。 不同类型的数据,其排序方法是不同的。 无论是定性数据还是数字型数据,排序均可借助于计算机完成。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),二,定类数据的排序(1) 由于定类数据值本身,并不是一个数值,而是一个文字数据,定类数据的值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系,因此,定类数据的排序,不能完全按值的大小

42、确定排序的方向。 通常的做法是,按字母做升序或者降序排列,或者按笔画或者其他什么约定,做升序或者降序排列。 总而言之,定类数据的排序,相对比较自由。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-1】为了研究广告市场的状况,某公司在某城市随机调查了200个市民,其中的一个问题是:“您比较关心下列哪一类广告?” 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告。 试对其进行排序。 解:这里数据为200个居民的回答数据,共200个。这200个数据的排序,应先选择排序标志。由于这200个数据均从属于“广告类型”变量集,即 商品广告,

43、服务广告,金融广告,房地产广告,招生招聘广告,其他广告 显然,i=1,2,3,4,5,6。因此,可以选择“广告类型”变量为排序标志, “广告类型”为定类变量,不同类型的广告就是变量值。 由于广告变量值并不是一个数字,而是一个文字数据,广告变量值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系,因此,可以指定 x1= “商品广告”,x2=“服务广告”,x3=“金融广告”, x4=“房地产广告”,x5=“招生招聘广告”,x6=“其他广告”。 根据标志序列xi,进一步确定200个回答数据的归属,就就可以确立每一个回答数据在xi中的位置 。,3.1.3 数据的排序方法,Ch3 统计的

44、整理与描述 3.1 统计数据的预处理(new),三,定序数据的排序(1) 定序数据依然是文字数据,虽然定序数据的值之间,不存在绝对的大小关系,但存在一个类似大小的优于关系。 优于关系可以用“”表示,它基本与“”等价。 即定序数据序列xi,都存在如下序关系 x1 x2 x3 x4 x5 xn-1 xn ; 且这种序关系常常与人们的价值观一致。 因此,可以根据人们的价值观,确定定序数据的序位置。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-2】在一项有关住房问题的研究中,研究人员在某城市随机调查了300户居民,其中的一个问题是“您对您目前的住房

45、状况是否满意?” 非常不满意,不满意,一般,满意,非常满意。 试对其进行排序。 解:这里数据为居民的回答数据,共300个。这300个数据的排序,应先选择排序标志。由于这300个数据,均从属于“满意程度类型”变量集,即 非常不满意,不满意,一般,满意,非常满意 显然,i=1,2,3,4,5。 因此,可以选择“满意程度”为排序标志, “满意程度”为定序变量,不同类型的满意值就是变量值。但是这个定序变量,显然有 非常不满意 不满意 一般 满意 非常满意 于是,可令 x1=“非常不满意”,x2=“不满意”,x3=“一般”, x4=“满意”,x5=“非常满意”。 再确定这300个数据的归属,就可完成它们

46、的排序。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),四,定距数据和定比数据的排序 定距数据和定比数据,都是数字数据。数字数据的数据值之间,一般存在大小的序关系。 因此,定距数据和定比数据的排序,可以根据标志值的大小,来确定数据序的方向,然后根据序的方向,确定某一个数据在这个序中的位置。 定距数据和定比数据的排序,一般按递增方法排序。 按递增要求排序后的数据,也称为顺序统计量。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),【例3-3】某班学生共55人,每个人的兴趣、爱好各异,初步判断与他们的性别和年龄有

47、关。从年龄这个角度分组,发现这55人的年龄,主要集中在 “18,19,20,21,22。” 岁之间。试对其进行排序。 解:这里数据为55个学生的兴趣、爱好数据,共55个。由于这55个数据的结果与年龄有关。因此,数据的排序标志为“年龄”, “年龄变量”为排序标志变量,不同的年龄值就是变量值。即 18,19,20,21,22 显然有 18 19 20 21 22 。 于是,可令 x1=18,x2=19,x3=20,x4=21,x5=22。 再确定这55个数据的归属,就可完成它们的排序。,3.1.3 数据的排序方法,Ch3 统计的整理与描述 3.1 统计数据的预处理(new),返回,3.2 品质数据的整理与描述,3.2.1 定类数据的整理与描述 3.2.2 定序数据的整理与描述,Ch3 统计的整理与描述 3.1 统计数据的预处理(new) 3.2 品质数据的整理与描述(new) 3.3 数字数据的整理与描述(new) 3.4 统计分组(类) 3.5 统计整理的应用(new),返回,3.2.1 定类数据的整理与描述,一、分组与分类 数据经过预处理后,可进一步做分类或者分组整理。 所谓分类(组),就是值相同的数据归为同一个组,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1