第五章时间数列.ppt

上传人:本田雅阁 文档编号:3118745 上传时间:2019-07-12 格式:PPT 页数:292 大小:2.11MB
返回 下载 相关 举报
第五章时间数列.ppt_第1页
第1页 / 共292页
第五章时间数列.ppt_第2页
第2页 / 共292页
第五章时间数列.ppt_第3页
第3页 / 共292页
第五章时间数列.ppt_第4页
第4页 / 共292页
第五章时间数列.ppt_第5页
第5页 / 共292页
点击查看更多>>
资源描述

《第五章时间数列.ppt》由会员分享,可在线阅读,更多相关《第五章时间数列.ppt(292页珍藏版)》请在三一文库上搜索。

1、第五章 时间数列,第一节 时间数列概述,时间数列将反映某一现象数量变化的同类指标,按时间的先后顺序排列,又称为动态数列,可简称数列,记为 简记为 构成 现象所属时间 :t i 要素 现象与该时间对应的指标值 :a i,时间数列的作用,揭示现象发展的动态规律 可以认识现象发展的状态、速度、结果和趋势,从而反映事物的动态变化规律 对未来发展状况预测,为管理和决策提供依据,时间数列的种类,绝对数时间数列排列的指标是绝对数(总量指标) 相对数时间数列排列的指标是相对数 在平均数时间数列排列的指标是平均数,绝对数时间数列的分类,分为时期指标数列和时点指标数列两类,时间数列的编制原则,指标的经济内容应当一

2、致 总体的范围应当一致 对时期数列而言,各项的时期长短必须一致 对时点数列而言,各项间的时间间隔可以不等 指标的计算方法、计量单位、计算价格等一致,第二节 时间数列的水平指标,发展水平将时间数列中每一项的指标值称为相应时期的发展水平 时间数列中第一项称为最初水平,最后一项称为最末水平,其余各项称为中间水平,二、平均发展水平,平均发展水平是时间数列中各期发展水平的平均值,又称为序时平均数或动态平均数 表示现象随着时间的变化而变化的一般水平 是现象在不同时间,不同水平上的平均,(一)绝对数数列的序时平均数,1. 时期数列的序时平均数常采用算术平均法计算 2. 时点数列的序时平均数 时点数列中任意两

3、项的值不能相加,因此,一 般不能简单地采用算术平均法,(1)连续时点数列,连续时点数列将每一个时点指标值都作排列所形成的数列 此类数列的序时平均数也采用算述平均法,(2)间断时点数列 等间隔时点数列 该数列的序时平均数公式 (5-1) 异间隔时点数列 该数列的序时平均数公式 (5-2),首末斩半法 简单序时平均,“加权序时平均法”,(二)相对数数列的序时平均数,设 ,要计算 基本方法是:,相对数列的每一项,分子数列,分母数列,序时平均数,序时平均数,对比,(三)平均数时间序列的序时平均数,由静态平均数所组成的平均数时间数列,实际上是两个绝对数时间数列相应项对比而形成的 分子数列是标志总量数列,

4、分母数列是总体单位总量数列 计算方法:与相对数时间数列的序时平均数的计算方法完全相同,只是注意标志总量数列多属于时期数列,而总体单位总量数列多属于时点数列,由动态平均数所组成的平均数时间数列的序时平均数的计算方法: 在时期相等时,直接采用简单算术平均计算; 在时间不相等时,则以时期作为权数,采用加权算术平均法计算。,第三节 时间数列的速度指标,反映现象发展变化速度的指标有:,增长量 发展速度 增长速度 平均发展速度 平均增长速度。,增长量,增长量数列中两项指标值之差 从绝对数角度反映现象发展变化的程度 增长量=报告期水平-基期水平 根据基期不同,增长量分为: 累计增长量=报告期水平-某一固定基

5、期水平 逐期增长量=报告期水平-上一期水平,发展速度,发展速度是报告期水平与基期水平之比 表示报告期水平是基期水平的若干倍,常用百分数表示,常简记为 v 根据采用的基期不同,发展速度可分为,对某一固定水平来说,对前一期水平来说,增长速度,增长速度是增长量与基期水平之比,说明报告期水平比基期水平增长了若干倍(或百分之几),常记为,增长速度的分类,根据基期不同,增长速度分为定期增长速度和环比增长速度两类,名义发展速度、名义增长率对价值量指标计算发展速度、增长速度时,未剔除价格因素影响计算出的值 实际发展速度、实际增长率 剔除价格因素影响后计算出的值,为了衡量相对变化的绝对效果,常使用每增长百分之一

6、的绝对值,常将其记作 % 该指标表示增长速度每变化一个百分点,现象在数量上变化的绝对数额。,平均发展速度,平均发展速度时间数列中各期环比发展速度的平均数,用以表明现象在一个较长时期内发展变化的平均程度。 两种计算方法: 几何平均法 高次方程法,(一)几何平均法,几何平均法又称水平法,其推导过程如下: 从而,(二)高次方程法,即 求解式中的高次方程即可得平均发展速度,平均增长速度=平均发展速度-1 在运用上述速度指标时要注意如下问题: 第一,要根据现象的变化特点和研究目的确定基期 第二,根据事物发展变化的特征,必要时用分段平均速度补充说明总平均速度 第三,应将发展水平、增长量、发展速度、增长速度

7、、平均发展速度、平均增长速度等指标结合起来共同说明现象的数量变化特征。尤其应当注意相对变化的绝对效果,第四节 动态趋势分析,时间是自变量,并记作t;现象的数量表现是因变量,在此用Y表示 影响时间数列变动的因素分解为: 长期趋势(T) 季节变动(S) 循环变动(C) 不规则变动(I),四种趋势,长期趋势现象由于受基本因素的影响,在较长时间内所表现出来的持续性的变化趋势 季节变动现象受自然界的季节变化或社会政治经济等因素的影响,在一年或较短的时间内所呈现的周期性的波动 循环变动现象以若干年为周期的扩张和紧缩交替的波动 不规则变动现象受偶然因素的影响而发生的难以预测的变动,两种假定模型,当四种因素各

8、自独立地作用于现象时,则认为现象的数量变化由各因素相加而成 加法模型: Y=T+S+C+I 当四种因素彼此间相互作用,则认为现象的数量变化由各因素相乘而成 乘法模型: Y=TSCI 一般认为,乘法模型比加法模型更为合理,前者更为切合实际。,长期趋势分析,长期趋势分析的目的 1.根据时间数列资料,找出现象在过去一段相当长的时期内持续向上增长或向下降低的发展趋势; 2.从数量上研究现象发展的规律性,据此建立数学模型,对现象的未来发展进行预测; 3.测定长期趋势,暂时消除原时间数列中长期趋势的影响,以便更好地研究季节变动等,时距扩大法-方法之一,时距扩大法是将原来的时间数列中较小时距单位的若干项的值

9、予以合并,得出扩大了的较大时距单位的数值。 目的:消除现象在较小的时距单位所受到的影响,从而找出现象变化的长期趋势 时距扩大法仅适用于时期数列,而不能用于时点数列 扩大的时距取决于现象的特点和研究目的 对同一时间数列,每次扩大的时距应相等,以保证新数列各项间的可比性,序时平均法-方法之二,先将时间数列的时距扩大 计算扩大时距后各项的序时平均数 据此序时平均数构成的新数列找出长期趋势 序时平均法适用于时期数列、时点数列,移动平均法-方法之三,采用某一时距,从数列的第一项开始取数项计算序时平均数,并依次往下移动,由此得到一个新数列(又称修匀数列)。据此新数列可以找出现象发展的长期趋势,设 为时间数

10、列中时间t的观察值, 是时间数列中时间为t的一次移动平均数,n为移动时距, ,则时间为t的一次移动平均数是: 为了计算简便,在移动时距n比较长时,上式化为:,应用移动平均法时的注意事项,适当确定移动的时距 移动的时距不能太短或太长 实际中多作奇数项移动平均,半数平均法-方法之四,原理:依据的是几何学中两点确定一条直线 步骤:1.它是先将数列分为相等的两部分(如数列为奇数项,可丢掉中间一项) 2.然后由各部分确定一个点,据此两点确定一条趋势直线 3.最后根据趋势直线说明现象的长期趋势 半数平均法适用于现象近似呈线性变化趋势的时间数列,据前半部分数列确定的点记为( , ) 据后半部分数列确定的点记

11、为( , ) 其中 , 是前半部分和后半部分的均值 , 是前半部分和后半部分指标的均值 然后将两点的值代入两点直一方程: (5-6),作代数变形后,将趋势直线方程记为:,最小平方法配合趋势直线-方法之五,当现象的数量变化近拟呈线性趋势时,利用最小平方法(又称最小二乘法)配合的趋势直线是一条最优拟合的直线 设趋势直线是: 基本原理:要求实际值y(数列中各项的值)与理论值 (估计值)之间的离差平方和最小 即要求:,令,整理得如下标准方程组(正规方程组):,因此,适当地给时间编码,使 ,方程(5-8)和(5-9)可得到简化,由此得到简捷计算法。 若项数n是奇数,则取中间位置为0,编码如下: 若项数n

12、是偶数,则取中间位置为0,中间两项分别取-1,1,编码如下:,如果作上述编码,则标准方程组(5-8)和(5-9)可化为:,在据时间数列资料配合趋势直(线)线方程时,要事先对模型形式加以判断。判断的方法有: 第一,散点图法。将时间数列各项的值描在平面直角坐标系中,由此得到散点图 第二,据指标值特征加以判断。若时间数列逐期增长量(又称为一次差)大体相等,可配合趋势直线: 若二次差(即一次差数列的逐期增长量)大体相等,可配合抛物线: 若时间数列环比发展速度大体相等,则配合指数曲线: 或,对该方程的拟合精度进行评价 计算估计标准误差,(5-16) 估计标准误差各拟合值(理论值)对实际值y的平均偏离程度

13、: 估计标准误差的值愈小,表明趋势方程拟合精度愈高 估计标准误差的值愈大,表明趋势方程拟合精度愈低,此时应配合其他类型直(曲)线或不能用某种简单直(曲)线说明现象的变化趋势,季节变动的分析,目的:认识现象受季节变动影响的规律性,据此为管理与决策提供依据,第六章 统计指数,第一节 统计指数的概念与作用 统计指数的概念,统计指数简称指数,是经济学中常用的一个概念 广义的指数是表示各种数量对比关系的相对数 狭义的指数是表示现象的动态变化的相对数 统计指数的作用: 指数能综合反映现象的变动方向和变动程度 指数可用于作因素分析 指数可用于研究现象在较长时间内的变动趋势,指数的分类,(一)根据指数包括的范

14、围不同 个体指数反映个别事物的动态变化 总指数则反映由多种事物构成的复杂现象总体的综合变动情况 (二)根据总指数的编制方法不同 综合指数是指反映由多种事物构成的不能直接相加的复杂现象总体变动情况的指数 平均数指数则是综合指数的代数变形,利用平均数指数可以由个体指数求总指数,(三)根据用于编制综合指数的指标的性质不同 数量指标指数是反映数量指标变化状况的指数(如产量指数、销售量指数等等); 质量指标指数是反映质量指标变化状况的指数(如价格指数、单位成本指数等等),(四)根据编制指数数列时所采用的基期不同,定基指数是将基期固定在某一时期的指数(如我国现行综计资料公布各年对1978年的定期价格指数)

15、,说明现象在一段较长时期内总的变化状况 环比指数则是反映现象每一期与上一期相比变动情况的指数,说明现象逐期的变化状况,(五)根据指数所反应的时间状况不同,动态指数反映现象在时间上的变化情况,也就是我们前面讲的狭义的指数 静态指数也就是同一时间条件下不同单位或不同地区同一经济量的不同数值的对比(即地区比较指数),2 统计指数的编制方法,一、个体指数的计算方法 个体指数的计算十分简单,它是该现象报告期水平与基期水平之比,即发展速度 个体指数,二、综合指数的编制方法,(一)数量指标指数的编制 以编制销售量指数为例 计算三种商品的销售量总指数,分析:因为这三种商品的性质不同,计量单位也不同,它们的销售

16、量相加无实际意义。 由于 销售量价格=销售额 我们称价格为同度量因素。同度量因素是指能将不可相加的现象转化为可以相加的因素。 在考虑销售量的变动时,常常将价格这个同度量因素固定在某一时期(如基期或报告期)。固定在不同时期就可得到不同的指数数值。在我国的统计实践中,常常将价格固定在基期。于是我们得到销售量总指数公式如下:,解:利用上述销售量总指数公式 表明三种商品的销售量总的来讲增长了26.56%。 (元) 这个差值表明,按照基期价格计算,由于三种商品的销售量增长26.56%,而使销售额增加17000元。 通则:在编制数量指标指数时,常将同度量因素固定在基期,,(二)质量指标指数的编制,例2试利

17、用表6-2 中三种商品的销售资料,计算三种商品的价格总指数。 分析:要计算三种商品的价格总指数,不能将它们报告期的价格之和与基期的价格之和相比求得,因这三种商品性质不同,计量单位也不同,它们的价格相加无实际意义。 销售量价格=销售额 三种商品的销售额可以相加,因此销售量在这里起着同度量因素的作用。,在考虑价格变动时,常常将销售量这个同度量因素固定在某一时期(如基期或报告期)。固定在不同时期可得到不同的指数数值。在我国的统计实践中常常将销售量固定在报告期。于是我们可得到价格总指数公式如下: 通则2:在编制质量指标指数时,常将同度量因素固定在报告期。,解:利用上述价格总指数公式 表明三种商品的价格

18、总的来讲增长了17.9%。 这个差值表明,按照报告期销售量计算,由于三种商品的价格增长26.56%,而使销售额增加14500元。 通则:在编制质量指标指数时,常将同度量因素固定在报告期,编制综合指数的基本步骤,(1)根据经济关系式确定同度量因素 (2)固定同度量因素的时间 (3)据指数定义编写出综合指数公式 这种编制指数的方法常被称为加权综合法,由此求得的指数称为综合指数,(三)指数的其他几种编制方法,1. 基期加权综合法 同度量因素固定在基期水平拉氏指数公式 拉氏物价指数公式 拉氏物量指数公式,2. 报告期加权综合法 同度量因素固定在报告期水平上帕氏公式 帕氏物价指数公式: 帕氏物量指数公式

19、:,3. 交叉加权综合法 由此得到的交叉加权指数公式称为马埃公式 物价指数公式: 物量指数公式:,4. 几何平均综合法(理想公式) 对拉氏和帕氏两种指数公式求其几何平均值,则得到消除偏差的理想公式 物价指数 物量指数,5. 固定加权综合法 将同度量因素既不固定在基期又不固定在报告期,而是固定在某一特定时期 固定加权指数公式又称为扬格公式 扬格物价指数公式 扬格物量指数公式,第三节 平均数指数,将综合指数公式稍作变形,就可以据个体指数求出总指数,于是我们可以得到平均指数总指数的另外两种表现形式加权算术平均数指数和加权调和平均数指数 一、加权算术平均数指数 例 表6-3是三种产品的基期产值与个体产

20、量指数 试求解这三种产品的产量总指数,解:由基本指数公式,有 (6-4) 将表6-3中的数据代入(6-4)式有: 公式(6-4)右端类似加权算术平均数 简称算术平均数指数,二、调和平均数指数,例2 某企业三种产品的有关资料如表6-4所示 表6-4 三种产品的资料 试求这三种产品的价格总指数,解:价格总指数 (6-5) (6-6) 于是有:,公式(6-6)右端类似加权调和平均数 加权调和平均数形式的指数,简称调和平均数指数。它只是前面所讲物价综合指数公式的代数变形,没有独立存在的意义,三、固定权数指数公式及其应用,在求其他指标的指数时,亦可用固定权数 对个体(或类)指数作平均。于是有: 加权算术

21、指数 (6-7) 加权调和指数 (6-8),*四、指数数列,指数数列就是将各个时期的一系列指数按时间的先后顺序排列起来形成的一列数 指数数列按照采用的基期的不同可分为: 定基指数数列:采用同一固定时期为基期 环比指数数列:各时期指数均以上一期为基期,(一)定基指数数列,物价指数数列: (6-9) 物量指数数列: (6-10),(二)环比指数数列,物价指数数列: (6-11) 物量指数数列: (6-12),(一)应用价格指数测定通货膨胀率,通货膨胀率一般价格水平的持续上涨,也就是指流通中的货币量超过商品和劳务在流通中所需要的货币量,从而引起货币贬值和价格水平上涨 1. 若价格指数是环比指数,则:

22、 2. 若价格指数是定基指数,则: 若通货膨胀率的值大于0,表明存在通货膨胀 若通货膨胀率的值小于0,则表明出现了通货紧缩,(二)应用价格指数消除价格变动的影响,价格紧缩指数法运用价格指数消除价格变动影响的方法 利用此法可以消除价值指标受价格变动的影响 货币购买力单位货币所能购买商品和服务的数量,第四节 指数体系与因素分析,指数体系将由一个等式联系起来的若干个指数组成的一个整体 销售价格销售量=销售额 单位成本产量=总成本,指数体系的作用,首先,利用指数体系可以作因素分析 其次,利用指数体系可以作指数推算,即由指数体系的已知指数推算未知指数,二、总量指标的因素分析,(一)两因素分析 对销售额总

23、量指标,有如下指数体系: (6-15),在指数体系(6-15)中,价格指数 表明价格变动方向和程度及其对销售额的影响 分子与分母的差额 说明由于价格变化而使销售额变化的数额,销售量指数 表明销售量变动方向和程度及其对销售额的影响 分子与分母的差额 说明销售量变化而使销售额变化的数额,销售额指数 表明商品销售额的变动方向和程度 分子分母的差额 说明销售额的变化情况,上面的指数体系是在相对数上相等,在影响的绝对数上也相等 公式(6-15)左边的影响差额之和等于公式右边的分子与分母之差:,(二)三因素分析,总量指标的多因素分析 当总量指标的变动受两个以上因素变动的影响时,利用指数体系可以从相对数和绝

24、对数上分析各因素变动对总变动的影响,多因素分析的注意事项,第一,各影响因素应按指标之间的经济联系排列 数量指标在前,质量指标在后 所有相邻两因素的乘积必须有明确的经济意义 第二,数量指标和质量指标的确定具有相对性,原材料消耗总额的三因素分析,三、平均指标的因素分析,受各组水平x(当作质量指标) 影响,各组结构 (当作数量指标),假定记为: 平均指标的变动也就是平均指标指数,又称为可变组成指数。记为:,固定组成指数,固定组成指数将各组结构固定在报告期(依据综合指数的编制原则),考虑各组水平变化对平均指标变化的影响得到的指数: 分子与分母的差额: 表示由于各组结构变动而使平均指标变化的数额,结构影

25、响指数,结构影响指数将各组水平固定在基期(依据综合指数的编制原则),考虑各组结构变化对平均指标变化的影响得到的指数: 分子与分母的差额: 表示由于各组结构变动而使平均指标变化的数额,平均指标指数/固定组成指数/结构影响指数的数量关系,相对数上: 绝对数上: 即,由此可知: 可变组成指数 固定构成指数 指数体系 结构影响指数 称之为平均指标指数体系或可变组成指数体系,第七章 概率论基础,第一节 随机事件与概率,随机现象发生与否,如何发生,事先完全 无法预知的一类现象 随机试验对随机现象进行的观察或实验 随机事件随机试验的每一个可能的结果, 简称事件,随机事件的分类,按能否再作划分 按发生的确定性

26、与否分为,样本空间某一随机试验中,由所有基本事件组成的集合称为样本空间,记作 样本点每一个基本事件就称为一个样本点,记作,二、事件间的关系与运算,1. 事件的包含与相等 设有事件A与事件B,若A发生,必然导致事件B发 生,记作 2. 事件的互斥(互不相容) 若事件A与事件B不能同时发生,则称A与B两事件互斥,或互不相容,3. 事件的和(并),由事件A所包含的所有基本事件与事件B所包含的所有基本事件共同组成的随机事件,称为事件A与事件B的和(或并),记作A+B(或) 4. 事件的积(交) 由事件A与事件B的全部公共基本事件所组成的随机事件,称为事件A与事件B的积(或交),记作AB(或),5. 事

27、件的差,由包含在事件A中,但不包含在事件B中的所有基本事件所组的随机事件,称为事件A与事件B的差,记作A-B 6. 逆事件(对立事件) 由样本空间中除去A包含的基本事件后,剩余的全部基本事件所组成的随机事件,称为事件A的逆事件,记作 ,有,三、频率与概率,频数在相同条件下进行n次试验,事件A发生的次数m 频率频数m与试验次数n的比值m/n称为在n次试验中事件A发生的频率,记作: 大数定律表明,当n无限增大时,事件A发生的频率趋近它的概率,(二)古典概率,古典模型成立的两个条件 样本空间是有限的,即基本事件的个数有限 每个基本事件发生的可能性均相等 在该模型下,事件A发生的概率称为古典概率,记作

28、:,*(三)概率的现代数学定义,设E为一随机试验, 为其样本空间,对于E的每一个事件A赋予一个实数,记作 ,称为事件A的概率,要求集合函数 满足下列条件: 对每一个事件A,有 ; 设 是两两互不相容的事件,即对于 ,有 ( ),则有 即 具备可列可加性,概率的基本性质,1. 2. 3.有限可加性:若 互不相容,则有:,四、概率中的几个常用定理,(一)加法定理 设A、B为任意两个随机事件,则有: 该定理可以推广到几个事件和的情形:,(二)条件概率,事件A发生条件下,事件B发生的概率记作 或 ,可以证明:,乘法公式,(若 ) (若 ) 该公式可以推广到n个事件的积的情形,时间的独立性,若事件A发生

29、与否不影响事件B发生的概率,并且事件B发生与否不影响事件A发生的概率,则称事件A与事件B相互独立,即有: , 且此时有,(三)全概率公式与贝叶斯公式,互斥完备事件组:设随机试验E的样本空间是 , 为一组事件,若它们满足: (1) ( ) (2) 则称事件 为一互斥完备事件组,全概率公式:,设随机试验E的样本空间是 , 为一互斥完备事件组,且 ,( ),A为任一事件,则,贝叶斯公式:,设随机试验的样本空间为 ,事件 为一互斥完备事件组,且 ,( ),A为任一事件, ,则在A发生的条件下,事件 出现的概率是:,第二节 随机变量及其概率分布,一、随机变量 设E为随机试验,其样本空间为 ,假定: (1

30、)对每个样本点 都有唯一实数与之对应 (2)对任意实数x,“ ”是一个随机事件 则称定义域在样本空间上 的单值函数为随机变量 ,简记作X,随机变量的分类按取值情况,离散型随机变量的取值能一一列举出来(有限或可列无穷个) 连续型随机变量的取值连续不断,不能一一列举,二、随机变量的概率分布,概率分布随机变量所有可能取的值及其取这些值的概率来描述随机现象的变化规律 分布函数设X是一随机变量,x为任意实数,则称 为随机变量X的分布函数。它表示X在( )上取值的概率。,由事件的基本性质知: 即由分布函数可以求出随机变量X在任一区间( )上取值的概率,(一)一元离散型随机变量的概率分布,设X为离散型随机变

31、量,X的一切可能取值为 (有限或无限可列个),取每个值xi的概率为pi,记为: 称上式为随机变量X的分布律或分布列,又称概率分布或概率函数,分布律满足:, , ; ,设X为离散型随机变量,其分布律是: ( ) 则x的分布函数是:,(二)一元连续型随机变量的概率分布,对随机变量X,如果存在非负函数 ,使X的分布函数为 函数 称为X的概率密度,或称为密度函数 可以证明,在 的连续点处,有:,概率密度函数的性质:, ,即非负性; ,即 在全直线上的积分等于1, 也就是密度函数与x轴围成的面积等于1 即连续型随机变量在某一点取值的概率为零,概率值的几何图示,连续型随机变量X在区间a, b内取值的概率

32、等于在该区间上概率密度函数下的曲线梯形面积,二项分布,如果随机变量X的分布律是: ( ) 其中n为正整数, , 。则称X服从参数为n、p的二项分布,记作:,独立试验模型,如随机试验E满足: 该试验只有两个可能的结果(则称为Bernaulli实验); 在相同的条件下可重复n次; 各次试验的结果互不影响; 事件A在每次试验中出现的概率都相等,记为p。,据贝努利定理,在独立试验模型下,事件A在n次试验中出现k次的概率可用二项分布描述: ( ),正态分布,如果随机变量X的密度函数是: 其中 为任意实数, ,则X服从参数为 、 的正态分布。记作:XN( ),f (x),正态分布概率密度图,标准正态分布,

33、当 , 时,称X服从 标准正态分布,记为 正态分布的图形是钟形曲线,当 时, 取最大值 曲线以 为对称轴,且沿不同的水平方向单调。当 时,曲线以模轴为其渐近线 决定图形的扁平度。 越大,曲线越平坦; 越小,曲线愈陡峭,非标准正态分布标准化定理,若随机变量X服从均值为 、方差为 的正态分布,即 则 其中 ,,第三节 随机变量的数字特征,数学期望描述随机变量取值的一般水平即平均水平的数字特征,又称为均值或期望值 离散型随机变量数学期望 连续型随机变量数学期望,(三)数学期望的基本性质, 为常数 ,c为常数 若X与Y相互独立,且各自的数学期望均存在,则:,二、方差,方差描述随机变量的取值与其数学期望

34、之间的平均偏离程度的数字特征 可说明数学期望的代表性高低: 方差愈大,表明该随机变量的取值愈分散,它的数学期望的代表性愈低 方差愈小,表明该随机变量的取值愈集中,它的数学期望的代表性愈高,对随机变量X,若 的数学期望存在,则称 为X的方差,记作: 其算术平方根 称为标准差或均方差,离散型随机变量 ,且 则方差 若X为连续型随机变量,且密度函数是 则方差,方差的基本性质:, ,其中c为常数; ,其中c为常数; 当X,Y相互独立时, ,第四节 大数定律与中心极限定理,一、大数定律 大数定律是概率论中讨论随机变量序列的算术平均值向某处常数收敛的一类定律的总称,大数定律1契贝雪夫定理,设随机变量 相互

35、独立,其数学期望与方差均存在,且方差一致有界,即存在一个常数k,使 ,( ) 则对任意正数 ,都有,契贝雪夫定理,特别,当 时,有 定理表明,尽管 中每一个的取值都是随机的,但在满足定理条件下,只要n充分大,其算术平均值密集在这个平均值的数学期望附近,大数定律2贝努利大数定理,设事件A在每次试验中发生的概率都是p,m是n次独立试验中事件A发生的次数,则对任意正数 ,有: 该定理表明,只要重复独立试验中的次数n足够大,事件出现的频率与概率就十分接近,二、中心极限定理 同分布中心极限定理,设 独立同分布,且都有相同的数学期望与方差,即 , ,( ) 令,同分布中心极限定理,则对任意实数x,都有:

36、即 也就是,中心极限定理 德莫弗-拉普拉斯定理,设总体的成数(又称比率)是P,从总体中抽取容量为n的样本,样本成数(比率)是p,则对任意x,有: 即 从而,中心极限定理 拉普拉斯定理,设X服从 二项分布,则当n充分大时 (1)局部极限定理,(2)积分极限定理 当n较大时,在二项分布表中常找不到其概率值,此时只好用正态分布近似计算二项分布的值。n愈大,用正态分布求得的值愈接近二项分布的值,第八章 抽样推断,第一节 抽样推断的含义及其作用,抽样推断从总体中按随机原则抽选一部分单位(称之为样本),根据样本的数量特征对总体的相应数量特征加以推断的方法,抽样推断的特点,第一,按随机原则抽选一部分总体单位

37、组成样本 第二,抽样推断是根据部分来推断整体,而不是直接认识整体 第三,抽样推断必然存在误差,但误差可以控制和计算,抽样推断的作用,第一,应用于某些不可能作全面调查或很难或没有必要作全面调查的场合 第二,在可以使用全面调查的场合,抽样调查仍有其独特的作用:节省成本;校订误差等 第三,用于假设检验,抽样推断的局限性,首先,由抽样推断得出的关于总体的认识是近似的、非全面的 其次,由抽样推断得出的是关于总体的结论,而不能得出总体各部分的结论,三、抽样推断中的若干基本概念,全及总体简称总体或母体,是指所要研究的人部对象所组成的一个整体 总体单位组成总体的个别事物 总体根据其所包含的总体单位数目多少可分

38、为: 有限总体是指总体内的单位个数只有有限个 无限总体是指总体内的单位个数有无限多个 样本总体简称样本或子样,是指按随机原则从总体中抽取的一部分样本单位组成的一个小总体,(二)总体指标与样本指标,总体指标是反映总体特征的数值 常用的总体指标如下: 总体平均数,表示总体体内各单位某一标志值的一般水平,记作 ; 总体方差,反映总体各单位标志值的离散程度,从而可以说明总体平均数的代表性大小,记作 ,称为总体标准差或均方差; 总体成数,指具有某种性质的总体单位在总体中所占比重(如全部产品的合格率),记作P。,样本指标是指根据样本中各单位的标志值计算的反映样本特征值的指标 常用的样本指标如下: 样本平均

39、数,表示样本内各单位某一标志值的一般水平,记作 ; 样本方差,反映样本中各单位标志值的离散程度,从而可说明样本平均数的代表性大小,记作 ,称S为样本标准差或均方差; 样本成数,指具有某种性质的单位在样本中所占比重(如抽样产品的合格率),记作p;样本成数的方差是 。,总体指标的公式,总体平均数: 总体方差: 总体成数:,样本指标公式,样本平均数: (8-1) 样本方差: (8-2) 样本成数:,实际计算样本平均数的方差,对有加权的情形:,抽样方法的分类,重复抽样是抽取一个单位后,抽选下一个单位时仍把前一个已抽中的单位放回总体中再进行抽取,因此一个单位有重复抽中的可能,也叫做有放回的抽样或重置抽样

40、 不重复抽样则是将已抽中的单位不再放回总体,因而每个单位最多只能抽中一次,也叫做无放回抽样或非重置抽样,从容量为N的总体中抽取容量为n的样本,则 不重复抽样下可抽取的样本个数是: 重复抽样下的样本个数是:,第二节 抽样误差,抽样误差随机抽样引起的偶然的代表 误差抽样误差愈大,样本指标对总体指标的代表性愈低;反之则愈高,抽样实际误差与抽样平均误差,抽样实际误差是指在某一次抽样中,由随机因素引起的样本指标与总体指标之间的数量差异,常用R表示 抽样平均误差,是根据随机原则抽样时,所有可能出现的样本指标的标准差。它反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均误差程度,常用 表示,样本平

41、均数的平均误差 样本成数的平均误差,简单随机抽样下的平均误差公式,在重复抽样下:,在不重复抽样下:,总体方差、总体成数的替代处理:,第一,用过去的 、P代替,但此法只适用于总体情况变化不大的情形 第二,用某个样本的方差 、成数p代替 第三,对P而言,取P=0.5;若有多个P,则取最接近0.5的那个P值,原因在于,当时,成数P的方差 取最大值,简单随机抽样,简单随机抽样又称为纯随机抽样,是按随机原则直接从总体中抽取若干单位,构造一个样本,然后据样本指标对总体的相应指标进行推断的方法 简单随机抽样中抽选样本的常用方法: 第一种是直接抽样法 第二种是抽签摸球 第二种是利用随机数字表,类型抽样,类型抽

42、样又称分类抽样或分层抽样,它是先将总体单位按某一标志分成若干类型,在各类型中按随机原则抽选样本单位,由各类中的样本组成一个总的样本,然后据样本特征推断总体特征 类型抽样的方法: 等比例抽样是从各类型中按相同的比例抽选样本单位,这种抽样未考虑各类型中的标志值的变异程度是否存在差别 不等比例抽样在各类中按不完全相等的比例抽选样本单位,这样就可以在标志变异较大的类中多抽一些单位,而在标志变异较小的类中少抽一些单位,等比例抽样下平均误差的计算 重复抽样,在等比例抽样中, ,样本平均数 在重复抽样下,其中 式中 , 为各类的方差、成数,它们往往未知,常用各类中样本的方差 、 样本成数代替,等比例抽样下平

43、均误差的计算 不重复抽样,在不重复抽样下: 当总体单位数N较大时常取:,不等比例下平均误差的计算重复抽样,在重复抽样下:,不等比例下平均误差的计算不重复抽样,在不重复抽样下,机械抽样,机械抽样又称等距抽样或系统抽样,它是先将总体各单位按某一标志顺序排队,然后按固定的顺序和间隔在总体中抽取若干个单位构成样本,机械抽样的过程,1.排队 2.根据总体单位数与需要抽取的样本单位数计算抽选各样本单位的间隔距离K,取 3.确定抽样的起点,即第一个样本单位的位置 按无关标志排队,从第一个间隔内任意一个单位开始抽取 按有关标志排队,从第一间隔居中间的那个单位开始抽取,按无关标志排队 按有关标志排队,按无关标志

44、排队进行等距抽样的平均误差公式,整群抽样,整群抽样又称聚点抽样或群体抽样,先将总体划分为若干群(R群),再从中任意抽取几群(r群),然后对抽中的群作全面调查,并据此结论对总体加以推断,整群抽样具有如下特点:,尤其适用于存在自然群的场合,从而可以节省人力、物力和财力 整群抽样的误差较大 样本对总体的代表性会降低,整群抽样下的平均误差公式:,其中 称为群间方差,取,抽样误差的影响因素,总体方差或标准差 :与误差成正比 样本容量 :反比 抽样方法 :不重复抽样误差更小 抽样调查的组织方式 :类型抽样的抽样误差较小,而整群抽样的抽样误差却较大,第三节 抽样估计方法,抽样极限误差是指样本指标与总体指标之

45、间的可能误差范围,又叫允许误差或可能误差,用表示。 平均数的极限误差 满足: 成数的极限误差 满足: ,抽样极限误差与抽样平均误差的关系,即 其中t称为概率度,它与概率F(t)对应,且满足:,t与F(t)之间的对应关系,F (t),-t,t,点估计简单结论(1),点估计是在一定的概论保证下,根据样本指标推断出总体指标的一个确定的估计值 (1)样本平均数是总体平均数的点估计,即 且估计精度是,点估计简单结论(2),(2)样本成数是总体成数的点估计,即 且估计精度是,区间估计,区间估计在一定的概率保证下,由样本指标推断出总体指标可能在的区间,并称此区间为置信区间 理论基础抽样分布定理,区间估计的公式,+,总体平均数的置信区间,总体成数的置信区间,区间估计的特点,第一,区间估计是对总体指标的变化范围的判断 第二,区间估计是一个可能的范围,即该区间以一定的把握程度(概率值F(t)包含总体指标,也有可能(概率值1-F(t)不包含该总体

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1