上海财经大学应用统计学.ppt

上传人:本田雅阁 文档编号:2633965 上传时间:2019-04-25 格式:PPT 页数:223 大小:2.04MB
返回 下载 相关 举报
上海财经大学应用统计学.ppt_第1页
第1页 / 共223页
上海财经大学应用统计学.ppt_第2页
第2页 / 共223页
上海财经大学应用统计学.ppt_第3页
第3页 / 共223页
上海财经大学应用统计学.ppt_第4页
第4页 / 共223页
上海财经大学应用统计学.ppt_第5页
第5页 / 共223页
点击查看更多>>
资源描述

《上海财经大学应用统计学.ppt》由会员分享,可在线阅读,更多相关《上海财经大学应用统计学.ppt(223页珍藏版)》请在三一文库上搜索。

1、应用统计学,管理科学与工程 学科综合水平考试,应用统计学考试大纲,考试要求: 经济管理中常用的基本统计原理和方法 熟悉统计计算方法和公式,并能正确地解释计算结果 初步具有应用定量的统计模型以及科学的统计方法进行现代化管理和决策的能力,应用统计学考试大纲(续),考试内容: 数据的整理与图形 常用随机变量的分布以及抽样分布 参数估计 假设检验 回归分析 时间序列分析 考试时间: 每年五月份第3个星期日下午,应用统计学教学进度表,应用统计学目录,第一章 数据的整理与图形-10 第一节 数据的整理与图形表示-12 一饼形图-18 二组距分组法与频率直方图-19 三条形图与柱状图-20 四并列条形图或柱

2、状图-21 五茎叶图-22 第二节 数据的描述性指标-18 一数据集中趋势的度量-24 二数据离散趋势的度量-25,应用统计学目录,第二章随机变量以及抽样分布-25 第一节 随机变量概念和随机变量的数字特征-12 一随机变量的数学期望-18 二随机变量的方差和标准差-19 第二节 常用随机变量以及分布-18 一01分布-24 二二项分布-25 三正态分布与标准正态分布-26 第三节 总体与样本-27 一总体-28 二样本-29 三. 联合分布函数和联合概率密度 -30,应用统计学目录,第二章常用随机变量的分布以及抽样分布-25 第四节 抽样方法-30 一简单随机抽样-31 二分层抽样-32 三

3、整群抽样-33 四系统抽样-34 第五节 样本统计量的分布-18 一统计量-35 二常用统计量-36 三三大分布( 卡方分布、t分布、F分)-37 四正态总体的样本均值和样本方差分布-38 五独立同分布的中心极限定理-40,应用统计学目录,第三章参数估计-41 第一节 参数的点估计-42 一参数点估计的一般提法-42 二参数点估计的求法-43 三点估计量的评价标准-44 第二节 参数的区间估计-44 一参数区间估计的一般提法-44 二单侧置信区间-45 三关于一个正态总体均值和方差的区间估计-46 四关于两个正态总体的均值差的区间估计-47 五关于比率p的区间估计-48,应用统计学目录,第四章

4、假设检验-51 第一节 假设检验的原理-42 一假设检验的基本思想-42 二原假设和备选假设-43 第二节 假设检验的基本概念-44 一两类错误-44 二显著性水平的确定-45 三原假设与备选假设的选择-46 四双侧检验与单侧检验-47 五假设检验的一般步骤-48,应用统计学目录,第四章假设检验-51 第三节 关于总体均值与方差的假设检验-52 一关于一个正态总体均值的假设检验-52 二关于一个正态总体方差的假设检验-53 三关于两个正态总体均值差的假设检验-54 四关于比率p的假设检验-55 五关于两个总体比率差的假设检验-56 第四节 假设检验与区间估计的关系-44,应用统计学目录,第五章

5、回归分析-62 第一节 简单线性回归分析-62 一散点图-62 二简单线性回归模型及基本理论假设-63 三简单线性回归模型的基本特征-66 四回归参数的最小二乘估计-67 五方差2的估计、可判定系数R2与相关系数R-68 六回归效果的显著性检验与方差分析表-69 七回归参数的假设检验与区间估计-70 八预测-71,应用统计学目录,第五章回归分析-61 第二节 多元线性回归分析-74 一多元线性回归模型及基本理论假设-74 二回归参数的最小二乘估计-75 三方差2的估计、复可判定系数R2 -76 四多元线性回归模型的假设检验-77 五估计与预测-78 六多项式回归模型-79,应用统计学目录,第五

6、章回归分析-61 第三节 线性回归模型的适宜性评价-81 一非线性-82 二异方差性-83 三序列相关性-84 四非正态性-85 五多重共线性-86,应用统计学目录,第六章时间序列分析-92 第一节 时间序列的组成因素-92 一影响时间序列的四个因素-92 二时间序列的三个分解模型-93 第二节 长期趋势的测定-96 一长期趋势的测定滑动平均法-97 二直线趋势的测定最小二乘法-98 三曲线趋势的测定-99,应用统计学目录,第六章时间序列分析-92 第三节 季节变动因素的测定-100 一按月(季)平均法-101 二滑动平均趋势剔除法-102 三季节调整-103 第四节 循环波动因素的测定-10

7、4 一剩余测定法-104 二循环波动相关数图-105,应用统计学希腊字母表,第一章 数据的整理与图形,第一节 数据的整理与图形表示 数据整理一般来说数据整理的一项初步工作是对数据进行统计分组。 统计分组一般按照数据的品质标志或数量标志分组。 不同的分组标志反映总体的不同特征,因此,必须从统计研究任务的需要出发,选择能够反映现象本质特征的标志。 品质标志从事物的性质或属性特征上区分各种类型组。如性别、颜色、产品等级、生产厂家等。 数量标志从事物的数量差异程度上来区分各种类型组。如温度、产量、年龄、销售量等。 频数分配在某统计分组内的数据个数称为该组的频数。 频率某组频数与全部组的频数之和的比值称

8、为该组的频率。 频率分布按数据的某种标志分组,把全部数据在各组中的分配状况称为频率分布。 频数频率分布表将分组标志、各组频数及频率列成表格。 反映总体的分布规律和性质,在定量统计分析中有广泛的用途。,第一节 数据的整理与图形表示,频数频率分布表标准样式:,一.饼形图,适用于分组数少 用于描述和表现各成分或某一成分占全部的百分比 各成分总和=100% 用圆代表全体,用扇形区域代表各成分,扇形区域面积占整个圆面积的百分比等于该成分占全部的百分比 例1.1 某公司工作人员的性别频数频率分布表如下:,二.组距分组法与频率直方图,数据标志取值个数较小(单项数列)采用品质分组法。例如5分制的学生成绩。 数

9、据标志取值个数较多或连续变量(组距数列)采用组距分组法(等距数列和异距数列)。例如百分制的学生成绩。 异距数列制作直方图时,要先计算出各组的频数密度=频数/组距,然后以组距为宽,以频数密度为高画直方图。 组距分组法(等距数列)的操作步骤如下: 例1.2 从一批电阻中抽取30只,测得各只电阻的电阻值如下表。对这组数据适当分组,并建立频数频分布表和绘制频率直方图。,二.组距分组法与频率直方图(续),第一步:找出最大值L,最小值l,计算极差R=L-l。本例中L=4.9, l=2.6,R=4.9-2.6=2.3。 第二步:确定分组个数k,计算组距h。分组个数一般由下表确定(根据美国统计学家斯特吉斯提出

10、的经验公式:组数=1+3.322LogN得出,其中N为数据个数)。本例选取k=5。则组距k=R/h=2.3/5=0.46,为计算方便可取h=0.5。,二.组距分组法与频率直方图(续),第三步:决定各组界限值,确定分点。第一组的下限值=l-h/2,上限值=l+h/2。本例中也可取第一组下限值为2.5,上限值为2.5+h=2.5+0.5=3;依此类推第五组下限值为4.5,上限值为5.0。 第四步:数出各组频数,计算频率,作出频数频率分布表如下。要特别注意:数据正好是界限值时,则该数据应被计数在以它为下限的组中。,二.组距分组法与频率直方图(续),第五步:由频数频率分布表可以画出频率直方图。 在平面

11、直角坐标系的横坐标X轴上标出各组界限值 在各组下限值与上限值之间画出高为该组频率的矩形 直方图的特点:简单、直观,能够反映数据是否呈对称分布,数据的平均水平及散布情况。,三.条形图与柱状图,条形图与柱状图本质上没有太大区别,都是用来对各项信息进行比较。主要区别: 数据是对事物在时间序列上的度量,一般用横坐标表示时间,这样可以直接地观察事物随时间变化的情况采用柱状图。 如果数据不是按时间排列的且各项信息的标识过长时采用条形图。 例1.3 某电视机生产厂家2006年市场占有率及其主要竞争对手的市场占有率资料如下表所示。请分别用条形图和柱状图表示该组数据。,三.条形图与柱状图(续),四.并列条形图或

12、并列柱状图,并列条形图或并列柱状图有利于对两组或两组以上的并列数据进行对比。(还有一种堆积条形图) 例1.4 某电视机生产厂家2005和2006年市场占有率及其主要竞争对手的市场占有率资料如下表所示。请用并列柱状图表示该组数据。,三.并列条形图或并列柱状图(续),三.茎叶图,茎叶图也是一种条形图,它是把每个数分成茎和叶两部分,同茎的数排成一列,然后按茎和叶的大小排列成图。一般取数据的最后一位数为叶,前几位数为茎。分为一般茎叶图和有序茎叶图。 茎叶图它直观地显示了数据所在的范围以及数据的总体水平(集中或分散情况),它的优点是可以清楚地看到落在每一直方形中的具体数据,而且可以较容易地找出有用的分位

13、数,如中位数等。 例1.5 某班级(40人)应用统计学期末考试成绩如下表所示。请画出茎叶图。,三.茎叶图(续),以十位数为茎,个位数为叶,画出的茎叶图如下:,三.茎叶图(续),还可以把各茎叶上的叶按大小排序,得到有序茎叶图如下:,第二节 数据的描述性指标,测定每个观察单位某项指标值的大小,所得的资料称为计量资料又称测量资料,这类资料一般具有计量单位。计量资料的统计指标分成两大类: 数据集中趋势的度量表达计量资料集中位置的指标,用以描述观察值的平均水平,如算术均值、几何均值、调和均值、中位数、众数、百分位数。 数据离散趋势的度量表达计量资料变异的指标,又称离散指标,用以描述观察值间参差别不齐的程

14、度,即离散度或称变异度,如全距、标准差、方差、标准误差、变异系数、四分位数间距等。 设原始观察值为 第 组频数(有时可以是出现的频率)记为 ,组中值记为,一.数据集中趋势的度量,表示数据的集中点或中心点。根据不同的实际需要,可以采用下列指标之一来对数据的集中趋势进行度量: 算术平均值简称为均值 总体均值用希腊字母 表示,样本均值用 表示。算术平均值的具体计算方法分为简单算术平均和加权算术平均两种: 简单算术平均 加权算术平均 算术平均值有两个重要的数学性质: 各个变量值与平均值离差之和等于零。 各个变量值与平均值的离差平方之和为最小值。,一.数据集中趋势的度量(续),中位数(或称中数) 中位数

15、用M表示,它将总体或样本的全部观察值分成两部分,每部分各有50%个观察值,其计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值为奇数时,处于中间的那个数为中位数。偶数时处于中间的两个数的均值为中位数。 中位数是位置平均值,它不受极端值的影响,在具有个别极大或极小值的分布数列中,中位数比算术平均值更具有代表性。,一.数据集中趋势的度量(续),众数 频数最大的变量值称为众数,列为频数表的资料,频数最大的组的组中值为众数。当数据个数较少时,众数就是出现次数最多的那个数据。 对于一组数据,众数可以不止一个,也可能没有众数。 适用于粗略地表示呈单峰分布资料的集中趋势

16、。,一.数据集中趋势的度量(续),百分位数 百分位数以 表示,它将总体或样本的全部观察值分成两个部分,其中有 个观察值小于 ,(100 )%个观察值大于 。如百分之25分位数或称第25百分位数,表示有25%个观察值小于 ;75%个观察值大于 。中位数就是百分之50分位数 。常用的有上四分位数 和下四分位数,一.数据集中趋势的度量(续),上四分位数的计算 将数据由小到大排列,记排列后的数据为 令: 其中 表示向上取整,如 。则上四分位数就是 ,即约有1/4的数据比 大,3/4的数据比比 小。,一.数据集中趋势的度量(续),下四分位数的计算 将数据由小到大排列,记排列后的数据为 令: 其中 表示向

17、上取整,如 。则下四分位数就是 ,即约有3/4的数据比 大,1/4的数据比比 小。,一.数据集中趋势的度量(续),例1.6 某班30名MBA学生的年龄按上升顺序排列如下表。请计算这组数据的众数、中数、平均数、上四分位数和下四分位数。 众数为27和28;分别出现5次 中数为(27+28)/2=27.5 平均数为27.67 上四分位数为x23=30,下四分位数x8=26,一.数据集中趋势的度量(续),中位数、众数、平均数的运用比较 中位数对极端值不像平均数那么敏感,因此对于有极端值的数据集来说,采用中位数描述其集中趋势一般比平均数更合适。 众数的主要缺点是可能没有众数或不惟一,而平均数和中数都是存

18、在并且惟一的。它的优点是反映了数据集中最常见的数值,即最普遍的数值,当数据多且有明显集中趋势时,计算众数既方便且有意义,并且它不仅对数量型数据有意义,对分类型数据集也有意义。 平均数的优点在于它容易理解和计算。它的一个主要缺点是它对极端值特别敏感;它的另一个缺点是它不考虑数据在数据集中的重要性,一律平等对待。 加权平均数克服了平均数不考虑数据在数据集中的重要性的缺陷,采用权重反映数据在数据集中的重要性,并且具有容易计算的优点。,一.数据集中趋势的度量(续),运用中位数、众数、平均数的数量关系判别总体分布特征(*) 次数分布呈对称分布曲线时,算术平均数、众数、中位数三者完全相等。 次数分布呈右偏

19、态时,算术平均中位数众数。 次数分布呈左偏态时,算术平均中位数众数。,一.数据集中趋势的度量(续),利用位置平均数与算术平均数的关系进行推算(*) 根据经验,在分布偏斜程度不大的情况下,不论右偏态还是左偏态,三者存在一定比例关系,中位数居中,众数Me与中位数Mo距离约为算术平均数 与中位数的2倍,即有公式:,一.数据集中趋势的度量(续),例如:某城市住户家庭月收入的抽样调查资料计算资料计算得到众数为1040元,中位数为1128.57,问算术平均数约为多少?其分布呈何形态? 算术平均数=(3*1128.57-1040)/2=1172.86 所以有算术平均中位数众数,呈现右偏态分布,也说明收入分配

20、中算术平均数偏向高端,多数居民收入低于算术平均数。,二.数据离散趋势的度量,全距也称极差是一种离散指标,是最大与最小观察值之差。用极差反映总体分布的离散程度虽然简便,但它只从两端数值考察,忽略了中间数据的变动情况,不能说明整体的差异程度,尤其是存在极端值情况下,使用极差往往会造成错误的结论。,二.数据离散趋势的度量(续),四分位差即上四分位数与下四分位数的差数。它一般不受极端值的影响。 方差是一种常用的离散指标,样本的方差计算公式为: , 标准差 ,与数据具有相同的单位。,二.数据离散趋势的度量(续),变异系数是一种离散指标,简记为CV,它是标准差与均值之比,用百分数表示: 由于CV无量度单位

21、,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。,二.数据离散趋势的度量(续),各种离散趋势度量的适用场合比较分析 极差最简单、最直观、最容易计算。但特别容易受极端值的影响。 四分布差不像极差那么容易受极端值的影响,但仍然存在没有充分利用数据所有信息的缺陷。 方差和标准差最常用的度量数据离散程度的指标,它用数据自身与平均数之差的大小加权,因而区别对待了大小不同的数据,距离平均数远的数据权重比较大,距离平均数近的数据权重比较小,比较合理地反映了不同数据对离散度量的作用。缺点是计算比较繁琐,且方差的单位常常没有意义。 变异系数比较两组或

22、两组以上数据集的离散趋势度量时,应采用无量度单位的变异系数CV。,二.数据离散趋势的度量(续),数据离散趋势度量方差的作用 衡量数据的稳定性例如:产品的质量 评价事物的风险例如:投资的风险 数据的方差分析例如:数据的挖掘,第二章随机变量以及抽样分布,第一节 随机变量概念和随机变量的数字特征 随机变量是描述随机事件的数学模型。学习和掌握随机变量的概念是学习统计学的前提。 随机试验的每一个可能结果称为样本点,用表示,样本点全体组成的集合称为样本空间,用表示。 随机事件是由若干个样本点组成的集合,或者说是样本空间的某个子集。 随机变量是定义在样本空间上的函数,即对于随机试验的每一个可能结果,随机变量

23、X取值X()也不同,并且以确定的概率取这些不同的值。随机变量一般用X,Y,Z表示。 按照随机变量的取值情况,把随机变量分成两类: 离散型随机变量用概率函数描述。 连续型随机变量用概率密度函数描述。 对于任意实数x,随机变量X的分布函数为: 即随机变量X的取值不大于x的概率。,第一节 随机变量概念和数字特征,一随机变量的数学期望E(X) 一个随机变量的数学期望是对该随机变量分布中心的度量,它反映了随机变量的(加权)平均取值,因此数学期望也称为随机变量的均值。数学期望也常常用希腊字母表示,即= E(X)。 离散型随机变量的数学期望 设离散型随机变量X的概率函数为 则根据概率函数的性质有 离散型随机

24、变量X的数学期望为,第一节 随机变量概念和数字特征,一随机变量的数学期望E(X) 连续型随机变量的数学期望 设连续型随机变量X的概率密度函数为 则根据概率函数的性质有 连续型随机变量X的数学期望为,第一节 随机变量概念和数字特征,二随机变量的方差D(X)和标准差 离散型随机变量X的方差定义为 连续型随机变量X的方差定义为 方差的概念 我们称 为随机变量X关于它期望的离差。由方差定义,方差就是离散平方的数学期望,即离散平方的平均值。因此,方差D(X)小,说明随机变量X的分布比较集中;方差D(X)大,说明随机变量X的分布比较分散。 随机变量X的标准差 。标准差和原随机变量具有相同的度量单位。 随机

25、变量的方差也可以记为 ,即 。,第一节 随机变量概念和数字特征,例2.1 已知随机变量X的分布列为 试求:随机变量的均值E(X)和方差D(X) 解法1: E(X)=10.2+20.1+30.4+40.3=2.8 D(X)=(12.8)20.2+(22.8)20.1 +(32.8)20.4 +(42.8)20.3=1.16,第一节 随机变量概念和数字特征,解法2: E(X)=10.2+20.1+30.4+40.3=2.8 E(X2)=10.2+40.1+90.4+160.3=9 由于有 证明: 随机变量平方的数学期望不小于其数学期望的平方。 D(X)=9-2.82=1.16,第二节 常用随机变量

26、以及分布,一01分布 只取两个不同数值的随机变量X称为01分布。定义:设0p1,如果X的概率函数为 则称X服从参数为p的01分布,记为B(1,p)。 01分布的概率函数也可以表示为,第二节 常用随机变量以及分布,一01分布 01分布的数学期望为 01分布的方差为 任何一个只有两种可能结果的随机试验,都可以用一个服从01分布的随机变量来描述。有时也称01分布为两点分布或贝努利分布。,第二节 常用随机变量以及分布,二二项分布 定义:若随机变量X的所有可能取值为0,1,,n,且它的概率函数为 则称X服从参数为n和p的二项分布。其中0p1。记为XB(n,p)。当n=1时,二项分布就是01分布。n无限大

27、时,趋向正态分布。 二项分布的性质 二项分布的数学期望 二项分布的方差,第二节 常用随机变量以及分布,二二项分布 应用:对产品有放回地做n次检验,每一次检验一个产品是否合格,n次检验中正好有k个产品合格的概率,其中每一次检验得到合格的概率为p。 证明:由贝努利概型(在重复独立试验中,每次试验的结果只有两个可能)知,在指定k次检验中出现合格,而在其余nk次检验中出现不合格的概率为 例如:在前k次检验中出现合格,而后面nk次检验中出现不合格个概率 由于事件合格在n次检验中的任k次出现,共有 种情况,而这么多种情况所对应的这么多个事件是不相容的。因此由概率的有限可加性得到:,第二节 常用随机变量以及

28、分布,三正态分布与标准正态分布 设连续型随机变量X的密度函数为 正态分布的分布函数为 其中 是正态分布随机变量的均值, 是方差,我们称X服从均值为 方差为 的正态分布,记为,第二节 常用随机变量以及分布,三正态分布与标准正态分布 正态分布的概率密度函数曲线为,第二节 常用随机变量以及分布,三正态分布与标准正态分布 正态分布的密度函数性质 p(x)与x轴之间的面积都是1。 曲线关于x=对称,因此是正态分布的位置参数。 方差2的大小决定了密度曲线的高矮胖瘦: 2越大,曲线越矮越胖; 2越小,曲线越高越瘦。 标准正态分布 期望值为0和标准差为1的正态分布N(0,1)称为标准正态分布,即=0, =1。

29、常用U表示。,第二节 常用随机变量以及分布,三正态分布与标准正态分布 标准正态分布 概率密度函数为 分布函数为 标准正态分布关于纵轴对称,对任意实数x,有,第二节 常用随机变量以及分布,三正态分布与标准正态分布 正态变量的线性变换 标准化变换把随机变量X减去自己的均值,再除以自己的标准差,所得到的新变量Z=(X )/ ,称为原变量X的标准化变换,或简称标准化。 一般正态分布与标准正态分布之间的关系是: 若 则 Z=(X )/ N(0,1) 分布函数之间的关系:,第二节 常用随机变量以及分布,四正态分布的计算 设 ,则 例2.1 设 ,试求: 解:,第二节 常用随机变量以及分布,四正态分布的计算

30、 设 ,则,第二节 常用随机变量以及分布,四正态分布的计算 设 ,若知 , 求c,第三节 总体与样本,一总体 总体研究对象的全体称为总体。通常我们研究对象某项数量指标,即总体就是研究对象的某项数量指标X的值的全体。一般,X的取值在客观上有一定的分布F,故X是一个随机变量。因此,对总体的研究就是对相应的随机变量X的分布F(x)的研究。X的分布函数和数字特征分别称为总体的分布函数F(x)和数字特征。 p维总体在有些问题中,研究对象可能要观测两个或多个指标,则可用多维随机变量 去描述总体,也可用其联合分布函数 去描述总体。 个体组成总体的每一个基本元素称为个体。 有限总体和无限总体根据总体包含个体总

31、数的多少分为有限总体和无限总体。当有限总体所包含的个体总数很大时,可以近似地将它看成是无限总体。,第三节 总体与样本,二样本 样本总体中抽取若干个体所组成的集合称为一个样本。 样本容量样本中所包含个体的个数称为样本容量。从总体中抽出的容量为n的样本记为 ,这里每个Xi都看成是随机变量,因为第i个被抽到个体具有随机性,在观察前是不知其值的。样本的观察值记为 。 n次不重复抽样抽样时,每次从总体中抽取一个不放回去,再抽取第二个,连续抽取n次。 重复抽样抽样时,每次从总体中抽取一个进行观察后放回去,再抽取第二个,连续抽取n次。 重复抽样的特例: 对于无限总体,抽取有限个n后不会影响总体的分布,在这种

32、情况下,不重复抽样等价于重复抽样。 在实际应用时,如果总体所包含的个体个数很大,而样本容量很小,可认为总体是无限的,抽样时可以认为是重复抽样。,第三节 总体与样本,二样本 简单随机样本设X是具有分布函数F(x)的随机变量,若 是具有同一分布函数F(x)的相互独立的随机变量,则称 是来自总体X(或总体F(x) )的容量为n的简单随机样本,简称样本。即抽取的样本满足以下要求: 代表性每一个体都有同等机会被选入样本,这便意味着每一样品Xi与总体X有相同的分布。 独立性样本中每一样品取什么值不受其它样品取值的影响,这意味着 相互独立。,第三节 总体与样本,三联合分布函数和联合概率密度 若 是来自总体F

33、的一个容量为n的简单随机样本(独立同分布样本),则 的联合分布函数为 若X具有概率密度f,则 的联合概率密度为,第四节 抽样方法,统计调查与整理根据研究的目的和要求,有组织、有计划地搜集资料和对这些资料进行去伪存真、去粗取精的分类整理、浓缩简化的工作过程。 统计调查的方式按其组织方式可分为: 统计报表制度 专门组织的统计调查; 专门组织的调查可分为: 普查 重点调查 典型调查 抽样调查 其中抽样调查方法已经发展为现代统计科学的一个分支系列。 抽样的目的我们抽取样本的目的是为了对总体进行推断。为了能从样本正确推断总体就要求所抽取的样本能很好地反映总体的信息,所以要有一个正确的抽取样本的方法。,第

34、四节 抽样方法,抽样调查方法的重要特点: 随机原则(机会均等原则)按照随机原则从总体中抽取样本单位。调查者不带任何主观倾向,完全凭偶然性抽取样本单位,使总体的每个单位有均等机会被抽中。 推断总体以样本的指标即统计量为依据推断总体的参数或检验总体的某种假设。抽样调查的目的就是要对总体的数量特征作出估计或作出某种判断,而且它是以概率论阐明的有关分布规律为依据的估计,可以计算其可靠性和精确度。 误差事先控制抽样调查方法的误差可以事先计算并加以控制。用样本指标推断总体,不可避免地会产生误差,即抽样误差。抽样误差也是随机变量,其分布具有一定的规律性,可以依据这种分布规律和具体的抽样条件计算抽样误差的大小。影响抽样误差大小的因素主要有三个方面: 总体内部的差异程度; 样本容量的大小; 抽样的方式方法。,第四节 抽样方法,进行抽样调查时,必须事前根据研究对象的特点和具体条件,对抽取样本的程序和具体方法进行周密的设计,选择最合适的组织方式。基本的抽样组织方式有简单随机抽样、分层抽样、整群抽样和系统抽样。 一简单随机抽样 简单随机抽样也称完全随机抽样,对总体单位不作任何分类或排队,完全按随机原则逐个地抽取样本单位。它是在无限总体中进行的无放回独

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1