第二章单变量的统计描述分析社会统计学.ppt

上传人:本田雅阁 文档编号:2121833 上传时间:2019-02-18 格式:PPT 页数:54 大小:2.86MB
返回 下载 相关 举报
第二章单变量的统计描述分析社会统计学.ppt_第1页
第1页 / 共54页
第二章单变量的统计描述分析社会统计学.ppt_第2页
第2页 / 共54页
第二章单变量的统计描述分析社会统计学.ppt_第3页
第3页 / 共54页
亲,该文档总共54页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第二章单变量的统计描述分析社会统计学.ppt》由会员分享,可在线阅读,更多相关《第二章单变量的统计描述分析社会统计学.ppt(54页珍藏版)》请在三一文库上搜索。

1、第二章 单变量统计描述(3),离散趋势测量法,众值、中位值和均值都反映了资料的集中特征,但这还不够,试比较以下三组数据: 甲组:80 86 90 94 100 X=90 乙组:88 89 90 91 92 X=90 丙组:90 90 90 90 90 X=90,所谓离散趋势测量法,是指求出一个值来表示一个变项中各变量值之间的差距和离散程度。,离散趋势反应的是变量分布的分散程度,数据分布的另一个重要特征 反映各变量值远离其中心值的程度,有时又称离中趋势,离势小,平均数的代表性高;离势大,平均数代表性低。 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的集中趋势对应着不同的离散趋势的测量,4

2、,5,离散趋势的测量的内容,一.异众比率 二.极差 三. 四分位差 四. 平均差 五. 方差及标准差 六. 离散系数,一、异众比率(Variation Ration)适用于定类或以上测量层次的变量,异众比率(V)就是非众值的频数占全部个案数目的比率。 公式如下:V= N为全部个案数目,fmo是众值的频次。 这个公式所求出的是在全部的个案中有多少是偏离众值,显然,非众值的比例越小,众值的代表性越好。,可见,离异比率是众值的补充。,当V=0,说明变量只有一个取值,那是众值,这时众值可以完全代表变量;V1时,表示资料十分分散,众值几乎没有代表性。,例:调查了200名大学生,内心的苦恼倾诉对象意愿为:

3、,党团组织41人、家长49人、知心朋友52人、闷在心里32人、 班团干部15人、随便议论11人 可见N=200 fmo=52 V= 众数的代表性很低 注意:众值与众值频数,即MO与fmo的区别。,二、极差(全距),定义:一组数据的最大值与最小值之差 例如:数据72,81,86,69,和57的极差为:86与57之差等于29。,如果数据已被分组,则极差取为极端类别的中点之差 例: 青年人阅读小说书的数目,则极端类别的中点为3和18 极差R=18-3=15,优点:,计算简单,并且一目了然,特别是对外行来说,极差是唯一可理解的离差量度。,缺点:,它仅仅以两个个案为依据,而且是两个极端的个案,数据利用率

4、低,信息丧失严重。另外,极差随着样本的变化而变化很大,一般来说大样本的极差比小样本更大一些。,13,三、四分位差,检验中位数代表性高低,1. 排序后处于25%和75%位置上的值,2. 不受极端值的影响 3. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据,计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%的个案;则第一个四分位置的值(Q1)与第三个四分位置的(Q3)的差异,就是四分位差(简写Q),公式是Q=Q1-Q3) 25% 25% 25% 25% 低 Q1 Q2 Q3 高,(一) 未分组数据,首先应求出Q1与Q3的位置,公式是: Q1位置= ; Q3位置=3(

5、N+1)/4 其中N是全部个案数目,如调查甲、乙两个生产队家庭的人数,甲队有11户人家,每户人数如下: 2 2 3 4 6 9 10 10 11 13 15 Md位置= Md=9 Q1位置= Q1=3 Q3位置= Q3=11 所以四分位差Q=Q3-Q1=11-3=8,乙队有8户人家,每户人数如下:,2,3,4,7,9,10,12,12 Md位置= Md= Q1位置= Q1=3+0.25(4-3)=3.25,因此,Q3位置=3(8+1)/4=6.75 Q3=10+0.75(12-10)=11.5 所以Q=Q3-Q1=11.5-3.25=8.25,根据频次分布或四分位差,步骤如下:,Q1位置=(N

6、+1)/4=(80+1)/4=20.5 Q1=丁 Q3位置=3(N+1)/4=3(80+1)/4=60.75 Q3=乙 Md位置= 1/2(N+1)=1/2(80+1)=40.5 Md=丙 四分位置Q=Q3-Q1=乙-丁 结论,有50%的学生成绩在乙与丁之间。,21,定序数据的四分位数:例,【例3.10】根据第二章表2-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数,解:下四分位数(Q25)的位置为: Q25位置(300)/475 上四分位数(Q75)的位置为: Q75位置(3300)/4225 从累计频数看, Q25在“不满意”这一组别中; Q75在“一般”这一组别中。因此 Q25

7、不满意 Q75 一般,根据分组资料求四分位差,步骤:第一步:计算累加次数(Cf) 第二步:求出Q1和Q3位置 Q1位置=N+1/4 Q3位置=3(N+1)/4 其 中N是全部个案数目 第三步:参考累加次数分布,决定Q1和Q3的位置应属于哪一组 第四步:从所属的组中,计算Q1位置和Q3位置的数值,公式如下:,Q1=L1+( )W1 Q3=L3+( )W3,其中:,L1=Q1属组之真实下限 L3=Q3属组之真实下限 f1=Q1属组之频数 f3=Q3属组之频数 Cf1=低于Q1属组下限之累加次数 Cf3=低于Q3属组下限之累加次数 W1=Q1属组之组距 W3=Q3属组之组距 N=全部个案数目,例:

8、生产队的育龄妇女节育情况,第二步,Q1 的位置=212/4=53 Q3的位置=3/4N=3/4212=159,第三步,参加累加次数分布,可见Q1位置属于5-15组,Q3位置是45-55。,根据第四步的计算公式,计算Q1和Q3位置的数值:,L1=5.5 L3=45.5 f1=38 f3=24,cf1=16 cf3=147 W1=10 W3=10 N=212,因而:,Q1=5.5+( )10=15.2 Q3=45.5+( )10=50.5 则 Q=Q3-Q1=50.5-15.2=35.3,30,四分位差:定距数据的例子,四分位差,QQ75-Q25 128.75-117.81=10.94,【例3.1

9、3】根据第二章表2-5中的数据,计算50 名工人日加工零件数的四分位数,31,线箱图的绘制(举例),32,四、平均差 :概念要点及计算公式,1. 各变量值与其均值离差绝对值的平均数 2. 离散程度的测量值之一 3. 能全面反映一组数据的离散程度 4. 数学性质较差,实际中应用较少,5. 计算公式为,未分组数据,组距分组数据,例72、81、86、69、57、的均值是73,从每个数减去73,忽略正、负号,加上结果再除以5,得 A.D= 因此 我们可以说,记分数与均值平均相差8.4,34,平均差:计算过程及结果,【例3.13】根据第二章表2-5中的数据,计算工人日加工零件数的平均差,五、方差和标准差

10、:概念要点,1.方差是变量值与均值偏差的平方的平均值,标准差是方差的开平方 2.离散程度的测量值之一,最常用的测量值 3.反映了数据的分布 4.反映了各变量值与均值的平均差异 5根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,36,总体方差和标准差:计算公式,未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,标准差(例),38,总体标准差:计算过程及结果,【例3.14】根据第二章表2-5中的数据,计算工人日加工零件数的标准差,还有以下一些替代公式:,S=,实际上基本公式为:,例:72,81,86,69,57,N=5

11、 6561,7396,4761,3249.,42,离散系数:概念要点和计算公式,1.标准差与其相应的均值之比 2.测度了数据的相对离散程度 3.用于对不同组别数据离散程度的比较 4.计算公式为,例如, 代表性高,44,离散系数:实例和计算过程,【例3.15】某管理局抽查了所属的8家企业,其产品销售数据如表3.6。试比较产品销售额与销售利润的离散程度,45,离散系数:计算结果,结论: 计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度,46,数据类型与离散程度测度值,习题,一、根据以下统计资料:汉族,50,000人,苗族22,000人,布衣20,000人,藏族1,000人,问

12、能制成哪些统计图?对变量值的排列是否有要求? 二、直方图的高度有什么意义?什么情况下,直方图的高度也可用频次或频率来表示?,三、抽查50名学员,他们的统计学成绩如下:,试以10分为组距,用划记分法编制次数分配表,并绘制直方图。,五、将习题四的50名学员统计学成绩接下表分组,四、(续),(1)计算并填充频率栏和累积频率栏 (2)哪几组是开口组?计算其组中值 (3)第三组的实际组限是多少? (4)第二组的表面组限是多少? (5)第四组的组中值是多少?,五、将空白处填充有关数据(单位:厘米),六、以下是甲乙两村九户家庭人口数的原始数据,甲村:3;3;4;4;4;5;6;7;8 乙村:3;3;4;4;4;4;5;5;5 (1)计算两村家庭人口数的众值、中位值和均值 (2)对三种集中值作出讨论,七、以下是68名职工婚姻状况的调查 N“未婚”; M“已婚” D“离婚”; W“丧偶”,选择适当的集中值和离散值,并讨论之。,八、设以下是72名离婚者婚龄的统计,(1)试作直方图 (2)试求众值、中位值和均值并作简单讨论 (3)试求四分位差和标准差,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1