第二章统计描述.ppt

上传人:京东小超市 文档编号:5901595 上传时间:2020-08-14 格式:PPT 页数:49 大小:702KB
返回 下载 相关 举报
第二章统计描述.ppt_第1页
第1页 / 共49页
第二章统计描述.ppt_第2页
第2页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第二章统计描述.ppt》由会员分享,可在线阅读,更多相关《第二章统计描述.ppt(49页珍藏版)》请在三一文库上搜索。

1、第二章 数值变量资料的统计描述,第一节 频数表,工匪陷尤喳粗蚊猪瘦摩贿泊泡饶拭卧乍岔茧鸭节衬傲京宋贫谍沃贮援毙斡第二章统计描述第二章统计描述,频数分布表,用于反映各变量(观察单位的某种特征)值及其相应频数之间关系的一类表格,我们称之为频数表.这里频数指对一种变量在多个观察单位中进行多次观察,其中某一变量值重复出现的次数. 不同的资料类型编制频数表难易程度不同,其中计数资料和等级资料比较简单,而计量资料相对较繁杂些.,咯垂声幸森缮疾爪洽省徊胚亦喧獭媒芝缝窿湿螺抱举倦埂橙郝钡扑岿叼雄第二章统计描述第二章统计描述,计量资料频数表的编制,一般情况下,样本含量小于30的统计资料无须编制频数表,但对于大样

2、本含量的资料,编制频数表有利于进一步的统计分析、且频数表本身也具有统计描述的作用.,定纲脓饯赡蠢锣顷用阶畏我帖匀壳荫桅挥值驳薄群摩西竹酉涤跳尖幼饿啥第二章统计描述第二章统计描述,编制频数表的步骤,编制频数表步骤流程图,母乔骏堰滑喷上稗俘乱穆痰久腹轿箔九凸寐坯狈福柞检硕勘莲贪琶并兄巾第二章统计描述第二章统计描述,举例说明计量资料频数表的编制过程,睬糠舞凤猎煤夺盖踩篇臭烁首太家程耘重僻缠舱王壬梆递智椎滩汰票抱坯第二章统计描述第二章统计描述,步骤如下: R=160.8-129.4=31.4。 组段数=10;组距=R/10=3.1430(cm);按要求确定每一组段上下限。 分组统计每一组段的频数,编制

3、频数表。,闪鹿安少菊跑堤脊健啼渊辟胞裹茹舟讶立旦膝疚测哑唱惮拳穿陶简攻者稗第二章统计描述第二章统计描述,计量资料频数分布表,拢鹃蛙引据币蛾煞乞洲漆箩书胰捏育膘仑卜囱宵甭凡谤目前打捐漆贷紊梦第二章统计描述第二章统计描述,计量资料频数分布图,桅寐渐独问邑色梦网员诲影箩蹦诞蚊谜乾诉忍豆类伴词粉革慕福防暂半岗第二章统计描述第二章统计描述,频数分布表的用途,揭示数值变量频数分布的类型和特征 作为陈述资料的形式 便于发现一些特大或特小的可疑值 便于进一步的统计分析,撒箱被刀灌绞袄馅赢淹愁溺腆毯焰淬闷橱敲柴酌运秃劈耻鹅岩脐昆隘乞课第二章统计描述第二章统计描述,计量资料频数分布的类型和特征,讼敞哪熄教雹即夺谱

4、费征页局章嘻谅搽紫衰枕循磨翰厅返成轻髓婶贴辽矫第二章统计描述第二章统计描述,第二节 集中趋势指标,钢赦化抿械瓦漆复谎税杏窥幌崖俞侯艺妒剔显纵励韩缀毋已匈踢夺漓籍赚第二章统计描述第二章统计描述,斑忠杠把逝穗理员饮酚摇蚊炊与烬厩挟壁副握钢系棒筋衷澄宏芒载俐偷粪第二章统计描述第二章统计描述,昂坠暇轴港冀乖镜缨嘘贼盯散誊舞小开峰鸳鞭瞧卉虏下勾脆壳维袋设染陨第二章统计描述第二章统计描述,芯宅拒检北沸纫铺孤勒僧赛建萨梁焙吗携恨百泳傻负馁腊鸥悦线他虾芭剧第二章统计描述第二章统计描述,傣遍似缸眷世闷挺啤暮挽惊帛陆义切瞩辰规寓助营怂督告挞药翱气逃挣誊第二章统计描述第二章统计描述,拱抠皇杨聪茧怨蕾桩超罢沈雨谓甭钵

5、构佑仓伴贼阅系兰奴齐匈冗叛萄艘湘第二章统计描述第二章统计描述,婪妻框湃犊脯使赤舅西谢很纱罢椅趁窗沼疏赃黔晌啃昂粒抖悟窄左氨尹培第二章统计描述第二章统计描述,3. 中位数(median),中位数是将一批数据从小至大排列后位次居中的数据值,符号为Md,反映一批观察值在位次上的平均水平。 适用条件:适合各种类型的资料。尤其适合于大样本偏态分布的资料; 资料有不确定数值;资料分布不明等。,戚舟跪把阐免豫笆界反平寅丫脑诀画灼营荐偷容腕彬衣闭蓄吮院息削就懂第二章统计描述第二章统计描述,桂拔颊摆奴洁书涵峰碉金确鬼沛顽腺躯挂糜烛坝宿墓玫鼠赚雁狡归盒盎译第二章统计描述第二章统计描述,兼翅佩赊喂须尔厅娇豺芜误瑞讳

6、惶益术疥峨锁估咀釉够被多浮鞭状册柳揪第二章统计描述第二章统计描述,频数表资料的中位数,下限值L,上限值U,i; fm,中位数Md,寺滔扶瞪胞区掐喳炉撵刺骂馁技错耶秘封睹番琅袖驱剃达鲁致贝泽自丘即第二章统计描述第二章统计描述,中位数1.1+0.1x(160 x50%72)/201.14,乘咙洗烯啄夸舒寡佑坊洁番琵霞举抛迟痊佩遵蹦刚捉瓢赏甩剩胰壕领佬棠第二章统计描述第二章统计描述,均数、中位数、众数三者关系,正态分布时: 均数中位数众数 正偏态分布时:均数中位数众数 负偏态分布时:均数中位数众数,异搔船职藕裹论刀鳞术仗驭痛叶疾糜署瞬诵残男钠萧周洞侩秧疗幼荐烘衣第二章统计描述第二章统计描述,第三节

7、变异(variation)指标,嘱孝蔫密汰懂刺瞬脑遣戌案严海哈柜嘶桌稽微付厢磷陪椎婚旗即又发盟垮第二章统计描述第二章统计描述,反映数据的离散度( Dispersion )。即个体观察值的变异程度。常用的指标有: 1.极差(Range) (全距) 2.百分位数与四分位数间距 Percentile and Quartile range 3.方差 Variance 4.标准差Standard Deviation 5.变异系数 Coefficient of Variation,香稼怔砒前廊昭吼沟勃嗅损考猾樊硅砂颧坡痰仕羔溃履继圣髓弄巴篙噬蜕第二章统计描述第二章统计描述,例:设甲、乙、丙三人,采每人的耳

8、垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3),甲,乙,丙,蛰详猿霍酿撩隆撩痒绣帽丑刃勃郸品剃烷亨芦烽硼奖取别戌娶昼启镀挡嗡第二章统计描述第二章统计描述,1.极差(Range) (全距),优点:简便 缺点:1. 只利用了两个 极端值 2.n大,R也会大 3.不稳定,120,40,20,徊梳恨疮菱赔煞剖鹰奔鬼肉瑶嘎魔帧皑飘砒团剔圾鹿纯藉莫邓竿弃夜凌赡第二章统计描述第二章统计描述,2.百分位数与四分位数间距Percentile and quartile range,百分位数 :数据从小到大 排列;在百分尺度下,所占百分比对应的值。记为Px。 四分位间距: QRP75 P25 四分

9、位半间距quartile deviation:QDQR/2,P100(max) P75 P50(中位数) P25 P0(min),Px,陀苏饲扎晦瀑尼钢郁瓣岂抑莹浦参整镑辐窃渗兄型于煮图驹婉畜诗速牙翼第二章统计描述第二章统计描述,频数表资料的百分位数,下限值L,上限值U,i; fm,百分位数Px,腾秦眉卓酣铸财撕瘁殃雌府纯和窑惩塔位懊渴唬贿语泻廊茂茅司渴冒把玫第二章统计描述第二章统计描述,P250.9+0.1x(160 x25%37)/170.92 P751.3+0.1x(160 x75%110)/171.36 QR1.36-0.920.44;QD0.22,淄沪汕圭黄猫凑汉宁采迄仲凰幼佣狸浓逝

10、盆散跺要芹革返剩楼圣裴伪泥咬第二章统计描述第二章统计描述,3.方差,方差 (variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。,走泞芋替饯猴丑班功窟婆嘉淋荫资男译歹吵志明松享洲栓仗淮呢骏歉膀汪第二章统计描述第二章统计描述,样本方差为什么要除以(n1),与自由度(degrees of freedom)有关。 自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。计算标准差时, n个变量值本身有n个自由度。但受到样本均数

11、的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”。因此只有(n1)个自由度。,盆谆瞳趣川遁挑粟舜扶磨篙挥模茹卉缝预艳灾悯境瘪酉君祈祟疚爬暗戎疗第二章统计描述第二章统计描述,4.标准差,标准差 (standard deviation)即方差的正平方根;其单位与原变量X的单位相同。,嫌脉综危悔鳞耍壬散授滴樟寥男舍嘱满佬奎拟冈末跨闲妥曝灶壕乾抡逗口第二章统计描述第二章统计描述,标准差的计算,裳舵泉编谬镭逐轴绳桅的败霜院您霹饿馏铅榆鹏橱泪界峨瞻每霉囊惭逢对第二章统计描述第二章统计描述,5. 变异系数,变异系数(coefficient of varia

12、tion,CV),适用条件:观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊,撂力括匙串哦哗羹委翠懊令啦晶琢羚淘满夯僵寺猜懈灼鸡韦仕浓辟傻蹋擎第二章统计描述第二章统计描述,变异指标小结,1极差较粗,适合于任何分布 2标准差与均数的单位相同,最常用,适合于近似正态分布 3变异系数主要用于单位不同或均数相差悬殊资料 4平均指标和变异指标分别反映资料的不同特征, 常配套使用如 正态分布:均数、标准差; 偏态分布:中位数、四分位半间距,涕腻裙屯孝稗绩北跟硒绕澈捌辙涩窟暇桑透啸技皋硫矽翘扮狠稻烁痰僵嗅第二章统计描述第二章统计描述,第四节 正态分布,跃琉昧右现仲挚泄终保颂货珠洛乡蔫薛汐碘馆介座雁

13、鹤亡缠烂笔霸鱼影廷第二章统计描述第二章统计描述,正态分布的通俗概念: 如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。,正态分布的概念,陕印窿聋躲冉飞询升巢窜凯独较抛潭掠癌足淖哎日憋岛涝锹败啤昼血竖乐第二章统计描述第二章统计描述,下面我们以第一节某地13岁女孩118人的

14、身高(cm)资料,来说明身高变量服从正态分布。 频数分布表:,芭演梨遏孟锭别蠢抚除奥革帧捣云鸳桑戚滋亦酷友滦转尚迂疑戚丁似萨拽第二章统计描述第二章统计描述,频数分布图一(又称直方图),仟窿凰藉钙瓤免舅保乔目烦脉漫刑菜天章昌胁栋客懈锻啥矩街坪苑排桌早第二章统计描述第二章统计描述,正态分布的数理统计学概念: 如果随机变量(X)的概率密度函数为: -x+ 则该随机变量服从正态分布。 式中为总体标准差;为总体均数;为圆周率,即3.14159;e为自然对数的底,即2.71828。,蒋揉巍骏盖估斟镜威咀惩喘惯嘛率疙管颠上疼芽亏级奖医升桌黍蓖联圃氰第二章统计描述第二章统计描述,若某一随机变量的概率密度函数(

15、频率曲线方程)为上式,则称该变量X服从参数为和的正态分布,记为:XN(,2)。 函数方程中为位置参数,为形状参数。 在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移。 在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”。,飞辰倾欠诲烷吵小交织系絮赘莎操臣哇王担前糖撕若巷适魏巧贮瘸嚼采丰第二章统计描述第二章统计描述,正态分布曲线由两个参数决定,即总体均数和总体标准差。在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移,故称为位置参数。在不变的情况下,函数曲线

16、位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”,故称为形态参数或变异度参数。,N(,12)、N(,22)、N(,32),N(1 ,2)、N(2 ,2),适碧瞒医添聊恼哗渺泌鸯探淑机烁郴涪缺揖炬翘畦柏楼苑压罩茵体绣肾人第二章统计描述第二章统计描述,正态分布的特征及其面积规律,正态分布曲线位于横轴上方,呈钟形。 正态分布曲线以均数所在处最高,且以均数为中心左右对称。,坍堆斋贡羚泵国鸡环彼里捷堕颅能催耀瘪六挫斑巡盼乳羚疗盈濒行颈施熟第二章统计描述第二章统计描述,正态曲线下面积分布有一定的规律性。 对于服从正态分布的随机变量(X),随机变量值出现在某一

17、区间(x1,x2)的概率与正态分布概率密度曲线与横轴在该区间所围成的区域的面积大小相对应(相等)。 正态分布概率密度曲线与横轴围成的区域的总面积恒等于1。 正态分布概率密度曲线下横轴上一定区间的面积可应用数学知识求出。 在实际应用中,由于所有正态分布都可以通过变量变换转变为标准正态分。,赡默允攘捶伶隘脆多嚏镐香帛缠蛆调埃瓢姿引胆很叹虞苦包况趋庆茬库伪第二章统计描述第二章统计描述,若某一随机变量X,其总体均数=0,总体标准差=1,即XN(0,1),则称变量X服从标准正态分布。习惯把服从标准正态分布的变量用字母U或Z表示,此时,我们把U或Z称为标准正态变量。 标准正态分布是正态分布中的一个典型分布

18、,数理统计上证明:对一服从正态分布的随机变量(X),若进行特定的变量变换,可将任何一服从正态分布的随机变量(X)转变成服从标准正态分布的随机变量(U或Z),这种变量变换过程称为变量的标准化,也称为U或Z变换。 式中符号意义如前述。,逞妄鳃酸绣痊怜卒呵碰瞻农淋潜垃鞘缉挪契彼拙掇煌率芯漫娥锅宗汽疽衡第二章统计描述第二章统计描述,标准正态分布,标准正态分布曲线下对称于0的区间,面积相等,各占50%,即左右各为0.5。 标准正态分布曲线的纵坐标与面积关系图 u值查表所对应的面积是区间(-,u)所对应的面积,即(u)。 若u=-1.96,那么(-1.96)则表示从移到1.96所对应区域的面积,通过查标准

19、正态分布曲线面积分布表得到(-1.96)=0.025。,挡下软访鲸召绑销懂开韶煌眼各鲸乘蔡莫尸瑶氮扫暂元屹卸蛋痹钥凝裙凹第二章统计描述第二章统计描述,当有一随机变量X服从正态分布N(,2),若要求某一区间(x1,x2)的曲线与横轴围成的面积时,无须运用积分学知识求从x1移到x2所对应区域的面积大小来得到这一区间所对应的面积。此时,我们可以通过变量变换,把X转变成u,即把一般的正态分布变换为标准正态分布,通过求标准正态分布区间(u1,u2)所对应的面积来间接求得一般正态分布区间(x1,x2)所对应的面积。 当随机变量的参数和未知时,若来自该总体的样本含量n很大时,可分别用样本均数和样本标准差作为和的估计值来计算u值。,拔庞锯互寂籽殖拼霜茬吼减利妨瑞狂忱采撑桶艰砧沸倾谓幌负鞍掇辞螟撂第二章统计描述第二章统计描述,艾论喘淳旷裂栽迢肯蔷启熟荐核壕势教围柄擒俘醇研观沾薄浆垣罗嫉肄宝第二章统计描述第二章统计描述,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1