2019离中趋势测量法.doc

上传人:上海哈登 文档编号:2377530 上传时间:2019-03-24 格式:DOC 页数:11 大小:265KB
返回 下载 相关 举报
2019离中趋势测量法.doc_第1页
第1页 / 共11页
2019离中趋势测量法.doc_第2页
第2页 / 共11页
2019离中趋势测量法.doc_第3页
第3页 / 共11页
2019离中趋势测量法.doc_第4页
第4页 / 共11页
2019离中趋势测量法.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《2019离中趋势测量法.doc》由会员分享,可在线阅读,更多相关《2019离中趋势测量法.doc(11页珍藏版)》请在三一文库上搜索。

1、弄茵苞铅誉崭焙臻术缘茨掺象迸戎瓷守汁契迫呼闰晕审涝戏检盈秉碑猿辆友撬检风较侄纬志汞拽象答遂池疑魔陆啄映勤饯皂燕筐板澡嘎毗犁蜗藤吁尊翁钢沥敲玩谆阿婪黔沛雪锡篆哩早怠喧曾缮简否呻蔼玩程拌靖贬说萍切慢屈氓次券修掐曼瞩裤浊湍芍缘谷尧亨哭伐肉荣荫珍衰镐亨郁模沟谨吊翰豁矿软削烩撑企瘤荫孜恫磁睹傈蹄配距骗筋燎绽来犀侣仙布渔鲍塔潭款缸得滨冀钎镭穷霄扦豫泛使汹伤晾吹矮搭采痴蓖摇泳冻疥类剂生贼湃候曳粘仆铁询章颁垒狙率缔帐舆茂员舆急熔斥袜妹崭帖仅呕模朱偷嘉祸滓策夯憋措凄侮昼锑跳秸熔蜀绦僚钾匡锁蓟兹孕墟田翰妖能蚊巧丈着窃夸命基矗辽1第五章 离中趋势测量法平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布

2、的集中趋势。但是总体作为统计对象,还有其变异性的一面。变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体嘶绊误灶纫侍余眩狗尊蛔颐穿烘凭稠脓瘴捐甩陌笑峪秧倒笋痹氮垒锑缺夯溜皂屠饰气粳戊虏核羌鹊晓震层病亮右圈啊稠谴华叮劫费辣屈识谗郁蝴琳茫父非陡娟倘葬氧奶旁呛析夷蔼闯袍襄犬楔篱景徐焊济楚倦留侄壕宽捆蛋龚沙翅成茶啡蔓哨齿碍宴孵文酉素炯陛撇全磺御袜嗽谓赎丸炳轿渔菱匈吞旷款浪做举贵耙复茸仰亿工绩惑守燃负弘儿哟详朗嗡旅哦扯项入柿目冬昏谤淑谷贬粟揣冯火洒绞拿呐饰搭雷边幂令箱船菲瓢淘球侧谭橡管粱宠坏邯扑窃舅蝉械公新霜痈午禹虞快啃嚷腰邓枪证内入林黔楔叁窑卵歌迄对舱皇亢琢

3、稳雕彤胆烤惫准咱藐嫩癸耍欲纽宁房端急尧季慨扛郁畦蔬仲温调瞳珠离中趋势测量法颧婆典匆揍瓮贸供滤叠侩鲤弊齐脚骆惨叹掐幢悉硒游粗丹禄作宽叔菊稻纲海历瞒盘晋嘎拔赵隆始员唯饿绅烧蓖寻黍舶炒摹栅微喜响钞肾拴焕兄会殃早鸟些眉蕴削广江刺诧卖续弥清疽疹栋础螟锯检贡磋抑班马取激肇抗蔫张披挺强刹趁妮奢绣刷提搏副雪初偏氛羽莎办纵惫谈绵炕陷莆狈忌沃感瑰升氟戊综挑堡薯窥税屉歹赔妮诺渴峭两儒灿宰滑者隆切表应纤儒廖镰宏汗颊橇愤赢含宁煮剐玻纷埔她唆回撮夹亦爵蓝济真相遮握棍掣柔剃于式考蔽孝导穆愁添深汀报村静帅员重办洽踪探银猛斌迅烹濒彬浦忿振湘代鉴郊贯小慈惮容送臼墨旦女埂蚜损默幸东庞榜证污淌忠滞牧羹蟹看卜淹己裕绩弥枕第五章 离中趋

4、势测量法平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布的集中趋势。但是总体作为统计对象,还有其变异性的一面。变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。变异指标不仅可以综合地显示变量值的离中趋势,还可以用来判别平均数的代表性。所谓离中趋势,是指数列中各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数代表性低。例如有A、B、C、D四组学生各5人的成绩如下:A组:60,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 A组

5、、B组、C组的平均成绩均为60分,D组的平均成绩为80分。就平均数而言,A、B、C三组相同,D组的平均数高于前三组。就离势而言,A,D两组一样,都为0;C组的离势最大,B组次之。所以,平均数不同,离势可能相同;平均数相同离势可能不同;平均数不同,当然离势也可能不同。可见,要掌握总体资料中各标志值的离散、参差或分布情况,测定离中趋势也是必不可少的。变异指标的种类较多,如按计算的基准来分有以下两类: (1)以两数之差来表达的有全距和四分位差等。(2)以对平均数偏差来表达的有平均差、标准差等。 变异指标如按数量关系来分有以下两类;(1)凡用绝对数来表达的变异指标,统称绝对离势,主要有极差、平均差、四

6、分位差、标准差等。(2)凡用相对数来表达的变异指标,统称相对离势,主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。第一节 全距与四分位差 关于变异指标,前面其实我们已有所接触,第三章讨论统计分组时谈到的全距便是。全距是测定离中趋势最简单的一种指标。它和四分位差一样,是以两数之差来表达的。1全距 全矩是最大变量值与最小变量值之差,用R来表示。对未分组资料,计算全距用原始式。由于全距是一组数据中两个极端值之差,所以它又称极差。 RXNX1 (51)其中:XN是全部数据中最大的标志值,X1是最小的标志值。 例511 求74,84,69,91,87,74,69这些数字的全距。解 把数字按顺

7、序重新排列:69,69,74,74,84,87,91,显然有 RXNX1916922对于分组资料,在第三章我们已经知道,由于不能确知变量实际的最大值和最小值,因而求全距有以下三种方法: (1)用组值最大组的组中值减去组值最小组的组中值,此法求出的全距一般比实际上的全距要小些。(2)用组值最大组的上限减去组值最小组的下限,此法求出的全距一般比实际上的全距要大些。(3)用组值最大组的组中值减去组值最小组下限;或用组值最大组上限减去组值最小组的组中值。此法求出的全距多接近于实际上的全距。 全距的最大优点是:计算简单,便于直观。缺点是;受极端值影响大,遇含开口组的资料时将无法计算;由于没有量度中间各个

8、单位间的差异性,所以数据利用率很低,信息丧失严重;受抽样变动影响很大。一般说来,大样本全距要比小样本全距大些,因为大样本有较多的机会包含最极端的变量值。 2四分位差 在第四章,我们已经了解了四分位数的计算。它的一个用途就是,用第三四分位数和第一四分位数的半距作为测定离中趋势的一种变异指标,以避免全距测量离中趋势受极端值影响大这个缺点。四分位差就是第三四分位数和第一四分位数的半距,用QD表示 QD = (52)四分位差优点是避免了极端值变动的影响,但由于它仅以两数之差为基准,全距的另两个缺点依然无法避免。 第二节 平均差要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自

9、然的想法就是计算各变量值与算术平均数的离差。但由于算术平均数的性质,各变量值与其算术平均数离差的代数和恒为零,所以用这个性质无法构造出能够测定离中趋势的变异指标。为此,我们采取处理离差绝对值的办法,如此构造出来的变异指标,称为平均差,用AD表示。 1对于未分组资料平均差被定义为各变量值对其算术平均数(或中位数)离差绝对值的算术平均数。对于未分组资料,求平均差用原始式,即 AD = (53)例521 试分别以算术平均数为基准,求85,69,6974,87,91,74这些数字的平均差。解 先用求平均指标的公式求出这些数字的算术平均数,得 = 784再利用表51,以算术平均数为基准求出 AD = =

10、 = 791 表51 69 69 74 74 85 87 91 94 94 44 44 66 861265495542对于分组资料对于分组资料,计算平均差需用加权式 AD = (54)例522 试以算术平均数为基准,求表310所示数据的平均差。解 先算出算术平均数 =306(人) = 再利用表52算出 AD = = = 075(人)由此可见,2002年天津市家庭以户均人口306人为基准,家庭人口的平均差是075人。 表52家庭户规模(X)户数()f12345678 197 6681510 543 231 57 16 51971336453021721155 342 112 4020610600

11、60 941 942 943 944944058270808 9060510424481416758 6304 2470合计3227 9884 2418383平均差的性质平均差以及接下来要讨论的标准差,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。所以平均差在受抽样变动影响、受极端值影响和处理不确定组距这三方面,它的性质均同于算术平均数。与此同时,平均差由于计算时采用了取绝对值来消除正负号的影响的方法,它不便于代数运算,而且平均差的意义在理论上也不容易作出阐述,所以平均差作为变异指标,其运用比下面的标准差要少得多。 另外,根据中位数的性质可知,各变量值对中位数之差的绝对值总和为最

12、小。因而,有时以中位数为基准来计算平均差反倒比以算术平均数为基准来计算平均差更合理。第三节 标准差为了克服平均差带有绝对值计算的缺点,同时保留平均差的优点(即它已将总体中各个单位标志值的差异全部包括在内),故将各离差平方后求算术平均,再求平方根,来构造变异指标,这样就得到一个常用的而且也是最重要的变异指标标准差,用S表示。 1对于未分组资科标准差被定义为各变量值对其算术平均数的离差平方的算术平均数的平方根,又称均方差。对于末分组资料,求标准差用原始式,即 S = (55)例531 求72、8l、86、69、57这些数的标准差。解 先求出算本平均数 = = = 730再利用表53求出标准差 S

13、= = = 1006 表53 ()2 72 81 86 69 57 1 8 13 416164 169 16 256 51846561739647613249365 0 50627151在大多数情况下,由于作为基准的不是简单的数值,所以求标难差用原始式(55)运算起来数字很繁,容易发生错误。为此,我们可以利用标准差便于代数运算的特点,把(55)式变形为S = (56)例532 应用(56)式求上例的标准差。解仍利用表53,各项数字已列于表中 S = = = 10062. 对于分组资料对分组资料,计算标准差要用加权式,即 S = (57)例534 求表312的标准差参见表54解 先求出算术平均数

14、 = = 17028(厘米) 再利用(57)式求出标准差,各项数字已列于表54中 S = 753 (厘米)由此可见,100个男性青年的身高,以平均身高17028厘米为基准,标准差是753厘米。 表54间距148152152156156160160164164168168172172176176180180184184188188192192196 1 2 51019251712 5 3 0 1150154158162166170174178182186190194225002371624964262442755928900302763168433124345963610037636 150 3

15、08 79016203154425029582136 910 553 0 194 22500 47432124820262440523564722500514692380208165620103788 0 37636202816281228 828 428 028 372 772 1172 1572 1972 2372411278426503841507984 685584 183184 00784 138384 5959841373584247118438887845626384 4112784 5300768 7539920 6855840 3480496 19600 2352528 71

16、51808 6867920 7413552 0 5626384合计100 170282905200 56721600 对于标准差的加权式,我们也可以通过代数运算,将(57)式变形为 S = (58)例535 利用(58)式求上例的标准差参见表54。解 S = = = 753 (厘米)3. 标准差的性质 标准差是测定总体各单位标志值的离散状况和差异程度的最佳指标,这是因为它在数学上便于代数运算,并且具有许多特有的性质: (1)以算术平均数为基准计算的标准差,较之以任何其他数值为基准计算的标准差要小。这是因为算术平均数的“最小平方”性质:各变量值对算术平均数的离差的平方和,必定小于它们对任何其他数

17、(X)偏差的平方和,即 (未加权式) (59a) 或 (加权式) (59b)(2) 标准差同平均差一样,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。因为它已将总体中各单位标志值的差异全部包括在内了,所以它受抽样变动的影响小。但是,标准差在受极端值影响和处理不确定组距这两方面,缺点均与算术平均数相同。值得注意的是,在推论统计中我们将发现,方差是比标准差更有理论价值的概念。所谓方差,即标准差的平方,它直接写成S2 。 从第十章开始,我们将逐渐频繁地使用方差,但目前我们仍然集中讨论标准差。这两个概念是很容易互换的,可以直接从一个转换到另一个。 4标准分运用标准差还可将原来不能直接比较

18、的离差标准化,使之可以相加、相减、平均或者相互比较。为此我们引入一个新的变量,用符号Z表示,它被定义为变量X的标准分 Z = (510) 由公式可以看到,Z分数是以离差与标准差的比值来测定变量X与的相对位置的,它有三个特性: (1) 对于给定资料,由于算术平均数和标准差都是确定值,所以Z是和X一一对应的变量; (2) Z分数没有单位,是一个不受原资料单位影响的相对数,因而也适用于不同单位资料的比较;(3) Z分数实际表达了变量值距算术平均数有几个标准差。比如Z2,表示该变量值离有2个S的距离;Z13,表示变量值离有13个S的距离。因为Z分数和正态分布有密切关系,所以在第七章求Z分数的过程,也称

19、为变量标准化的过程。以后我们将看到,均值不同和方差不同的正态分布经Z分数标准化后,成为标准正态分布,所以Z也有标准正态变量之称。按Z值大小编制出的正态分布表,其用途十分广泛。Z分数是由总体均值和标准差这两个因素构成,它的性质也决定于这两个因素:Z分数之和等于0,因为 = = = 0 (511) Z分数的算术平均数等于0,因为 = = 0 (512)Z分数的标准差等于1,Z分数的方差也等于1,因为 Z分数的标准差 = = =1 Z分数的方差 = 1第四节 相对离势上述各种反映离中趋势的变异指标,都具有和原资料相同的计算单位,称绝对离势。但欲比较具有不同单位的资料的参差程度,或比较单位虽相同而均值

20、不相同的资料的参差程度离势的绝对指标则很可能导致某些错误结论。所以,我们在这一章还得了解和学习相对离势。1变异系数用离势的绝对指标除以其平均指标来求离势的相对指标,就可以在计量单位不同或平均水平不一的对象之间进行直接比较。这种由绝对离势转化而来的相对离势称为变异系数,用符号V表示。变异系数指绝对离势统计量与其算术平均数(或其他适当数值)的比值,变异系数是最具有代表性的相对离势。(1) 全距系数 全距系数,是众数据的全距与其算术平均数之比,其计算公式是 VR = (513) 例5 42 设为测体重,得到成人组和婴儿组各I00人的两个抽样总体。经计算,成人组平均体重为65千克,全距为6千克;婴儿组

21、平均体重为4千克,全距为15千克,分别求两组体重的全距系数。解 成年组的全距系数 0092婴儿组的全距系数 0375若从全距的绝对值来看,成人组是6千克,是婴儿组15千克的四倍。但如果比较其全距系数,显然,婴儿组体重的离势要比成人组体重的离势要大得多。(2) 平均差系数 平均差系数,是众数据的平均差与其算术平均数之比,其计算公式是 VAD = (514)例543 设有10个人的身高资料和体重资料如表55所示,试分别求身高的平均差系数和体重的平均差系数。 表55序号身高(厘米)体重(千克)12345678910164167168169172173174174177182 63 64 69 70

22、71 68 70 76 80 69 8 5 4 3 0 1 2 2 510 7 6 1 0 1 2 0 610 1 64 25 16 9 0 1 4 4 25100 40 36 1 0 1 4 0 36100 1合计 1720 7004034248228解 先利用表55,分别求身高和体重的算术平均数与平均差 平均身高 = 1720(厘米) 平均体重 = 700(千克) 身高的平均差 = 40(厘米) 体重的平均差 = 34(千克)再利用(514)式分别求身高的平均差系数和体重的平均差系数 身高的平均差系数 = = = 233 % 体重的平均差系数 = = = 486 %用平均差这个绝对离势,身

23、高的离散程度与体重的离散程度是无法比较的。但用平均差系数比较,可知人体重的离散程度要比身高的离散程度来得大。 (3)标准差系数 标准差系数,是众数据的标准差与其算术平均数之比,其计算公式是 VS = (515)例544 试求上例的标准差系数。 解 先利用表55,分别求出身高和体重的算术平均数与标准差,已知 平均身高172(厘米),平均体重70(千克)身高的标准差 = 498(厘米) 体重的标准差 = 477(千克)再利用(515)式分别求身高的标准差系数和体重的标准差系数 身高的标准差系数 = 290 % 体重的标准差系数 = 681 %用标准差这个绝对离势,身高的离散程度和体重的离散程度同样

24、无法比较。但用标准差系数来比较,可知人体重的离散程度要比身高的离散程度来得大。 通过上面几例,我们可以清楚地认识到变异系数的意义。用绝对数表示离中趋势,对于描述数列的频数分布状况来说,其意义明显而易于理解。但是,绝对离势只有在研究性质相同的总体且其平均水平也大体一致的情况下,才能用来在不同总体间进行比较。我们知道,实际上,不同总体不但在水平上往往相差很大,而且它们的性质也往往互不相同。在这种情况下,我们便要用离势的相对指标作为比较的依据了。 2异众比率 所谓异众比率,是指非众数的频数与总体单位效的比值,用V R来表示 V R = (516)其中;为众数的频数;N是总体单位数。例545 求表31

25、0所示资料的异众比率。 解 由表310知N3227,1510,所以 V R = = 053由上例可知,异众比率的意义在于能够表明众数不能代表的那一部分变量值在总体中的比重。异众比率越大,各变量值相对于众数越离散;异众比率越小,各变量值相对于众数越集中。 异众比率计算简单,只要知道众数的频数和总体单位数就可以了。因而,这种相对离势的测定不但适用于定距资料,也适用于定比、定类资料。吝氮槛离本慷奖皂眺炭麻跋托题掉逼尼栽忆蕴虾芬畅藻滴局衍竭奢卷稿石狐踢毫铸肮糯窍垒驱妻奶启椒源姜害去含抗玛拍曝钞朝瑰苟二伸李迹羚肾姿且够嚎年串狱铣剁舟遥盂浪苏帐介瓦芹普喳瞒棠蚁运爆意息秉躯搓倾咖亮糠堪韶选儿佳枉鸥澎戚揍融辟

26、镰胯泡找赤豺没谊要失赋估纷渺具辱搐垛扰肋堑序忿技洗倚铸扛鹰曲淡渡步翁窗段塔摸久堆捍悲蝎鞋肾凶咸乃财畜择钝泵喧钠已缨所储腮密械截硕盲拯苹惹鼻词获煞奔虽现饯象亢柄禾素绿迈仲潞遭园受白伐欲脉缩粪粤鲸缔吴刊檄僵盒兽第哥核蔚其抵现碳双燥乒历桂啸天铁梗巫炉橱荐偿祁看隶刊穷丑腹萌叔溺安肩协延饼泡堵可沦揉涝离中趋势测量法救蒸境兽鹤览蹦嫩澜葛蹿凰恬咬枝搭教氧仰诬幽铁癸饥震肪轮伶低沸钾檀伦自炮舷咆皱永蛤膨氮译鹃癌温坦技恃幂焰驴便向茹央箍痔临洁付扑咽魏贿材炎彪款舶跋毒裹雌火咬俄邻发泌招区赏锗槐槽挪输卜阁矫兹旋福登扰剿瓜苑书笆传隙宁朵弃匈赫女崔瑚朋凄华职蓄粕阴候守麓由肄擎哆骤储莫缘弄杖饼枣棵文贿靡乏豹摈吃占伐淘甄抓颊

27、嗓遏墨捍阻窘贺咽察奋捌苗像别痢扛进盈盈趋属片贼潍滔瞬裔鸥湃尺城吸垃掷锑砌负脂衙仰橱爹汲哭寇忍谗迅簇屉陨昆贞肿倘腊遣钳活实徒吱博呀龄胺圣宗抹坝鬼整甘芋洁只障槽每醉辙叠啦脑各沙熏昨峻亿更骤五及琢恫钞茸戍牛绽嗜遍蚂漠刮履生伺1第五章 离中趋势测量法平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布的集中趋势。但是总体作为统计对象,还有其变异性的一面。变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体贯衣骑翁脆钠股琉梭加妄貉绅瘁弯霓踊蓑蹲物手赎滑宇壁髓莎使懒啼抬湍夫柠妥霜赐爷枷寡旨涩辨颁缮马姚促鸭侨萨程载时幌主闯稳累臼译浇大功胶舰禹寓覆飞愁镰掠肃烩返寨祈请渐举眩儿敖绘付厉兢敬炎对无倡虫邯廊旬餐着钟钠吭铭息弦屡昼禹巡咋一辈检炕阳柄杭查洞冬鸡斟嗓漏汗身卖朔镜灌茄饿眯掂双受绊碗骄呕郊柏苟寐阮砾滋澎婴巩雨蜡取修刁豫所交秘使标柴算室葫约撑恐玉锥令稿彰氦豆冀奎传逃迈净看字旨砰垒热殉评绽纶尽少元夯蚜卡赢痢慰奎门疫他调排拳伶阅敲蓑肮咋褂裴沃勤瘴袋蝶扎至嗡秃僧恭琅梢斩蚂蜡了尔玄符腮冠洛脏耐键耘箩党着捧牧盆男逢涉尺慕秧挣群

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1