完整word版,体育统计学复习资料.docx

上传人:啊飒飒 文档编号:10773870 上传时间:2021-06-03 格式:DOCX 页数:13 大小:274.22KB
返回 下载 相关 举报
完整word版,体育统计学复习资料.docx_第1页
第1页 / 共13页
完整word版,体育统计学复习资料.docx_第2页
第2页 / 共13页
完整word版,体育统计学复习资料.docx_第3页
第3页 / 共13页
完整word版,体育统计学复习资料.docx_第4页
第4页 / 共13页
完整word版,体育统计学复习资料.docx_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《完整word版,体育统计学复习资料.docx》由会员分享,可在线阅读,更多相关《完整word版,体育统计学复习资料.docx(13页珍藏版)》请在三一文库上搜索。

1、 第一章绪论1 体育统计学的定义是一门将概率论和数理统计的理论与方法应用于体育领域,为体育实践提供解决问题的方法的工具学科。属方法论学科范畴。1 总体:根据统计研究的具体研究目的而确定的同质对象的全体。样本:根据需要与可能从总体中抽取部分研究对象所组成的子集。个体;组成总体的每个基本单位,即被研究对象的单个观测值。2 样本容量(含量):样本中所含个体的数目。记为:“n”。3 总体容量:总体中所含个体的数目。记为:“N”。4 指标:对于自然科学研究者来说,是在实验观察中用来指示(反映)研究对象中某些特征的可被研究者或仪器感知的一种现象标志。5 统计量:由样本所得,关于样本特征的统计指标。6 有效

2、数字:通常将仅保留末一位估计数字其余数字为准确数的数字称为有效数字。统计误差:统计分析过程中产生的数据与真值之间的差距。分为两大类:测量误差和抽样误差。7 系统误差:由于实验仪器、操作人员的操作水平、以及实验环境等因素产生的误差。1 研究设计:确定研究方向选择课题作出研究设计(基本过程)调查设计(问卷调查、专家访问、文献资料等)研究设计试验设计2 对试验设计的几点要求:1)所取的每个试验对象的测量值,不能有系统误差。2)应该选取适当的试验指标(价值)。3)所测得的数据应能找到相应的数理统计方法进行分析,使得所取数据能够满足统计分析的基本模型。3 数据的收集应注意的问题:1)保证资料的完整性、有

3、效性和可能性。2)保证样本的代表性(遵循随机抽样原则)。附:几种常用的随机抽样方法1)单纯随机抽样法(抽签法、随机数表法)2)机械抽样3)分层抽样(类型抽样)4)整群抽样第二节频率:(在统计学中)是指在一次试验过程中,某事件发生的次数与样本容量的比值。一、资料的审核资料的整理审核数据资料的准确性和完整性。步骤如下:1 初审3 复核2 逻辑检查二、频数分布表和频数直方图的制作整理步骤如下:3 确定分组点及各组的上下限4 整理频数分布表1 求极差5 绘制频数直方图2 确定组数与组距 第三章样本特征数第一节集中位置量数一、定义:统计学中定义为:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。

4、二、种类:1 中位数: 2 众数:3 平均数:第二节 离中位置量数统计学中将离中位置量数定义为:描述一群性质相同的观察值的离散程度的统计指标。二、种类:极差、绝对差、平均差、方差、标准差、变异系数。1 极差:2 绝对差:指所有样本观测值与平均数之差的绝对值的和。3 平均差:指所有样本观测值与平均数之差的绝对值的和的平均数。4. 标准差:方差的正平方根。开平方根的笔算方法(拓宽内容):1) 以小数点为基点,将数据每两位向两边分段。如:1234.56702) 然后由最高位开始估算(乘方和乘法)3) 每段两位数字一起带下4) 从第二位“商”的数字起,必须将以前的“商”的所有数字先乘以“ 20”,然后

5、再考虑所上的“商”。依次向下例:求 12345.678 =?一、变异系数s1. 定义:指同一样本的标准差与平均数的比值。记为“CV”. CV=x2. 意义:用于比较不同指标间数据的变化程度。结论: CV 值大,说明数据的变化程度大;CV 值小,说明数据的差异小。第四节平均数和标准差在体育实践中的应用一可以作为选择参赛运动员的依据( 和 )xs二变异系数在稳定性研究中的应用和 大,稳定性差; 和 小,则稳定性高。s cvs cv三 “x s3 法”在原始数据逻辑审核中的应用第四章正态分布第一节概率及概率分布1 随机事件:是对于随机现象的一次观测结果。2 随机变量随机事件的数量化。1) 定义(描述

6、性的):当用一个变量来表示随机试验的结果时,这个变量称为随机变量。 1) 频率:某事件 A 在 n 次试验中出现 V 次,则 V/n 称为事件 A 的频率。2) 概率(描述性定义):随机事件 A 的频率W 随着试验次数的变化而变化,当n( A) 时,W就越( A)来越趋近于一个常数 m, 则这个常数 m 称为随机事件 A 的概率。记为p ,( A)1n即:p= W(n)n( A)( A)ii=11 小概率事件原则:在统计学中,一般将 p 0.05 的事件称为小概率事件,小概率事件在一次试验( A)中被看作为不可能事件。2 古典概型概率的计算:1) 古典概型是指能够同时满足以下两个条件的概率试验

7、模型。 全部基本事件的个数是有限的; 每一个基本事件发生的可能性相等。1 离散型随机变量概率分布的描述变量的取值是有限的,可数的,可用“概率分布列”来描述。2 连续型随机变量概率分布的描述变量的取值是无限的,不可数的,可用“概率密度函数”来描述。(二)非标准正态分布1 标准化公式m s设d N( , 2) ,则d m-h=N( 0,1)s此公式反映出新设变量 h 与原变量d 之间的关系,其实是两种分布规律之间的关系。1 非标准正态分布概率的计算总结:1)已知点求面积时,关键是先将点标准化,然后查表求解;2)已知面积求解时,关键是先找出- 到某点之间的面积,即,然后查表pd(- x)求 X 标准

8、化之后的标准点 A,最后由标准化公式求 X 的值,即mx -s mx = A += A由得到s=例 1已测得某大学男生跳远成绩的平均数x 5.20M,标准差s 0.15M,原始成绩基本呈正态分布,该校男生共 1500 人,现要分别估计跳远成绩在 5.50M 以上,5.30M 到 5.50M,4.9M 到 5.30M,4.9M 以下的人数。解:如图,要求出各区间的分布人数 必须先求出各区间的概率,即为:“已知点,求面积”。Yp31).先将点 5.50, 5.30, 4.95.50 - 5.2= 2,= 0.67 ,= -2p标准化h0.155.30 - 5.212hhp0.154.9 - 5.2

9、2340.152).求各区间的概率:04.9 5.3 5.5Xp = p1= 1- p(d 5.50)(-h2)= 1-0.9772 = 0.0228p = p2= 1- p- p(5.30d 5.50)(-h0.67)1= 1-0.0228-0.7486= 0.2286Yp = p3= p(4.9d 5.30)- h( 20.67)- p= p(-h0.67)(2h )= 0.7486-0.0228= 0.7258-2 0 0.67 2Xp = p4= p= p= 0.0228(d 4.9)(-h-2)(2h )3).求各区间的人数:n = N p = 1500 0.0228 = 34(人)

10、= N p = 1500 0.7258 = 1089(人)n1133n = N P = 1500 0.2286 = 343(人)= n N p = 1500 0.0228 = 34(人)2244(二)利用正态分布制定考核标准例 1.测得上届学生铅球成绩d (7.3,0.4 )M,现需确定本届学生铅球成绩考核标准,N2假定两届学生铅球成绩服从同一正态分布,规定各等级的人数比例为:优秀 10,良好 20,中等 30,及格 32,不及格 8,试确定各等级的成绩标准。解:如图,即已知面积,求点。1).设有x ,使得p1= 0.1d(x )1即 p= 10.1 = 0.9Ypd(- x )31查表有:p

11、= 0.9pph(- 1.28)42 由标准化公式pp51x - 7.3= 1.281X0.4x = 7.812(M)1xxxx4321同理得到:x = 7.508(M) x = 7.2(M) x = 6.736(M).324(学生练习时,注意田径赛中高优指标和低优指标的区别。)2. 统一变量的方法1) U 分法是将原始变量转换成标准正态分布的横轴变量的一种统一单位的方法。公式为:x - xx - xu =或 u =(田赛)(径赛)ss=例 1某跳远样本统计量为x 5.65M,s 0.40M,若学生甲成绩为 5.85M,乙为 5.25M,=试计算两学生的 U 分。解:将已知数据代入公式,得:x

12、 - x 5.85 - 5.65u 甲= 0.5= -1s0.40x - x 5.25 - 5.65u 乙=s0.40= 12.5 ,s = 0.8 ,学生甲成绩12.3 ,乙成绩13.0例 2某 100M 成绩样本统计量x求其U分。x - x=解:100M 成绩为低优指标,将数据代入公式u,得:sx - x 12.5 -12.3u 甲= 0.25s0.8x - x 12.5 -13.0u 乙= -0.625s0.82) Z 分法(标准百分)x - xZ = 50 100(其中“”用于低优指标,如径赛;“”用于高优指标。)6s例 1某队运动员 100M 成绩d N(14.1,0.6 ) 秒,其

13、中甲成绩为 13.3 秒,乙成绩为2 15.1 秒,问它们的标准 Z 分各为多少?解:100M 为低优指标,故有:13.314.1Z 5 010072(分)6 0.615.114.1甲Z 5 010022(分)6 0.6乙3) 累进记分法前提:原始数据服从或近似服从正态分布= kD - Z公式:Y2其中 Y 为累进分数,K 为系数,D 为变量,Z 为常数。D 是一个新变量,它与原始变量 X 和标准变量 U 的对应关系为:x - xD = 5 (“”用于高优指标,“”用于低优指标。)s累进评分的计算步骤如下: 确定起分点和满分点的成绩与分数:起分点一般为 0 分,满分点一般为 100 或 100

14、0 分。依据正态分布理论,在区间(x - 3s, x + 3s )内概率为 99.74,可以近似看作 100,此时定x - 3s为起分点,0 分;x + 3s 为满分点,100 分,可以分别计算出成绩与分数。 求累进方程式:分别计算出起分点和满分点的 D 值(利用 D 值公式),然后分别代入累进分计 = -0 2 k z2= kD - Z算公式Y,得到方程组:2100 8 k z= -2解得:K 1.67Z 6.68= kD - Zy = 1.67D - 6.68代入公式Y得到累进方程式:22 计算某一成绩对应的 D 值: 依次将各成绩的 D 值代入累进方程式,计算出累进分数,可以制作成评分表

15、。例题:教材第 76 页;人体教材第 83 页,例 5.21课堂练习:略。U分法 等距升分正态变量 Z分法 等距升分累进记分法 不等距升分非正态变量百分位数法第七章假设检验 第一节 假设检验的基本知识2. 假设检验的意义:在体育实践中应用广泛,如:比较成绩的优劣、训练方法的好坏等。3. 相关概念:显著水平指预先给定的用来判定是否为小概率事件标准的那个很小的数。用“a”表示,一般 a = 0.05、0.01、0.005、0.001 等。“1 - a”为置信水平,即可信度。拒接域指根据某一分布和所给定的显著水平而得到的一个拒接接受原假设H 的概率区域,即小概率区。0单侧检验把拒接域放在一边的检验。

16、分为左侧和右侧。有临界值U 、t 等。aa双侧检验把拒接域放在两边的检验。有临界值U 、t 等。aa2 如何判断采用双侧检验还是单侧检验,是左侧还是右侧?21) 若只是问是否存在显著性差异,而没有问差异的倾向(即增大还是减小),可用双侧检验。2) 若强调是“增”或“减”的倾向,则用单侧检验。并且依据“数据的值”的大小,是“增大”“升高”趋势用右侧检验;是“减小”“降低”趋势用左侧检验。注意:但要分清“高优指标”与“低优指标”的区别。低优指标成绩的“提高”,其实是“数据值”的“减小”,应该用左侧检验。反之则用右侧检验。第二节 参数检验一平均数的假设检验m(一) 关于一个正态总体均值 的检验01.

17、 U检验(以双侧为例)前提:正态总体、总体标准差(s )已知0m m检验的问题:从总体中抽取一个样本,通过样本检验总体均值有无显著变化( = ?)0m步骤:1)作统计假设H :总体均值无显著变化,即 =m00m m:总体均值有显著变化,即 H102)根据抽样结果,采用 U检验,计算统计量 u 值mx -su = (0,1)N00nU3) 根据给定的显著水平 a 值,做双侧 U检验,查正态表,求临界值 ,使a2a=得:p( u U )2a2 4)结论:若u U ,则拒接H ,接受H ,即总体均值有显著变化;0a12若u U ,则接受H ,即总体均值无显著变化。0a2例 1.由历史资料知道某地 1

18、2 岁男孩的身高服从d N(140,9.4 )cm,今抽查 100 名,测得2x = 143cm,若标准差无变化,该地区 12 岁男孩身高与以前有无显著变化(a = 0.05)?m m解:1)作统计假设H :现身高与以前无显著变化,即0=0m mH :现身高与以前有显著变化,即 10mx -s143 -140=3.192),采用 U检验,计算统计量 u 值: u=09.40100n3)根据给定的显著水平 a = 0.05,做双侧 U检验,查正态表,求临界值U,使a2a=得:p( u U )2a2a=1-由 p= 0.975得到:U = 1.96a(-u U若u ,则接受 。Ha0mB: 是否大

19、于 ?右侧检验m0mmmm1)H : 不大于 ,即 0100m: mH0mx -s=2)计算 值:uu00n3) 根据显著水平 a 值,作右侧 U检验,查正态表,求临界值U ,使得ap= a(uU )a U4)若u ,则拒接Ha0l =1-(kl22)11a=(表中所给的面积为临界值右侧的面积)(kl2)24)当l k l 时,接受H ;120当k l 或 k l 时,拒接H ,接受。H1201例:施丽影教材第 118 页,例 7.8.某学生的跳远成绩服从正态分布,且s= 8cm,任意抽查 10 次,结果如下(cm):0 578 572 570 568 572 570 572 570 596

20、584问着 10 次成绩是否稳定(a= 0.05)?解:1)做统计假设H :设 10 次跳远成绩稳定,即s= 8 CM (:略)H01n(x - x)2681.6i=10.652) 计算统计量k=i=1s64203) 对于显著水平 a = 0.05,自由度 n-1 = 9,作双侧x 检验,查x 分布表,求22l l l l临界值 、 ( ),使得:2121aapp= p=1-(kl2(kl2)11a=(kl2)2ll得到= 2.7= 1912lKl4) 12 接受H ,即认为 10 次跳远成绩稳定。0课堂练习:某跳远运动员踏跳时脚尖距踏板前沿的距离服从正态分布,其标准差为 10 CM,经过一个

21、周期训练后,测得其 40 次数据的标准差 S = 7 CM,问该队员的踏板准确性有无变化(a =0.05)?解:1)做统计假设H :设该队员的踏板准确性无变化,即s=s00n(x - x)2nsi240 722) 计算统计量k= 19.6i=1ss22102003) 对于显著水平 a = 0.05,自由度 n-1 = 39,作双侧x 检验,查x 分布表,求22l l l l临界值 、 ( ),使得:2121aapp= p=1-(kl2(kl2)11a=(kl2)2l1l= 58.120得到= 23.6542l4) K=19.6 =23.6541 拒接H ,即该队员的踏板准确性有变化。0注:x 检验同样有左、右侧之分,如上题中问“踏板准确性是否提高”,即问“标准差是2否减小”,应作左侧检验,请同学们练习:1)做统计假设H :设该队员的踏板准确性无提高,即s s00n(x x)2-nsi240 722) 计算统计量k= 19.6i=1ss10222003) 对于显著水平 a = 0.05,自由度 n-1 = 39,作左侧x 检验,查x 分布表,求22临界值l ,使得:p= a p= 1- al(k )l(k )= 25.695l得到4) K=19.6l =25.695 拒接H ,即该队员的踏板准确性提高了。0

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1