PermutationTest置换检验.doc

上传人:scccc 文档编号:13881845 上传时间:2022-01-25 格式:DOC 页数:3 大小:106.50KB
返回 下载 相关 举报
PermutationTest置换检验.doc_第1页
第1页 / 共3页
PermutationTest置换检验.doc_第2页
第2页 / 共3页
PermutationTest置换检验.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《PermutationTest置换检验.doc》由会员分享,可在线阅读,更多相关《PermutationTest置换检验.doc(3页珍藏版)》请在三一文库上搜索。

1、Permutation Test 置换检验显著性检验通常可以告诉我们一个观测值是否是有效的,例如检测两组样本均值 差异的假设检验可以告诉我们这两组样本的均值是否相等(或者那个均值更大)。我们在实验中经常会因为各种问题(时间、经费、人力、物力)得到一些小样本 结果,如果我们想知道这些小样本结果的总体是什么样子的,就需要用到置换检验。Permutation test置换检验是Fisher于20世纪30年代提出的一种基于大量计 算(computationally intensive),利用样本数据的全(或随机)排列,进行统计推断的方法,因其对总体分布自由,应用较为广泛,特别适用于总体分布未 知的小样

2、本资料,以及某些难以用常规方法分析资料的假设检验问题。在具体使用上它和Bootstrap Methods类似,通过对样本进行顺序上的置换,重新计算统 计检验量,构造经验分布,然后在此基础上求出P-value进行推断。F面通过一个简单例子来介绍 Permutation test的思想。假设我们设计了一个实验来验证加入某种生长素后拟南芥的侧根数量会明显增 加。A组是加入某种生长素后,拟南芥的侧根数量;B是不加生长素时,拟南芥的侧根数量(均为假定值)。A 组侧根数量(共 12 个数据):24 43 58 67 61 44 67 49 59 52 62 50B 组侧根数量(共 16 个数据):42 4

3、3 65 26 33 41 19 54 42 20 17 60 37 42 55 28我们来用假设检验的方法来判断生长素是否起作用。 我们的零假设为:加入的生 长素不会促进拟南芥的根系发育。 在这个检验中,若零假设成立,那么A组数据 的分布和B组数据的分布是一样的,也就是服从同个分布。接下来构造检验统计量一一A组侧根数目的均值同B组侧根数目的均值之差。statistics mea n(Xa)-mea n(Xb)对于观测值有Sobs:=mea n(Xa)-mea n(Xb)=(24+43+58+67+61+44+67+49+59+52+62+50)/12-(42+43+ 65+26+33+41+

4、19+54+42+20+17+60+37+42+55+28)/16=14我们可以通过Sobs在置换分布(permutation distribution )中的位置来得到它 的 P-value。Permutation test的具体步骤是:1. 将A、B两组数据合并到一个集合中,从中挑选出12个作为A组的数据(X a), 剩下的作为B组的数据(Xb)。Gourp:=24 43 58 67 61 44 67 49 59 52 62 50 42 43 65 26 33 41 19 54 42 2017 60 37 42 55 28挑选出 X a:=43 17 44 62 60 26 28 61 5

5、0 43 33 19X b:=55 41 42 65 59 24 54 52 42 49 37 67 67 20 42 582. 计算并记录第一步中 A组同B组的均值之差。Sper:= mean(Xa)-mean(Xb)= -7.8753. 对前两步重复999次(重复次数越多,得到的背景分布越”稳定“)这样我们得到有999个置换排列求得的999个Sper结果,这999个Sper结果能代 表拟南芥小样本实验的抽样总体情况。Histogram of results-15-10-5051015results如上图所示,我们的观测值 Sobs=14在抽样总体右尾附近,说明在零假设条件下 这个数值是很少

6、出现的。在 permutation得到的抽样总体中大于14的数值有9 个,所以估计的P-value是9/999=0.01最后还可以进一步精确P-value结果(做一个抽样总体校正),在抽样总体中加 入一个远大于观测值 Sobs=14的样本,最终的P-value=(9+1)/(999+1)=0.01 。(为 什么这样做是一个校正呢?自己思考:)结果表明我们的原假设不成立,加入生 长素起到了促使拟南芥的根系发育的作用。参考资料:1. on te nt/cat_080/pdf/moore14.pdf2. http:/jpkc.njmu.edu.cin /course/ton gjixue/file/

7、jxzy/tjjz02.htm3. http:/www.r- ng/chi nese/541附录:R语言求解上例的代码a(24r43,58r67,61,44,679,59,502,43,65,26,33,41,19f54f 42,2047r60r37,42f55r28) group -Factor(c(repC 12) f nepCBlb)data -data .frame(g nouip.a)find. meen-ftjnctioo(JtXmea n(x g raup= Ar2)-mea n(xgnxjp=Bf2)resu Its -repli cate(的9 rfi nd.meanfdat

8、a. fra me(g roup.sam plefdata ,2)p.va I ue-length(results resultsmaa n(data g roup= A; 2)-mea n(da ta group=1000 histfresu tebrea ks=20f prob=TRU E)lines(densrtyfnesults)av-c(24,43,58,67,61,44,67,49,59,52,62,50,42,43,65,26,33,41,19,54,42,20,17,60,37,42,55,28)groupv-factor(c(rep(A,12),rep(B,16)data-data.frame(group,a)find.mean-function(x)mean(xgroup=A,2)-mean(xgroup=B,2)results-replicate(999,find.mean(data.frame(group,sample(data,2)p.valuemean(datagroup=A,2)-mean(datagroup=B,2)/1000hist(results,breaks=20,prob=TRUE) lines(density(results)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1