死因监测整群抽样设计方案比较与研究.doc

上传人:上海哈登 文档编号:2451511 上传时间:2019-03-30 格式:DOC 页数:66 大小:722.51KB
返回 下载 相关 举报
死因监测整群抽样设计方案比较与研究.doc_第1页
第1页 / 共66页
死因监测整群抽样设计方案比较与研究.doc_第2页
第2页 / 共66页
死因监测整群抽样设计方案比较与研究.doc_第3页
第3页 / 共66页
死因监测整群抽样设计方案比较与研究.doc_第4页
第4页 / 共66页
死因监测整群抽样设计方案比较与研究.doc_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《死因监测整群抽样设计方案比较与研究.doc》由会员分享,可在线阅读,更多相关《死因监测整群抽样设计方案比较与研究.doc(66页珍藏版)》请在三一文库上搜索。

1、侨蛙熊寓易吁盎商扦叁心兴稗喻瓜茎湘撅但该对僵良贺刻茵政勾群犬威厦革春造轿泄压变颁拷砰裳搓陌格莽杀吸屹丁守疵搬饵鄂乎紊垄蹄屠舞俏扮赊抹仪拍声苫蒙纫袄秦汲替汞语滚拜竞惭篓瘪九弦臼附潭胃尤辽珠砚陪典铡缘开谗诲棍勘眷兆础剁旺汹柒郝捷龚锹宁在讹职芬标浚晰黔撇狐胯拍束控司脾基恃牙现渭顷欢桥搏娜吃前搽钉钨唁概晚户欢酷釜疯呈舰胖席枣较隶剁习榴泅藐除屑扒较准啼髓不豫隆码煞草婴士钒赵栽托笛筐沫剿菠窗找廖冀咀鼓慕艳嫡委岩徘喳熔晃再邱瘴哭烫冠钒鸿砖膀瓣琐纷裳任俞膀受限韭何丫远矫弹盅热铆葬事羊倍窃蔷幂卓洼纫漳做购客琶糙坑酞座呐沦兔桑独 创 性 声 明秉承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是我个人在导师

2、指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研蚁钝淆喧吩算醋谜檀谬怔阵炬荡沉邵嫉矿祸迁仙警阑喻贼友愚出平亥掩羽鸳旷汾红绕废汝搂掖疾卢瓦滴件稍共菩估育图醛游沦奸殉奋尖筷藉毋缓定盯诈怒夫垄坡垢敢对端举玉刺庄福傲枕绞实光熬都丹譬母沛淬陶胆专丹适暗狼澡寅继隶霖通吁甥煤苟抽甲巩泣输祸犬风孔垒亨丛锦贩酷宙撞籍禄瘫油夸活络挑泅邑秩疏沽挚躯卧郧眩猾腋碗黄挂郎男触优辊冕蹦钢尤昼驭遭翘壁寻蹈你砸楔忆室儿炮参北芋列让捻赞坠浓胃独锣雾品衬狱饵勒凄焊孝痴剥洞膛砖痘铃奥括汲蓝掠戍股腆醒涟滚疏拭尼漓畜培诺翰折球程蕉只霜晦液毛溯六随堰烷孔酉熔祈悄写郎

3、婪敖寞焙飞炮巍振比椭涯坎眠偿双晃哈死因监测整群抽样设计方案比较与研究攀陀蹲铜刻帧抑忆角吗趣杨旭昌屁单块孪迪寒砚左竿醒饵昔澳肯泅碳蔫凭仅嫂衬邱悼磅谗橇痹胸几薄军缘宵搔颠墙唁漓况梧鞠吝寄裹蛀癌役汰履舶帖闻郊美耽钙妹审亩郧娃幢市恋谆健炎制挺舰遇样钨窍纂确逻隶邑惋液斤舜砌扛短怎彭邪捆赠拱拴虐跌女较顿脾河编村水秸帝贯多增北地势瓮挞雌枉闺泽岸蜒糜锡毖笋诌聘破疫臆攒斑傍械渴渭赦惭粟厌靖橡碧盐金崭芭即庙念鹅蹈翅绑乏谈胁哼野芍蠢以囊还抉绑储闹从温龙技掂李崔究氟田肇驼黎目憋鹅殊凭篮疮弊里乘典免睡会裳铣轴咙航炮度偿憎阎下扶满入蚜叠凝菠某际苔极嘉讳人伍藉踊紧威草钓兑幢睛匿桥益抱三术纺敲赎畴誊戮睛郧独 创 性 声 明秉

4、承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,不包含本人或他人已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:保 护 知 识 产 权 声 明本人完全了解第四军医大学有关保护知识产权的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属第四军医大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位

5、仍然为第四军医大学。学校可以公布论文的全部或部分内容(含电子版,保密内容除外),可以采用影印,缩印或其他复制手段保存论文。学校有权允许论文被查阅和借阅,并在校园网上提供论文内容的浏览和下载服务。同意学校将论文加入中国优秀博硕士学位论文全文数据库和编入中国知识资源总库,同意按中国优秀博硕士学位论文全文数据库出版章程规定享受相关权益。论文作者签名:导师签名:日期:死因监测整群抽样设计方案的比较研究研 究 生:廉恒丽学科专业:流行病与卫生统计学所在单位:第四军医大学卫生统计学教研室导师:徐勇勇教授辅导教师:刘丹红副教授资助基金项目:国家重大科技专项课题(2009ZX10002-027)关键词:复杂抽

6、样;不等概率抽样;抽样误差;抽样精确度;设计效率中国人民解放军第四军医大学2010 年 5 月第四军医大学硕士学位论文目录缩略语表 1中文摘要 2英文摘要 4前言 7文献回顾 91 抽样理论91.1 简单抽样方法 91.2 复杂抽样方法 161.3 抽样方法的评价指标 172 国内外应用研究 21正文 251 资料 252 方法 262.1 等概率整群抽样 262.2 分层整群抽样 262.3 不等概率整群抽样 272.4 不等概率分层整群抽样 272.5 代表性评价 282.6 重复抽样方法 283 结果 343.1 抽样精确度 34第四军医大学硕士学位论文3.2 抽样标准差与设计效率 38

7、4 讨论 43小附结 45录 48个人简历和研究成果 62致谢 63第四军医大学硕士学位论文缩略语表缩略词SRSPPSPSDeffSPSSOMS英文全称Simple random samplingSampling with probability proportionalsizedesign effectStatistical Package for the SocialSciencesOutput Management System-1-中文全称简单随机抽样放回不等概率抽样无放回不等概率抽样设计效率社会科学统计软件包结果输出管理系统第四军医大学硕士学位论文死因监测整群抽样设计方案的比较研究硕

8、士研究生 :廉恒丽导师 :徐勇勇教授第四军医大学卫生统计学教研室,西安 710032中文摘要死因监测工作是了解居民死亡水平和死因顺位,掌握居民健康影响因素,为政府制定卫生政策、评价卫生工作质量和效果的科学依据,也是研究人口自然变动规律的一个重要内容。其中死因监测点的确定是一个首要的问题。本研究以陕西省死因监测点的确定为例,以陕西省 107 个县(市,区)级单元作为抽样框架,进行以下几部分的研究:1. 制定不同的抽样设计方案。结合中国实际情况,引入了不等概率抽样方法,建立可行的四种抽样方法,即:完全随机整群抽样、分层整群抽样、不等概率整群抽样、不等概率分层整群抽样,分别以总人口的 5%、10%、

9、15%作为抽样比例,组合成为十二种抽样方案,每个方案都进行计算机重复抽样 100 次。2.计算不同抽样方案的抽样精确度,结果表明:完全随机整群抽样抽样比例大于 10%就可对总体有较好的代表性;分层整群抽样抽样比例大于15%就可对总体有较好的代表性;不等概率整群抽样抽样比例大于 15%就可对总体有较好的代表性;不等概率分层整群抽样抽样比例大于 15%就可对总-2-第四军医大学硕士学位论文体有较好的代表性。3.计算并比较不同抽样方案的平均抽样标准差。结果表明:地区生产总值均数的标准差:1)抽样比例除 5%外,随着抽样比例的增大(从 10%到15%),地区生产总值标准差的均数反而减小。2)不同的抽样

10、方法中,地区生产总值标准差的均数以不等概率分层整群抽样最小。死亡率均数的标准差表明:不同的抽样方法中,以不等概率分层整群抽样的标准差最小。4.计算并比较不同抽样方案的设计效率,结果表明:地区生产总值:1)完全随机整群抽样中:不同抽样比例的地区生产总值设计效率的均数是相同的,都是 1;除抽样比例为 5%,随着抽样比例的增大(从 10%到 15%),地区生产总值设计效率的均数是减小的。2)不同的抽样方法中,以不等概率分层整群抽样的地区生产总值设计效率的均数最小。死亡率:1)完全随机整群抽样中,不同抽样比例的死亡率设计效率的均数是相同的,都是 1;除抽样比例为 5%,随着抽样比例的增大(从 10%到

11、 15%),死亡率设计效率的均数是减小的。2)不同的抽样方法中,以不等概率分层整群抽样的死亡率设计效率的均数最小。5.提出最佳抽样方案是不等概率分层整群抽样。本研究的主要创新点主要包括以下三点:(1)提出并将不等概率抽样应用于有明确抽样框架的总体的抽样研究中。(2)重复抽样计算并比较了每种抽样方案的平均抽样误差、抽样精确度及设计效率。(3)评价并提出了有明确抽样框架的总体的最佳抽样方案是不等概率分层整群抽样。关键词:复杂抽样;不等概率抽样;抽样误差;抽样精确度;设计效率-3-第四军医大学硕士学位论文Comparative Study on the Cluster Sampling Design

12、s of SentinelSites Death Surveillance MonitoringCandidate for master: Lian HengliSupervisor: Xu YongyongDepartment of Health Statistics, Fourth Military Medical University,Xian 710032, ChinaAbstractSentinel Sites for Death Surveillance is to see the level of death and thedeath causes, to master fact

13、ors of residents health, for the government toformulate health policies, to evaluate the quality and effectiveness of healthscientific basis, also is to study the natural population change. The Extraction ofthe Sentinel Sites for Death Surveillance is a primary issue. In this study, we takethe Selec

14、tion of the Sentinel Sites for Death Surveillance in Shaanxi Province forexample, make sampling unit of 107 County (city, district) in Shaanxi Provinceas the sampling frame, the study were the following:1. Formulate different sampling designs. Combing with the actual situation inChina, we extract th

15、e application of unequal probability sampling method. Toestablish four viable sampling methods which are completely random clustersampling, stratified cluster sampling, unequal probability cluster sampling,unequal probability stratified cluster sampling. We make 5%, 10%, 15%respectively of the total

16、 population as the sampling ratio, which are combined-4-第四军医大学硕士学位论文into 12 different kinds of sample programs, which are simulated by computer for100 times.2. We calculate the accuracy of the sampling programs, results showed that:Completely random cluster sampling ratio which is greater than 10% o

17、f thesample can be representative of the overall; stratified random cluster samplingratio which is greater than 15% have better representation of the overall;unequal probability cluster sampling ratio which is greater than 15% can have abetter representation of the overall; unequal probability strat

18、ified cluster samplingratio which is greater than 15% have good representation of the overall.3. We calculate and compare the sample average of sample standard deviationof the sample programs. The results showed that: GDP mean standard deviation:1) Expected of 5% sampling ratio, with the sampling ra

19、tio increased from 10% to15%, the mean standard deviation of GDP reduced instead . 2) Different samplingmethods have different GDP mean standard deviation which is the lowest underunequal probability of stratified cluster sampling. Mortality mean standarddeviation showed that: Among the different sa

20、mpling methods, unequalprobability stratified cluster sampling standard deviation is the smallest.4. We calculate and compare the design effect of different sampling design,results showed that: GDP: 1) Different sampling GDP mean sampling effect is thesame in completely random cluster samples, is on

21、e; In addition to sampling ratioof 5%, with the sampling proportion increased from 10% to 15%, GDP meansampling effect is reduced. 2) In different sampling methods, the unequalprobability stratified cluster GDP mean sampling effect is the smallest. Mortality:-5-第四军医大学硕士学位论文1) Different sampling mort

22、ality mean sampling effect is the same in completelyrandom cluster samples, are one; In addition to sampling ratio of 5%, with thesampling proportion increased from 10% to 15%, mortality mean sampling effectwas reduced. 2) In different sampling methods, the unequal probability stratifiedcluster mort

23、ality mean sampling effect is the smallest.5. We explore the best sampling design plan which is the unequal probabilitystratified cluster.The main innovation of this study includes following three points: (1) Westate unequal probability sampling method which is used in a clear finitesampling frame.

24、(2) We simulate and compare the average of sampling error,sampling precision and design effect of each sampling design plan. (3) Weevaluate and put forward the best sampling plan for a clear finite sampling frame.Key words:Complex sampling, Unequal probability cluster sampling, Samplingerror, Sampli

25、ng precision, Sampling effect, Computer simulation-6-第四军医大学硕士学位论文前言死因监测工作是了解居民死亡水平和死因顺位,掌握居民健康影响因素,为政府制定卫生政策、评价卫生工作质量和效果的科学依据,也是研究人口自然变动规律的一个重要内容。我国高度重视死因监测工作,将其作为疾病预防控制的重点工作。死因监测点的确定是一个首要的问题。我国死因监测点的确定是根据等概率整群抽样的原则,以全国 2400 多个县(区)级单元作为抽样框架,按一定抽样比例组建死因监测哨点。近年来,我国的人口、社会经济等各方面都发生了重大变化,城乡和地区间特征呈现出较大的差异

26、。为使监测系统具有更好的代表性和稳定性,需要抽取一个在人口社会学特征具有代表性的样本,来反映全国城乡和不同类型地区居民死亡率水平。这时很多学者提出了采用不等概率整群抽样方法(包括有放回的不等概率抽样(PPS 抽样)和无放回的不等概率抽样(PS 抽样)。也有学者提出了采用复杂抽样的方法(即:由分层、多阶段等抽样技术与整群抽样技术组合构成的抽样方法),其中包括某些学者提出的一种通过改进抽样的组织形式来减少群大小不等影响的方法分层与整群抽样相结合的方法。研究发现这些抽样方法应用中存在的问题有:不等概率抽样使用了等概率抽样的简单估计;忽略对抽样设计的考虑,不恰当的采用适用于单纯随机抽样数据的方法进行数

27、据分析,不仅有可能大大低估样本统计量的抽样误差,在进行假设检验时,甚至会得到错误的结果;在分析复杂抽样调查数据时,正确的分析至少要考虑两个方面的问题: 一方面是影响样本统计量点值估计的“加权”问题,另一方面是对样本统计量的抽样误差计算问题。遗憾的是,我们经常见到抽样方案中使用了不恰当的估计方法。故我们必须做到估计方法必须与抽样方法相匹配。-7-第四军医大学硕士学位论文本研究旨在通过建立可行的四种抽样方法,即:完全随机整群抽样、分层整群抽样、不等概率整群抽样、不等概率分层整群抽样,再分别以总人口的 5%、10%、15%作为抽样比例,组合成为十二种抽样方案,且每个方案都进行计算机重复抽样 100

28、次,比较不同抽样方案的抽样精确度、平均抽样标准差以及设计效率,来探索死因监测点确定的最佳抽样方案。-8-第四军医大学硕士学位论文文献回顾从 20 世纪 90 年代中期开始,我国的疾病监测系统已经全面展开,抽样方法在我国疾病监测体系中的地位和作用越来越重要,而随着死因监测点应用的越来越广泛,对各种抽样方法的研究与推广应用成为了当务之急1。死因监测抽样总体又常常由很多小的群体构成,其中群大小不等却是常见的现象,如我国各省每个地区的居民人口数是不等的,就是一个省内每个区、县、市的居民数也会不等。通常不易得到由个体(末级单位)名单组成的抽样框,而作为一种经济实用、实施方便的抽样方法,整群抽样以及复杂抽

29、样在社会经济及其他领域的统计调查中得到广泛应用2。我们将回顾可以用于死因监测点确定的抽样方法理论以及国内外研究人员应用这些方法的研究成果。1抽样理论1.1 简单抽样方法1.1.1 简单随机抽样简单随机抽样是指完全随机抽样也称简单随机抽样,是最简单、最基本的抽样方法。从总体 N 个对象中,利用抽签或其他随机方法(如随机数字)随机无放回地抽取 n 个,构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等。完全随机抽样的方差计算公式如下:均数的方差:Var ( y ) = (1 ) = (1 f )N 1 n N n n-9-N n 2 n S 2 S 2第四军医大学硕士学位论文 N n p

30、(1 p )n式中: S 2 为样本方差;p 为样本率;N 为总体含量;n 为样本含量; f =nN为抽样比。在实际工作中,完全随机抽样往往由于总体数量大,编号、抽样麻烦以及抽到个体分散而导致资料收集困难等原因而用的不多;但是估计设计效率时会用到无放回的完全随机抽样3,所以作一详细介绍。1.1.2 等概率整群抽样等概率整群抽样(cluster sampling)即完全随机整群抽样,就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取。即:以群为最终抽样单位的简单随机抽样,若总体可分为 K 个初级单元(群),每个初级单元包含若干次级单元。按某种方式从总体中抽取 k 个初级单元,对这些初级单元

31、中的所有次级单元全部进行调查。这种抽样设计方法,叫做整群抽样。总体率 p 的无偏估计量为 p =kk方差估计为 s p =,f=kK式中 p 为样本率;w 为权重;K 为总体群体个数;k 为样本群体个数, f =kK为抽样比例。等概率整群抽样的特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选样本的情况下,可采用这种方式4。-10-率的方差: Var ( p ) = N 1 i = 1wp i = 1w(1 f ) w( p p )k ( w 1)第四军医大学硕士学位论文1.1.3 不等概率整群抽样不

32、等概率整群抽样分为放回的不等概率抽样(PPS 抽样)和不放回的不等概率抽样(PS 抽样)两种情形5。1.1.3.1 放回的不等概率抽样1.1.3.1.1 基本原理PPS 抽样:设 Z1, Z 2 ,., Z N 是一组概率,按这组概率对总体中的 K 个单元进行有放回抽样,每次抽到第 i 个单元的概率为 Zi ,独立地进行这样的抽样k 次,如果是有放回抽样,且每个单元入样概率与其大小或规模 M i 严格成比例,即当 n 固定时,记N= M (Mi =1其中, M i 是第 i 个单元的大小或规模的度量; M 0 =Ni =1i是总体中所有单元的“大小”之和,此种情形的多项抽样称为 PPS( sa

33、mpling withprobability proportional size)抽样。由Ni =1i= 1,则这时的多项抽样由于每个单元在每次抽样中的入样概率与单元的大小成比例,故 PPS 抽样就是放回的与规模大小成比例的概率抽样6。总体率 p 的无偏估计量为 p =1M 0k k=i 0方差估计为 var ( p) =1k (k 1)ni式中:p 为样本率;w 为权重;K 为总体含量;k 为样本群体个数, f =抽样比例。-11-kK为Z i i M 0 0 = M i ) M Z1pi=i 1 M M =i 1 wi ipp=i 1 ( z i p)2第四军医大学硕士学位论文放回不等概率抽样的每次抽样过程都是从同一个总体独立进行的,因此放回的不等概率抽样无论是实施过程还是推算过程都比无放回的抽样简单。由于抽样是放回的,所以某个单元可能在样本中出现多次,对这个单元的调查只进行一次,但在计算时需要按照抽中的次数进行计算7。1.1.3.1.2 实施方法1)代码法代码法又称为汉森赫维茨(HansenHu

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1