调查设计[1].张晋昕.ppt

上传人:土8路 文档编号:11841562 上传时间:2021-09-23 格式:PPT 页数:96 大小:251.01KB
返回 下载 相关 举报
调查设计[1].张晋昕.ppt_第1页
第1页 / 共96页
调查设计[1].张晋昕.ppt_第2页
第2页 / 共96页
调查设计[1].张晋昕.ppt_第3页
第3页 / 共96页
调查设计[1].张晋昕.ppt_第4页
第4页 / 共96页
调查设计[1].张晋昕.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《调查设计[1].张晋昕.ppt》由会员分享,可在线阅读,更多相关《调查设计[1].张晋昕.ppt(96页珍藏版)》请在三一文库上搜索。

1、1,调查设计,张 晋 昕,2,第一部分调查研究概况,3,一、调查研究的概念、特点与适用范围 方法,实验研究(experimental research) 调查研究(survey research) 实地观察研究(field study) 文献研究(document study),4,调查研究是医学研究的很重要组成部分,是医学科学研究重要手段,它的主要特点: 1) 研究过程中没有人为施加干预措施,而是客观地观察记录的某些现象的现状的相关特征.这里的研究因素是客观存在的; 2) 有些混杂因素不能通过随机分组的方法来平衡,如拟了解和比较甲、乙两地环境条件对食管癌死亡率水平的影响。,5,二、调查研究的

2、分类,一) 从调查对象分,全面调查(普查) 抽样调查 典型调查,6,二、调查研究的分类,二) 从调查涉及的时间划分 时间长短,回顾性调查(病例-对照) 前瞻性调查(队列研究) 历史前瞻性调查,横断面调查(现况调查) 纵向调查,7,二、调查研究的分类,三) 从抽取样本的方式分,概率抽样 (单纯随机抽样、系统抽样、分层抽样、整群抽样) 非概率抽样 (偶遇抽样、判断抽样、定额抽样、雪球抽样),8,第二部分调 查 设 计,调查设计是调查研究得以成功的重要保证,它包括资料的收集、整理和分析的各个环节以及整个设计过程的统计设想和科学安排。,9,一、调查计划,1.确定调查目的和指标(目标总体、抽样总体) 2

3、.确定调查对象和观察单位 3.调查方法和搜集资料方式: 普查、抽样调查和典型调查。 搜集资料方式主要有直接观察法和询问法, 各有适用范围。 4. 拟订调查项目和调查表 5. 确定样本含量确定调查方式(因素数10) 6. 制定调查的组织计划,10,二、资料的整理计划任务:按研究设计的要求,使原始数据系统化、条理化,便于进一步计算统计指标和进行统计分析。一) 问卷接收二) 问卷核查:完整性、逻辑性三) 数据编码:每个可能的答案均需编码四) 数据的计算机录入,11,五) 拟订整理表,1)质量分组 :将观察单位按某种属性或类别分组,适用于定性资料。,2)数量分组 :将观察单位按变量值的大小分组,适用于

4、定量资料。,设计分组,六) 归纳汇总 设计整理表,进行汇总;现多借助电脑汇总。,12,第三部分常用的抽样方法,概率抽样方法主要包括:单纯随机抽样、系统抽样、整群抽样和分层抽样。,13,1.单纯随机抽样(simple random sampling) 优点:均数、率及其标准误计算简便。 缺点:当总体中例数多时,对观察单位进行编号不易操作,在实际工作中有时难以实现。 例1 抽样参加夏令营活动,某班有学生100人,若抽取为10人参加夏令营,试作单纯随机抽样设计。,14,2.系统抽样(systematic sampling) 例2 欲调查某社区贫血患病情况,该社区有居民1000人,试按系统抽样方法,抽

5、取例数为100的样本. 先将1000名居民按某一特征的顺序编号,N为1000,n=100,抽样间隔1000/100=10,在110之间随机确定一个数字,譬如7,每间隔10个观察单位抽取一个,即7、17、27、 、997组成样本。,15,系统抽样的优点:1)易于理解,简便易行; 2)容易得到一个按比例分配的样本; 3)样本观察单位在总体中分布均匀,其抽样误差一般小于单纯随机抽机抽样。缺点:1)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,容易产生明显的系统误差(偏倚);2)在实际工作中,一般按单纯随机抽样方法估计其抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此抽样误差的估计只

6、是近似的。,16,3.整群抽样(cluster sampling) 先将总体按照某种与研究无关的特征划分为K个“群”组,每个群组包括若干观察单位,然后抽取k个“群”,抽取的各个群的全部观察单位组成样本。,优点: 便于组织、节省经费,容易控制误差质量。缺点:当样本含量一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位不是均匀散布在总体中。 为降低抽样误差,可采用增加抽取的“群”数,减少“群”内观察单位数的方法进行抽样,即重新划分“群”,使每个“群”更小。,4.分层抽样(stratified sampling),先按对观察指标影响较大的某种特征,将总体分为若干类别,再从每一层内随机抽取一

7、定数量的观察单位,合起来组成样本。,18,(1)等比例分配(2)非等比例分配(最优分配):,19,分层抽样的优点:A:抽样误差小于前三种,样本的代表性好B:便于对不同层采用不同的抽样方法C:便于对各层独立进行分析,20,在实际调查研究中常常将两种或几种抽样方法结合起来使用。 各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样 样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。,21,在实际调查研究中常常将两种或几种抽样方法结合起来使用。 各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样 样本含量的估计的目的是在保证一定精度和检验效能的前

8、提下,确定最少的观察单位数。,22,非概率抽样,偶遇抽样 / 便利抽样(accidental / convenience sampling) 研究者根据其工作方便,随意抽取样本的抽样方法。 此法难以保证个体在抽样总体的同质性,故抽样误差较大,可靠性差。一般用于非正式的探索性调查,较少用于正式调查。 【例】某商业中心的街头访问,某一消费人群或营业人员的访谈等。,23,非概率抽样,判断抽样 / 立意抽样(judgmental / purposive sampling) 根据研究者的经验或主观判断选择样本的抽样方法。 此法的可靠性取决于研究者的主观判断能力。 【例】某研究者根据其本身学识和经验认为某

9、敬老院的人群对于老年人骨质疏松症具有代表性,故以该敬老院的所有老人为抽样样本进行研究。,24,非概率抽样,定额抽样 / 配额抽样 (quota sampling) 首先对总体根据某些控制特征(如年龄、性别等)分层,然后按每层控制特征的比例分配抽样数量,最后采用便利或判断抽样方法实施抽样。定额抽样又分为独立控制和非独立控制定额抽样两种方法。前者按单个控制特征进行每层抽样,后者则按两个以上控制特征进行每层抽样。 此法与分层抽样的区别在于抽样是非随机的。 【例】 Gallup poll,25,非概率抽样,滚雪球抽样 (snowball sampling) 当研究对象较稀缺时,先找到最初的小样本,在小

10、样本调查的基础上发掘相关信息,进一步扩大样本量,直至达到所需样本量为止。 最大优点是节约成本,缺点是误差较大,且难以控制。 【例】 传销者心理调查,26,第四部分调查表和问卷的设计,27,1. 调查项目: (1)背景资料:调查对象的姓名、住址、单位、电话等; (2)人口学项目:年龄、性别、民族、婚姻状况、文化程度、职业等; (3)研究项目:是调查的核心内容。它是根据研究目的和调查指标所确定的必须进行调查的项目。,28,2. 问题的形式: 按问题的给出方式分为提问和陈述两种。 按答案的给出方式分为开放式问题和封闭式问题。,29,3. 问题设计的一般原则: (1)尽量避免术语:“就低不就高”的原则

11、。您近来有无纳差? (2)避免用不确切的词:对于语义较为含混的词语如经常、偶尔、普遍、大概等应给出本次调查的确切标准。例如“您是否经常失眠?”A.(每半年1次或更少);B.(每3个月1次或更少);C.( 每月1次到3次);D.(每周1次或更多)。,30,问题设计的一般原则(续1),(3)避免双重问题:“您抽烟喝酒吗?” (4)避免诱导或强制:“您认为晚婚晚育有利于普遍提高全民素质,对么?” (5)问题应适合全部调查对象并符合逻辑:“您的孩子多少岁?”应改为:,31,问题设计的一般原则(续2),10. 您是否结婚了?A. 是 B. 否(若回答A. 是,请继续回答第11问,若回答B. 否,请继续回

12、答第13问); 11. 您有没有孩子? A. 有 B. 无(若回答A. 有,请继续回答第12问,若回答2. 无, 请继续回答第13问); 12. 您的孩子多少岁?,32,敏感问题的处理1, 您如何看待插足家庭生活的第三者?,对象转移法: “对于介入别人婚姻中的第三者,有些人认为这种行为不好,也有人认为无所谓,您同意哪种观点?”,33,敏感问题的处理2, 国家的人口政策提倡只生一个娃,你觉得好不好?,假定法: “假如我国人口政策不限制生育,您愿意有几个孩子?”,34,敏感问题的处理3, 您是否正在遭受家庭暴力的威胁?,增设非敏感问题 3-1您是否正在遭受家庭暴力的威胁? 3-2您是否喜欢看粤剧?

13、 A. 是 B. 否,35,36,调查项目的安排顺序,符合逻辑; 一般问题在前,特殊问题在后; 易答题在前,难答题在后; 敏感问题一般放在最后。如果敏感问题较多,为了降低其敏感性,亦可分散在问卷之中。,37,第五部分调查质量控制,38,1.设计阶段 (1)正确划分调查范围 (2)正确选择调查指标 (3)明确定义调查项目 (4)正确设置调查问题 (5)选择恰当的调查方式 (6)预调查,39,2.资料收集、整理与分析阶段 (1)问卷的登记与编码 (2)检查资料的完整性 (3)检查填报的正确性 (4)控制数据录入质量,如“双机输入” (5)数据的逻辑检查,40,总体的定义,明确目标总体和抽样对象,确

14、定抽样方法,确定观测指标和调查项目,选择调查方式,制定调查组织计划,制定整理、分析计划,统计结论+专业结论,根据研究目的,预调查 修改调查表,41,第六部分样本含量的估计方法,42,样本含量的估计,在保证研究结论具有一定可靠性的前提下,确定最少的研究单位数。,43,一、决定样本含量的一般条件 (1)检验水准(单双侧) (2)检验效能1- (单侧) (3)、的估计(变异度) (4)组间差别的估计(容许误差),44,二、样本含量的常用估计方法 1. 样本均数与总体均数的比较 两样本均数比较 多个样本均数的比较 随机区组设计所需样本含量 样本率与总体率的比较,45,二、样本含量的常用估计方法 6.

15、两组样本率比较 7. 多个样本率的比较 8. 直线相关 9. 病例-对照研究 10. 队列研究,46,1. 样本均数与总体均数的比较,实例1. 某医师试验某种升白细胞药的疗效,先以9例低白细胞病人做预实验,结果计算出用药前后白细胞差值的标准差为2.5千个/mm3 (或109/L),现要做正式临床试验,且要求白细胞平均上升1千个/mm3 (或109/L)才算该药临床有效,问要多少病人进行正式临床试验?,47,公 式,48,实施步骤,第一步 这里, = 1 = 2.5 t 0.05, = 1.645 t 0.1, = 1.282,49,取n = 54,50,第二步 = 1 = 2.5 = 54 -

16、 1 = 53 t 0.05,53 = 1.674 t 0.1,53 = 1.298,51,取n = 56,52,第三步 = 1 = 2.5 = 56-1 = 55 t 0.05,55 = 1.673 t 0.1,55 = 1.297,53,取n = 56,54,结 论,第二步与第三步,n已趋于稳定,故可以认为需56个病人进行正式临床试验,才有90%(即1- )的把握发现差别。,55,2. 两样本均数比较,实例2. 在进行有两种处理的动物冠状动脉窦的血流量实验时,A处理使平均血流量增加1.8ml/min,B处理使平均血流量增加2.4ml/min。设两种处理的标准差相等,均为1.0ml/min,

17、 =0.05,=0.10,若要得出两处理之差别有统计学意义的结论,需多少实验动物?,56,公 式,57,实施步骤,第一步 这里, = 2.4-1.8 = 0.6 = 1 t 0.05/2, = 1.96 t 0.1, = 1.282,58,取n1=n2 = 59,59,第二步 = 0.6 = 1 = 2(59-1) = 116 t 0.05/2,116 = 1.982 t 0.1,116 = 1.289,60,取n1=n2 = 60,61,结 论,第一步与第二步结果相近,故可以认为每组需动物60只,两组共需120只。,62,3. 多个样本均数比较,实例3. 拟用四种方法治疗贫血患者,估计治疗后

18、血红蛋白含量(g/L)增加的均数分别为18、13、16、10,标准差分别为10、9、9、8,设 =0.05,=0.10,若要得出四种处理之差别有统计学意义的结论,问每组需观察多少例?,63,公 式,64,实施步骤,第一步 这里,据1= k-1 =4-1=3 , 2 = 查表得=2.17,65,取n = 32,66,第二步 这里,据1= k-1 = 4 -1= 3 , 2 = 4(32-1)=124,查表得=2.21,67,取n=33,68,结 论,第一步与第二步结果相近,故可以认为每组需观察33例,四组共需132例。,69,4. 随机区组设计所需样本含量,实例4. 欲比较四种不同药物降低血清谷

19、草转氨酶的疗效。从预实验已知误差的均方为30U/dl,组间差值可达8U/dl,拟取=0.05,=0.05,问每组需多少病例?,70,公 式,71,实施步骤,这里,据k=4, 查表得Q = 3.8,72,每组取n = 28,73,5. 样本率与总体率的比较(大样本),实例5. 已知用常规疗法治疗某种疾病的有效率是80%,现实验一种新的治疗方法,预计有效率是90%。给定=0.05,=0.10,问至少需要观察多少病例?,74,公 式,75,实施步骤,这里,,76,取n = 169,77,6. 两组样本率比较,实例6. 初步观察甲、乙两药对某种疾病的疗效,初步实验得甲药有效率为60%,乙药为85%。现

20、拟进一步作治疗试验,设=0.05,=0.10,问每组至少需要观察多少病例?,78,公 式,79,实施步骤,这里,,80,每组取n = 64,两组共需128例。,81,7. 多组样本率比较,实例7. 拟观察三种方法治疗消化性溃疡的效果,初步估计甲法有效率为40%,乙法有效率为50%,丙法有效率为65%。设=0.05,=0.10,问每组至少需要观察多少病例?,82,公 式,83,实施步骤,这里,据=3-1=2, =0.05, =0.10,查表得 0.05,2 = 12.65,84,每组取n = 99,三组共需297例。,85,8. 两变量的直线相关,实例8. 根据以往经验得知,血硒与发硒含量间的直

21、线相关系数为0.8。若想在 = 0.05,1- = 0.90的水平上得到相关系数有统计学意义的结论,应调查多少人?,86,公 式,87,实施步骤,这里,,88,应调查12人。,89,9. 病例-对照研究,实例9. 为了考察母亲孕期使用雌激素与所生子女患先天性心脏病的联系,拟进行病例-对照研究。根据预调查结果,估计对照组有暴露史的比例p1=0.3,OR=2,设 = 0.05,1- = 0.90,求样本含量。,90,公 式,91,实施步骤,将p1 = 0.3代入 , 得到p2 = 0.4615 进而得到:,92,即病例组和对照组各需调查约190人。,93,10. 队列研究,实例10. 为了考察母亲孕期使用雌激素与所生子女患先天性心脏病的联系,拟进行队列研究。根据预调查结果,估计非暴露组发病率p1=0.002,RR=2,设 = 0.05,1- = 0.90,求样本含量。,94,公 式,95,实施步骤,将p1 = 0.002代入 ,RR= p2 / p1=2 得到p2 = 0.004 进而得到:,96,即暴露组和非暴露组 各需调查约15720人。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1