生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf

上传人:白大夫 文档编号:5496836 上传时间:2020-05-24 格式:PDF 页数:92 大小:974.35KB
返回 下载 相关 举报
生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf_第1页
第1页 / 共92页
生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf_第2页
第2页 / 共92页
生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf_第3页
第3页 / 共92页
生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf_第4页
第4页 / 共92页
生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf》由会员分享,可在线阅读,更多相关《生物医学研究的统计学方法_课后习题答案2014主编方积乾.pdf(92页珍藏版)》请在三一文库上搜索。

1、思考与练习参考答案 第 1 章绪论 一、选择题 1. 研究中的基本单位是指( D)。 A样本B. 全部对象C影响因素 D. 个体E. 总体 2. 从总体中抽取样本的目的是(B ) 。 A研究样本统计量B. 由样本统计量推断总体参数 C研究典型案例D. 研究总体统计量. 计算统计指标 3. 参数是指(B ) 。 A参与个体数B. 描述总体特征的统计指标 C描述样本特征的统计指标D. 样本的总和E. 参与变量数 4. 下列资料属名义变量的是(E) 。 A白细胞计数B住院天数 C门急诊就诊人数D患者的病情分级E. ABO 血型 5关于随机误差下列不正确的是(C) 。 A受测量精密度限制B无方向性C.

2、 也称为偏倚 不可避免 E. 增加样本含量可降低其大小 二、名称解释 (答案略) 1. 变量与随机变量 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 随机事件 7. 频率与概率 三、思考题 1. 生物统计学与其他统计学有什么区别和联系? 答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学 等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是 统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其 不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重 于介绍社会

3、、人群健康研究中的统计学原理与方法。 2. 某年级甲班、乙班各有男生50 人。从两个班各抽取10 人测量身高,并求其平均身高。 如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 答:不能。因为,从甲、乙两班分别抽取的10 人,测量其身高,得到的分别是甲、乙 两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使 是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因 此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进 行统计推断,才能作出判断。 3. 某地区有10 万个 7 岁发育正常

4、的男孩,为了研究这些7 岁发育正常男孩的身高和体重, 在该人群中随机抽取200 个 7 岁发育正常的男孩, 测量他们的身高和体重,请回答下列问题。 (1) 该研究中的总体是什么? 答:某地区10 万个 7 岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么? 答:身高总体均数的意义是: 10 万个 7 岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么? 答:体重总体均数的意义是: 10 万个 7 岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。 (5)该研究中的样本是什么? 答:该研究中的样

5、本是:随机抽取的200 个 7 岁发育正常的男孩。 (宇传华方积乾) 第 2 章统计描述 思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是(E ) 。 A. 用最大值减去最小值求全距B. 组距常取等组距,一般分为1015组 C. 第一个组段须包括最小值D. 最后一个组段须包括最大值 E. 写组段,如“1.53,35, 56.5,” 2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A) 。 A. 中位数B. 几何均数C. 调和均数D. 算术均数E. 众数 3. 比较 5年级小学生瞳距和他们坐高的变异程度,宜采用(A) 。 A. 变异系数B. 全距C. 标准差 D. 四

6、分位数间距E. 百分位数 P2.5与P97.5的间距 4. 均数X和标准差 S的关系是(A) 。 A. S越小,X对样本中其他个体的代表性越好 B. S越大,X对样本中其他个体的代表性越好 C. X越小, S越大 D. X越大, S越小 E. S必小于X 5. 计算乙肝疫苗接种后血清抗- HBs的阳转率,分母为(B) 。 A. 阳转人数B. 疫苗接种人数C. 乙肝患者数 D. 乙肝病毒携带者数E. 易感人数 6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于(C) 。 A. 频率B. 频率分布C. 强度D. 相对比E. 算术均数 7. 纵坐标可以不从0开始的图形为(D) 。 A.

7、 直方图B. 单式条图C. 复式条图D. 箱式图E. 以上均不可 二、简答题 1. 对定量资料进行统计描述时,如何选择适宜的指标? 答:详见教材表2- 18。 教材表 2-18 定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适 用 场 合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中 位 数位次居中的观察值 非对称分布;半定量资料;末端开 口资料;分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变 异 度全距观察值取值范围不拘分布形式,概略分析 标 准 差 (方差) 观察值平均离开均数的 程度 对称分布,

8、特别是正态分布资料 四分位数 间距 居中半数观察值的全距 非对称分布;半定量资料;末端开 口资料;分布不明 变异系数标准差与均数的相对比 不同量纲的变量间比较;量纲相同但 数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。 答: 2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人, 分别有 30人病情稳定, 66人处于进展状态,54人死亡。 当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36% ,属于频率指标。 当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、 36%,它们共同构成所有可能结局

9、的频率分布,是若干阳性率的组合。 两者均为“阳性率” ,都是基于样本信息对总体特征进行估计的指标。不同的是:频率 只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局 发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计 算公式中分母相同,是样本中被观察的单位数之和。 3. 应用相对数时应注意哪些问题? 答: (1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结 果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能

10、直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表2- 20。 教材表 2-20 常用统计图的适用资料及实施方法 图形适 用 资 料实 施 方 法 条图组间数量对比用直条高度表示数量大小 直 方 图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散

11、 点 图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数 三、计算题 1. 某内科医生调查得到100名4050岁健康男子总胆固醇(mg/dl) ,结果如下 227190224259225238180193214195213193209172244 199155208203199253181196224210220255257216249 235220190203197149175236202209174184174185167 23

12、5167210171248201266189222199197214199198230 246209202186217206200203197161247138186156195 163273178190207259186194246172234232189172235 207208231234226174199278277181 (1)编制频数表,绘制直方图,讨论其分布特征。 答:频数表见练习表2- 1。根据直方图(练习图2- 1) ,可认为资料为基本对称分布,其 包络线见练习图2- 2。 练习表 2-1 某地 100名4050岁健康男子总胆因醇/ (mg dl -1 ) Frequency

13、 Percent Valid Percent Cumulative Percent Valid 130 145 160 175 190 205 220 235 250 265280 Total 1 3 11 12 25 15 13 11 5 4 100 1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0 100.0 1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0 100.0 1.0 4.0 15.0 27.0 52.0 67.0 80.0 91.0 96.0 100.0 28026024022020018016

14、0140 总胆固醇 25 20 15 10 5 0 F r e q u e n c y Me an = 207.41 Std. De v. = 29.82 N = 100 练习图 2- 1 直方图 280260240220200180160140 总胆固醇 25 20 15 10 5 0 F r e q u e n c y Me an = 207.41 S td. De v. = 29.82 N = 100 练习图 2- 2 包络线图 (2)根据( 1)的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度。 答:利用原始数据,求出算术均数4.207Xmg/dl 和标准差8 .29Smg/d

15、l。 (3)计算 P25,P75和P95。 答:利用原始数据,求出P25=186.8 mg/dl ,P75=229.3 mg/dl ,P95=259.0 mg/dl 。 2. 某地对 120名微丝蚴血症患者治疗3个疗程后,用 IFA间接荧光抗体试验测得抗体滴度如 下,求抗体滴度的平均水平。 抗体滴度1:5 1:10 1:20 1:40 1:80 1:160 1:320 例数5 16 27 34 22 13 3 利用上述频数表,得平均滴度为1:36.3。 3. 某地 19751980年出血热发病和死亡资料如教材表2- 21,设该地人口数在此6年间基本保 持不变。 教材表 2-21 某地 6年间出

16、血热的发病与死亡情况 年份发病数病死数 1975 32 4 1976 56 5 1977 162 12 1978 241 13 1979 330 10 1980 274 5 试分析: (1)粗略判断发病率的变化情况怎样。 答:该地人口数在此6年间基本保持不变,发病人数在1979年前逐年上升,1980年略有 下降。可以认为发病率大致呈上升趋势,1980年略有下降。 (2)病死率的变化情况怎样? 答: 病死率由各年度病死数除以发病数获得,病死率依次为12.5%、8.9%、7.4%、5.4%、 3.0%和1.8%,呈逐年下降趋势。 (3)上述分析内容可用什么统计图绘制出来? 答:由于没有给出该地人口

17、数,故不能计算发病率,可用普通线图表示发病数变化情况。 病死率的下降情况可以用普通线图表示,下降速度则可以用半对数线图表示。 (4)评述该地区出血热防治工作的效果。 答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高(体现在病死率下降) 。 (张晋昕) 第 3 章概率分布 思考与练习参考答案 一、最佳选择题 1. 某资料的观察值呈正态分布,理论上有(C)的观察值落在SX96.1范围内。 A. 68.27% B. 90% C. 95% D. 99% E. 45% 2. 正态曲线下,从均数到64.1的面积为(A)。 A. 45% B. 90% C. 95% D. 47.5% E. 99% 3

18、. 若正常人的血铅含量X 近似服从对数正态分布,则制定X 的 95%参考值范围,最好采 用(其中XYlg, Y S 为 Y的标准差)(C)。 A.1.96XSB. 5.975. 2 PPC.)64.1(lg 1 YSY D.)69.1(lg 1 Y SYE. 955 PP 4. 在样本例数不变的情况下,若(D),则二项分布越接近对称分布。 A. 总体率越大B. 样本率 p 越大C. 总体率越小 D. 总体率越接近 0.5 E. 总体率接近 0.1 或 0.5 5. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从(D)。 A. 二项分布B. 正态分布C. 偏态分布 D. Poisson 分

19、布E. 对称分布 6. Poisson 分布的均数与标准差的关系是(E)。 A. B. C. D. E. 2 二、思考题 1. 服从二项分布及Poisson 分布的条件分别是什么? 简答: 二项分布成立的条件:每次试验只能是互斥的两个结果之一;每次试验的条 件不变;各次试验独立。Poisson 分布成立的条件:除二项分布成立的三个条件外,还要 求试验次数n很大,而所关心的事件发生的概率很小。 2. 二项分布、 Poisson 分布分别在何种条件下近似正态分布? 简答:二项分布的正态近似:当n 较大, 不接近 0 也不接近1 时,二项分布B(n, )近似正态分布N ( n ,)1(n) 。 Po

20、isson分布的正态近似:Poisson分布)(,当相当大时(20) ,其分布近似于正 态分布。 三、计算题 1. 已知某种非传染性疾病常规疗法的有效率为80%,现对 10 名该疾病患者用常规疗法治 疗,问至少有9 人治愈的概率是多少? 解:对10 名该疾病患者用常规疗法治疗,各人间对药物的反应具有独立性,且每人 服药后治愈的概率均可视为0.80,这相当于作10 次独立重复试验,即=0.80,n=10 的 贝努利试验,因而治愈的人数X 服从二项分布0.80)(10,B。至少有9 人治愈的概率为: 8 0 10 10 )801(80C1)19(1)9( k kkk XPXP 3 7 . 5 8

21、%83750262401 至少有 9 人治愈的概率是37.58%。 或者 )10()9()9(XPXPXP 01010 10 199 10 )801 (80C)801(80C 53780. 2. 据以往的统计资料,某地新生儿染色体异常率为1%,问 100 名新生儿中染色体异常不 少于 2 名的概率是多少? 解:)12(12)(XPXP1)(0)(1XPXP =26.42%0.26420.36790.36791e ! 1 1 e !0 1 1 1 1 1 0 3. 调查某市2000 年 110 名 20 岁男性青年的身高(cm)资料如下: 173.1 166.8 172.9 175.9 172.

22、8 170.5 174.1 174.2 175.7 173.5 168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2 170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5 166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5 181.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1 176.9 170.5 174.2 177.5 176.

23、6 182.3 172.1 169.9 179.5 175.8 178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2 168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0 175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6 175.8 164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6 173.8 180.7 176.3 177.5 178.

24、3 176.0 174.8 180.8 176.5 179.2 (1)试估计当年该市20 岁男性青年中,身高在175.0178.0( cm)内的占多大比例? (2)估计当年该市95%以及 99%的 20 岁男青年身高范围。 (3)若当年由该市随机抽查1 名 20 岁男青年,试估计其身高超过180 cm 的概率。 解:用 SPSS计算本题。 数据文件: data3-n.sav。 数据格式:数据库2 列 110 行,变量n 为男性青年序号,x 表示身高。 操作步骤: 操作说明 Analyze Descriptive Statistics Descriptives Options Mean Std.

25、 Deviation Continue Variables: x OK 调用 Descriptives 过程 计算得均数 =174.766,标准差 =4.150 9 Transform Compute 调 用 “ 变 量 计 算 (Compute Variable)”对话框 Target Variable P 定义目标变量“P” Numeric Expression : CDF.NORMAL(178.0,174.766,4.1509)-CDF. NORMAL(175.0,174.766,4.1509) OK 当年该市20 岁男性青年中, 身高在 175.0178.0 cm 内的比 例 Targ

26、et Variable x1 该市 95%以及 99%的 20 岁男 青年身高范围间的比例Numeric Expression : 174.766-1.96*4.1509 OK Target Variable x2 Numeric Expression : 174.766+1.96*4.1509 OK Target Variable x3 Numeric Expression : 174.766-2.58*4.1509 OK Target Variable x4 Numeric Expression : 174.766+2.58*4.1509 OK Target Variable p1 Num

27、eric Expression : 1-CDF.NORMAL(180.0,174.766,4.1509) OK 由该市随机抽查1 名 20 岁男 青年,其身高超过180 cm 的 概率 计算结果(练习图3- 1): Descriptive Statistics N Mean Std. Deviation x 110 174.766 4.1509 Valid N (listwise) 110 练习图 3- 1 SPSS 输出结果 以上是 SPSS输出结果,得到均数(Mean)为 174.766 cm ,标准差( Std. Deviation ) 为 4.150 9 cm。 估计当年该市20岁男性

28、青年中, 身高在 175.0178.0 cm 内的比例为25.956%, 身高在175.0178.0 cm 内的约有29 人。估计当年该市95%的 20 岁男青年身高范围为 166.63182.90 cm ,99% 的 20 岁男青年身高范围为164.06185.48 cm 。 由该市随机抽查 1 名 20 岁男青年,估计其身高超过180 cm 的概率约为10%。 (祁爱琴高永石德文) 第 4 章参数估计 思考与练习参考答案 一、最佳选择题 1. 关于以 0 为中心的t分布,错误的是() A. t分布的概率密度图是一簇曲线B. t分布的概率密度图是单峰分布 C. 当时,t分布Z分布 D. t分

29、布的概率密度图以0 为中心,左右对称 E. 相 同时,t值越大,P值越大 2. 某指标的均数为X,标准差为S, 由公式1.96,1.96XSXS 计算出来的区间常称 为() 。 A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间 D. 95%置信区间 E. 90%置信区间 3. 样本频率p与总体概率均已知时,计算样本频率p的抽样误差的公式为() 。 A. 1pp n B. 1 1 pp n C. 1 n D. 1 1n E. 1 2n 4在已知均数为, 标准差为的正态总体中随机抽样,X()的概 率为 5%。 A.1.96B.1.96 X C. 0.05/ 2, tS D. 0

30、.05/ 2, X tS E. 0.05/ 2, X t 5. ()小,表示用样本均数估计总体均数的精确度高。 A. CVB. SC. X D. RE. 四分位数间距 6. 95%置信区间的含义为() : A. 此区间包含总体参数的概率是95% B. 此区间包含总体参数的可能性是95% C. “此区间包含总体参数”这句话可信的程度是95% D. 此区间包含样本统计量的概率是95% E. 此区间包含样本统计量的可能性是95% 二、思考题 1. 简述标准误与标准差的区别。 答: 区别在于: (1)标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确 知道总体参数(如总体均数)的程

31、度。 (2)标准误小于标准差。 (3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不 随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可 能减小。 2. 什么叫抽样分布的中心极限定理? 答: 样本含量n 越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布, 这种现象统计学上称为中心极限定理(central limit theorem ) 。 当有足够的样本含量(如30n)时,从任何总体中抽取随机样本的样本均数近似地 服从正态分布。样本含量越大,X抽样分布越接近于正态分布。 正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总

32、体原本就是正态分 布,那么对于所有n值,抽样分布均为正态分布。如果总体为非正态分布,X仅在 n 值较 大情况下近似服从正态分布。一般说,30n时的X抽样分布近似为正态分布;但是,如 果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的n值,抽样分布也 将为非正态。 3. 简述置信区间与医学参考值范围的区别。 答: 置信区问与医学参考值范围的区别见练习表4-1。 练习表 4-1 置信区间与医学参考值范围的区别 区别置信区间参考值范围 含义 用途 计算公式 总体参数的波动范围,即按事先给定的概 率 100(1)%所确定的包含未知总体参 数的一个波动范围 估计未知总体均数所在范围 未知:

33、 /2, X XtS 已知或未知但n30,有 / 2 X XZ或 / 2 X XZS 个体值的波动范围,即按事先给定的 范围 100(1)%所确定的“正常人” 的解剖、生理、生化指标的波动范 围 供判断观察个体某项指标是否“正常” 时参考(辅助诊断) 正态分布: /2 XZS 偏峰分布: PXP100 X 4. 何谓置信区间准确度与精确度?如何协调两者间的关系。 答:置信区间有准确度(accuracy)与精密度( precision)两个要素。准确度由置信度 (1) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看, 置信度愈接近于1 愈好,如置信度99比95好。精密度

34、是置信区间宽度的一半(即 2,X tS 、 2,p ZS ) ,意指置信区间的两端点值离样本统计量(如X、p)的距离。从精 密度的角度看,置信区间宽度愈窄愈好。在抽样误差确定的情况下,两者是相互矛盾的。 为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。 三、计算题 1. 随机抽取了100名一年级大学生, 测得空腹血糖均数为4.5 mmol/L, 标准差为 0.61 mmol/L。 试估计一年级大学生空腹血糖总体均数及方差的95置信区间。 答:总体均数95置信区间为( 4.379 ,4.621 ) ,方差的95置信区间为(0.286 9, 0.502 1 ) 。 2. 调查某地蛲虫感染

35、情况,随机抽样调查了260 人,感染人数为100。试估计该地蛲虫感染 率的 95% 置信区间。 答:该地蛲虫感染率的95% 置信区间为(32.55 , 44.38 ) 。 (宇传华) 第5章假设检验 思考与练习参考答案 一、最佳选择题 1. 样本均数比较作t检验时,分别取以下检验水准,以(E )所取类错误最小。 A.0.01 B. 0.05 C. 0.10 D. 0.20 E. 0.30 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t=3.24,t0.05,v =2.086, t0.01,v =2.845。正确的结论是(E ) 。 A. 此样本均数与该已知总体均数不同 B.

36、此样本均数与该已知总体均数差异很大 C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是(A ) 。 A. 建立假设,选择和计算统计量,确定P 值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准 C. 确定单侧检验或双侧检验,选择t 检验或 Z 检验,估计类错误和类错误 D. 计算统计量,确定P 值,作出推断结论 E. 以上都不对 4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是(C ) 。 A. 统计量 t 越大,说明两总体均

37、数差别越大 B. 统计量 t 越大,说明两总体均数差别越小 C. 统计量 t 越大,越有理由认为两总体均数不相等 D. P 值就是 E. P 值不是,且总是比小 5. 下列(E )不是检验功效的影响因素的是: A. 总体标准差B. 容许误差C. 样本含量n D. 类错误E. 类错误 二、思考题 1试述假设检验中与 P 的联系与区别。 答:值是决策者事先确定的一个小的概率值。 P 值是在 0 H成立的条件下,出现当前检验统计量以及更极端状况的概率。 P时,拒绝 0 H假设。 2. 试述假设检验与置信区间的联系与区别。 答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置

38、信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即 判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验? 答:选用双侧检验还是单侧检验需要根据数据的特征及专业知识进行确定。若比较甲、 乙两种方法有无差异,研究者只要求区分两方法有无不同,无需区分何者为优,则应选用双 侧检验。若甲法是从乙法基础上改进而得,已知如此改进可能有效,也可能无效,但不可能 改进后反不如以前,则应选用单侧检验。在没有特殊专业知识说明的情况下,一般采用双侧 检验即可。 4. 试述两类错误的意义及其关系。 答:类错误( typeerror) :如果检验假设 0 H实际是正确的,由样本数

39、据计算获得的 检验统计量得出拒绝 0 H的结论,此时就犯了错误, 统计学上将这种拒绝了正确的零假设 0 H (弃真)的错误称为类错误。 类错误 (type error):假设检验的另一类错误称为类错误(type error),即检验 假设 0 H原本不正确 ( 1 H正确),由样本数据计算获得的检验统计量得出不拒绝 0 H(纳伪) 的结论,此时就犯了类错误。类错误的概率用表示。 在假设检验时,应兼顾犯类错误的概率()和犯类错误的概率() 。犯类错 误的概率()和犯类错误的概率()成反比。如果把类错误的概率定得很小,势 必增加犯类错误的概率,从而降低检验效能;反之,如果把类错误的概率定得很小,势

40、 必增加犯类错误的概率,从而降低了置信度。为了同时减小和,只有通过增加样本 含量,减少抽样误差大小来实现。 5试述检验功效的概念和主要影响因素。 答:拒绝不正确的 0 H的概率,在统计学中称为检验功效(power of test),记为1。检 验功效的意义是:当两个总体参数间存在差异时(如备择假设 1 H: 0成立时 ),所使用 的统计检验能够发现这种差异(拒绝零假设 0 H: 0)的概率,一般情况下要求检验功效 应在 0.8 以上。 影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及犯类错 误的概率。 6简述假设检验的基本思想。 答:假设检验是在H0成立的前提下,从样本数据中寻找证

41、据来拒绝 0 H、接受 1 H的一 种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝 0 H,暂且认为 0 H成 立(因为拒绝的证据不足),即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝 0 H是 根据某个界值, 即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即 绝对值更大)的概率较小,比如小于等于0.05(各种科研杂志习惯上采用这一概率值),则 认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝 0 H,即有足够证据 推断差异具有统计学意义。 三、计算题 1. 一般正常成年男子血红蛋白的平均值为140 g/L,某研究者随机抽取25 名高原地区成

42、年 男子进行检查,得到血红蛋白均数为155 g/L,标准差25 g/L 。问:高原地区成年男子的血 红蛋白是否比一般正常成年男子的高? 解: 0 H: 01 H: 0 0. 0 5(单侧) nS X t / 0 =3.00 t=3,01.0005.0P,可认为高原地区居民的血红蛋白比一般正常成年男子的高。 2. 一般而言,对某疾病采用常规治疗,其治愈率约为45%。现改用新的治疗方法,并随机 抽取 180 名该疾病患者进行了新疗法的治疗,治愈 117 人。问新治疗方法与常规疗法的效果 是否有差别? 解: 0 H: 0 , 1 H: 0, 0.05 00 00 (1) /p pp Z n 5.41

43、 Z=5.41,001.0P,可认为新治疗方法与常规疗法的效果不同,新疗法优于常规疗 法。 (林爱华宇传华) 第6章两样本定量资料的比较 思考与练习参考答案 一、 最佳选择题 1. 正态性检验,按 =0.10检验水准,认为其总体服从正态分布,此时若推断有错,其错误 的概率为(D ) 。 A. 大于 0.10 B. 等于 0.10 C. 小于 0.10 D. 等于 ,而 未知E. 等于 1- ,而 未知 2. 甲、乙两人分别从同一随机数字表抽取30个(各取两位数字)随机数字作为两个样本, 求得 2 1 1SX 和、 2 2 2SX 和 ,则理论上(C ) 。 A. 21 XX B. 2 2 2

44、1 SS C. 由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 D. 作两样本均数比较的t检验,必然得出无统计学意义的结论 E. 作两样本方差比较的F检验,必然方差齐 3. 两样本均数比较时,能用来说明两组总体均数间差别大小的是(D) 。 A. t 值B. P值 C. F 值 D. 两总体均数之差的95%置信区间 E. 上述答案均不正确 4. 两小样本均数比较,方差不齐时,下列说法不正确的是(C ) 。 A. 采用秩和检验B. 采用 t 检验 C. 仍用 t 检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 5. 两样本秩和检验的 0 H是 (B) 。

45、A. 两样本秩和相等B. 两总体分布相同 C. 两样本分布相同D. 两总体秩和相等 E. 两总体均数相等 6. 在统计检验中是否选用非参数统计方法(A ) 。 A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个 P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 7. 配对样本差值的Wilcoxon 符号秩和检验,确定P值的方法是(D ) 。 A. T越大, P值越小 B.T越大, P值越大 C. T值 在界值范围内,P值小于相应的 D. T值界值, P值大于相应的 值 E. T值

46、 在界值范围上,P值大于相应的 8. 成组设计两样本比较的秩和检验,其检验统计量T是(C ) 。 A. 为了查 T界值表方便,一般以秩和较小者为T B. 为了查 T界值表方便,一般以秩和较大者为T C. 为了查 T界值表方便,一般以例数较小者秩和为T D. 为了查 T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查 T界值表 二、思考题 1假设检验中,P值和 的含义是什么?两者有什么关系? 答:P是指 H0成立时出现目前样本情形的概率最多是多大 , 是事先确定的检验水准。 但 P 值的大小和没有必然关系。 2. 既然假设检验的结论有可能有错,为什么还

47、要进行假设检验? 答:假设检验中,无论拒绝不拒绝H0,都可能会犯错误,表现为拒绝H0时,会犯类 错误,不拒绝H0时,会犯类错误,但这并不能否认假设检验的作用。只要涉及到抽样, 就会有抽样误差的存在,因此就需要进行假设检验。只是要注意, 假设检验的结论只是个概 率性的结论,它的理论基础是“小概率事件不可能原理”。 3. 配对设计资料能否用完全随机设计资料的统计检验方法?为什么? 答:不能。采用完全随机设计资料的t 检验会使检验效能降低,从而可能会使应有的差 别检验不出来。 4. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看

48、是否满足正态性 (样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐, 采用 t 检验;如果满足正态性但总体方差不齐,采用t检验;当两者都不满足时,才考虑 选用秩和检验。当然,我们也可采用变量变换的方法使其满足t 或 t检验的条件。 5. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“ 平均秩次 ” ,而同一组的相同 数据不必计算“ 平均秩次 ” ? 答:秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数 据不必计算“平均秩次”,是因为取不取“平均秩次”对该组的总的秩和没有影响。 三、计算题 1. 某单位研究饲料中维生素E缺乏对肝中维生素A

49、含量的影响, 将同种属、 同年龄、 同性别、 同体重的大白鼠配成8对,并将每对动物随机分配到正常饲料组和缺乏维生素E的饲料组, 定期将大白鼠杀死,测定其肝中维生素A的含量(教材表6-12 ) ,问饲料中维生素E缺乏对肝 中维生素 A的平均含量有无影响? 教材表 6- 12 正常饲料组与维生素E缺乏组大白鼠肝中维生素A 含量 / (Umg -1 ) 大白鼠对别12345678 正常饲料组3.552.603.003.953.803.753.453.05 维生素 E缺乏组2.452.401.803.203.252.702.401.75 解:此题是个配对设计的资料,差值的正态性检验结果表明:差值来自正态总体(W检 验: P=0.268),所以采用配对t检验。结果为:t=6.837,=7,P0.001,拒绝H0,可 以认为维生素E 缺乏对肝中维生素A 含量有影响。 2. 某实验室观察局部温热治疗小鼠

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1