考点52变量间的相关关系与独立性检验-2018版典型高考数学试题解读与变式(解析版).pdf

上传人:tbuqq 文档编号:4453359 上传时间:2019-11-10 格式:PDF 页数:23 大小:1.60MB
返回 下载 相关 举报
考点52变量间的相关关系与独立性检验-2018版典型高考数学试题解读与变式(解析版).pdf_第1页
第1页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《考点52变量间的相关关系与独立性检验-2018版典型高考数学试题解读与变式(解析版).pdf》由会员分享,可在线阅读,更多相关《考点52变量间的相关关系与独立性检验-2018版典型高考数学试题解读与变式(解析版).pdf(23页珍藏版)》请在三一文库上搜索。

1、考点 52 变量间的相关关系与独立性检验 【考纲要求】 1会作两 个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系; 2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3了解独立性检验,并能应用这些方法解决一些实际问题. 4了解独立性检验(只要求 22列联表 )的基本思想、方法及其简单应用. 【命题规律】 分析近几年的高考试题不难知一般对回归直线的考查主要考查数据处理能力与计算能力,考查回归直线方 程的求法及样本中心点的应用;对于独立性检验问题,常常与概率、分布列、期望和方差进行综合考查, 主要体现为根据数据能够得到其22列联表,然后利用 2 K进行独立性

2、检验预计2018 年高考对本部分 的考查侧重于以下几个方面:(1)回归直线方程的求法和应用,常常会在小题中出现;( 2)独立性检验思 想的应用,可在小题中单独考查,也可能与概率统计知识在解答题中出现,总之估计高考对本部分的考查 会有所增强学科+ 网 【典型高考试题变式】 (一)变量相关关系的判断 例 1 【 2015年湖北卷】已知变量 x 和 y满足关系0.11yx,变量y与 z 正相关下列结论中正确的 是() A x 与y负相关,x与 z 负相关B x与y正相关, x 与 z 正相关 C x 与y正相关, x与 z负相关D x与y负相关, x 与 z正相关 【答案】 A 【方法技巧与归纳】在

3、散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之 间的关系,即变量之间具有函数关系如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关 关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系画散点图时,两组数据中可 以任选一组作为横坐标取值,另一组作为纵坐标取值且平面直角坐标系中两坐标轴的长度单位可以不同 【变式 1】 【变为利用频率等高条形判断相关关系】观察下面频率等高条形图,其中两个分类变量,x y之间 关系最强的是() A. B. C. D. 【答案】 D 【变式2】 【变为利用相关系数判断相关关系】若回归直线0yabxb,则x与y之间的相关系数

4、() A0rBrlC01rD10r 【答案】 D 【解析】回归直线0yabxb,两个变量x,y之间是一个负相关的关系,相关系数是一个负 数,10r,故选 D (二)回归方程的求法与回归分析 例 2 【 2016 年新课标卷】下图是我国2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折 线图 ()由折线图看出,可用线性回归模型拟合y 与 t 的关系,请用相关系数加以说明; ()建立y 关于 t 的回归方程(系数精确到0.01 ) ,预测 2016 年我国生活垃圾无害化处理量. 附注: 参考数据: 7 1 9.32 i i y, 7 1 40.17 ii i t y, 7 2 1

5、()0.55 i i yy,7 2.646. 参考公式:相关系数 1 22 11 ()() ()(yy) n ii i nn ii ii ttyy r tt , 回归方程yabt中斜率和截距的最小二乘估计公式分别为: 1 2 1 ()() () n ii i n i i ttyy b tt ,= .a ybt 【答案】()0.99r,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系; () 1.82 亿吨 ()由331.1 7 32.9 y及()得103.0 28 89.2 )( )( ? 7 1 2 7 1 i i i ii tt yytt b, 92.04103.03

6、31.1 ? ?t bya. 所以,y关于t的回归方程为:ty10.092.0?. 将 2016 年对应的9t代入回归方程得:82.1910.092.0 ? y . 所以预测 2016 年我国生活垃圾无害化处理量将约1.82 亿吨 . 【方法技巧与归纳】判断两个变量是否线性相关及相关程度通常有两种方法:( 1)利用散点图直观判断; (2)将相关数据代入相关系数r公式求出r,然后根据r的大小进行判断求线性回归方程时再严格按照 公式求解,一定要注意计算的准确性 规律总结: ( 1)最小二乘法估计的一般步骤:作出散点图, 判断是否线性相关;若是, 则用公式求 ? ?, a b, 写出回归方程;根据方

7、程进行估计(2)回归直线必过定点( , )x y 【变式 1】 【变折线图给出数据为表格给出数据,同时变为自己计算相关数据进行求解】某省的一个气象站 观测点在连续4 天里记录的 AQI 指数M与当天的空气水平可见度y(单位:cm)的情况如表1: 该省某市 2016 年 11 月AQI指数频数分布如表2: M0,200200,400400,600600,800800,1000 频数3 6 12 6 3 (1)设 100 M x,根据表1 的数据,求出y关于x的线性回归方程; (附参考公式: ? ? ybxa,其中 1 22 1 ? n ii i n i i x ynxy b xnx , ? ?

8、aybx) (2)小李在该市开了一家洗车店,经统计,洗车店平均每天的收入与AQI指数由相关关系,如表3: M0,200200,400400,600600,800800,1000 日均收入(元)20001000200060008000 根据表 3 估计小李的洗车店该月份平均每天的收入 【答案】 (1) 2141 24 ? 0 yx(2)2400元 【解析】(1) 1 97315 4 x, 1 0.53.56.59.5 4 y5, 4 1 90.573.536.51 9.558 ii i x y, 4 22222 1 9731140 i i x, 2 5845521 1404520 ? b, 21

9、41 55 204 ? a , 所以y关于x的线性回归方程为 2141 24 ? 0 yx (2)根据表 3 可知,该月30 天中有 3 天每天亏损约2000 元,有 6 天每天亏损约1000 元,有 12 天每 天收入约2000 元,有 6 天每天收入约6000 元,有 3 天每天收入约8000 元,估计小李的洗车店该月份 平均每天的收入约为 1 20003 100062000 1260006800032400 30 元 【变式 2】 【变试题背景且须先画散点图判断相关性再求回归模型】某公司为了准确地把握市场,做好产品 生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件 )

10、之间的关系如表: ( ) 在图中画出表中数据的散点图; ( ) 根据( ) 中的散点图拟合y与x的回归模型,并用相关系数甲乙说明; ( ) 建立y关于x的回归方程,预测第5 年的销售量约为多少?. 附注:参考数据: 4 2 1 32.6 i i yy,52.24, 4 1 418 ii i x y. 参考公式:相关系数 1 22 11 n ii i nn ii ii xxyy r xxyy , 回归方程 ? ?yabx中斜率和截距的最小二乘法估计公式分别为: 11 2 22 11 ? nn iiii ii nn ii ii xxyyx ynxy b xxxnx , ? ? a ybx. 来源:

11、Z_xx_k.Com 【答案】( ) 散点图见解析;( ) 答案见解析;( ) 71万件 . 【解析】( ) 作出散点图如图: ( ) 由 ( ) 知: 5 2 x, 69 2 y, 4 1 418 ii i x y, 4 2 1 30 i x, 4 2 1 ()5 i i xx, 1 22 1 73 5 ? n ii i n i i x ynxy b xnx , 69735 2 25 ? 2 ? aybx, 故y关于x的回归直线方程为 73 2 5 ? y x, 当5x时, 73 5271 5 ? y , 所以第 5 年的销售量约为71 万件 . (三)独立性检验 例 3 【2017 年全国

12、卷】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽 取了 100 个网箱,测量各箱水产品的产量(单位:kg ) 其频率分布直方图如下: 来源 学科网 (1)设两种养殖方法的箱产量相互独立,记A表示事件: “旧养殖法的箱产量低于50kg ,新养殖法的箱 产量不低于50kg ”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99% 的把握认为箱产量与养殖方法有关: 箱产量 50kg 箱产量50kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01 ) 附: , 2 2 n adbc K abcdacbd 【答

13、案】(1)0.4092; (2)见解析;(3)52.35 kg(). 【解析】(1)记B 表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于 50kg” 由题意知 P AP BCPB P C 旧养殖法的箱产量低于50kg的频率为0.0400.0340.0240.0140.0125=0.62() 故P B的估计值为0.62 , 新养殖法的箱产量不低于50kg的频率为0.0680.0460.0100.0085=0.66() 故P C的估计值为0.66 因此,事件A 的概率估计值为0.620.660.4092 (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50kg

14、的直方图面积为 0.0040.0200.04450.340.5, 箱产量低于55kg的直方图面积为0.0040.0200.044+0.06850.680.5 故新养殖法箱产量的中位数的估计值为 0.5-0.34 50+52.35 kg 0.068 () 【 方 法 技 巧 与 归 纳 】 独 立 性 检 验 的 一 般 步 骤 : 根 据 样 本 数 据 制 成22列 联 表 ; 根 据 公 式 2 2 n adbc K abcdacbd 计算 2 K的值;查表比较 2 K与临界值的大小关系,作统计判断 【变式 1】 【变独立性检验与概率交汇为独立性检验与统计交汇】中国神舟十一号载人飞船在酒泉

15、卫星发射 中心成功发射,引起全国轰动开学后,某校高二年级班主任对该班进行了一次调查,发现全班60 名同 学中,对此事关注的占 1 3 ,他们在本学期期末考试中的物理成绩(满分 100 分)如下面的频率分布直方图: (1)求“对此事关注”的同学的物理期末平均分(以各区间的中点代表该区间的均值) (2)若物理成绩不低于80 分的为优秀,请以是否优秀为分类变量, 补充下面的22列联表: 物理成绩优秀物理成绩不优秀合计 对此事关注 对此事不关注 合计 是否有95%以上的把握认为“对此事是否关注”与物理期末成绩是否优秀有关系? 参考公式: 2 2 n adbc k abcdacbd ,其中nabcd.

16、参考数据: 2 0 P Kk 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k2.072 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)75.5; (2)列联表见解析,没有. 【解析】(1)对此事关注的同学的物理期末平均分为 (450.005550.005650.020750.030850.030950.010)1075.5(分) (2)补充的22列联表如下: 来源 学科网 物理成绩优秀物理成绩不优秀合计 对此事关注8 12 20 对此事不关注8 32 40 合计16 44 60 由中的列联表可得 2 2 n adb

17、c k abcdacbd 2 608 328 12 164420 40 30 2.733.841 11 , 所以没有95%以上的把握认为“对此事是否关注”与物理期末成绩是否优秀有关系 【变 式 2】 【变为独立性检验与频率分布表交汇】2014 年 7 月 16 日,中国互联网络信息中心发布第三 十四次中国互联网发展状况报告,报告显示:我国网络购物用户已达3.32亿为了了解网购者一次性购 物金额情况, 某统计部门随机抽查了6 月 1 日这一天100 名网购者的网购情况,得到如下数据统计表已 知网购金额在2000 元以上(不含2000 元)的频率为0.4 ()确定 x, y,p,q的值; ()为进

18、一步了解网购金额的多少是否与网龄有关,对这100 名网购者调查显示:购物金额在2000 元 以上的网购者中网龄3 年以上的有35 人,购物金额在2000 元以下 (含 2000 元)的网购者中网龄不足3 年的有 20 人学 + 科网 请将列联表补充完整; 网龄 3 年以上网龄不足3 年合计 购物金额在2000 元以上35 购物金额在2000 元以下20 合计100 并据此列联表判断,是否有97.5%的把握认为网购金额超过2000 元与网龄在三年以上有关? 参考数据: 2 k 0.150.100.050.0250.0100.0050.001 k2.0722.7063.8415.0246.6357

19、.87910.828 (参考公式: 2 2 n adbc abcdacbd ,其中nabcd) 【答案】()15x,10y,0.15,0.1pq; ()见解析. 【解析】()因为网购金额在2000 元以上的频率为0.4, 所以网购金额在2000 元以上的人数为1000.4=40 所以30 40y ,所以 10y ,15x, 所以0.15,0.1pq. ()由题设列联表如下 网龄 3 年以上网龄不足 3 年 合 计 购物金额在2000元以 上 35 5 40 购物金额在2000元以 下 40 20 60 合计75 25 100 所以 2 2 n adbc K abcdacbd = 2 100 3

20、5 20405 5.56 75 25 4060 . 因为5.565.024 所以据此列联表判断,有97.5%的把握认为网购金额超过2000 元与网龄在三年以上有关 【数学思想】 1函数与方程思想的应用:在线性回归方程求解问题可能会到利用方程思想来解决,其散点图及反映的 变量间的变化本身就是借助于函数的思想来解决的; 2数形结合思想的应用:利用散点图来判断两个变量是否具有线性相关性体现的就是数形结合思想的应 用 【典例试题演练】 1 【云南省昆明一中2018 届高三第一次摸底测试】若对于变量 x的取值为 3,4,5,6,7 时,变量y对 应的值依次分别为4.0 ,2.5 ,-0.5 ,-1 ,-

21、2 ;若对于变量u的取值为1,2,3,4 时,变量v对应的值依 次分别为 2,3,4,6,则变量x和y,变量u和v的相关关系是() A. 变量x和y是正相关,变量 u和v是正相关 B. 变量x和y是正相关,变量 u和v是负相关 C. 变量x和y是负相关,变量u和v是负相关 D. 变量x和y是负相关,变量 u和v是正相关 【答案】 D 【解析】变量 x增加, 变量 y减少, 所以变量 x和y是负相关;变量u增加, 变量v增加, 所以变量u和v 是正相关,因此选D 2 【安徽省宣城市三校(郎溪中学、宣城二中、广德中学)2017-2018学年高三上学期期中联考】四名 同学根据各自的样本数据研究变量,

22、x y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ( ) y与x负相关且2.7567.3?25yx. y与x负相关且3.47654?.6 8yx y与x正相关且1.2266.5?78yxy与x正相关且8.96786?.1 3yx 其中正确的结论的序号是() A. B. C. D. 【答案】 C 【解析】由回归直线方程可知, y与x负相关 , y与x正相关 , 正确 ,故选 C. 3 【云南省红河州2017 届高三毕业生复习统一检测】为研究语文成绩和英语成绩之间是否具有线性相关 关系, 统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线 ? ?ybxa近似的刻画

23、 其相关关系,根据图形,以下结论最有可能成立的是() A. 线性相关关系较强,b的值为 1.25 B. 线性相关关系较强,b的值为 0.83 C. 线性相关关系较强,b的值为 0.87 D. 线性相关关系太弱,无研究价值 【答案】 B 【解析】由图可知语文成绩与数学成绩成正相关,且倾斜角小于4501b,故选: B 4 【2017 届内蒙古省百校联盟高三3 月教学质量监测】已知两个随机变量 x,y之间的相关关系如 下表所示: 根据上述数据得到的回归方程为 ? ?ybxa ,则大致可以判断() A. ?0a, ? 0bB. ?0a, ? 0bC. ?0a, ? 0bD. ?0a, ? 0b 【答案

24、】 C 【解析】根据随机变量,x y之间关系在表格中的数据可以看出,y随x的增大而增大,因此 ? 0b,由 于0.5,1.7xy, ? a = ? ybx1.70.5?0b,故选 C 5 【2017 届湖南省邵阳市高三下学期第二次联考】假设有两个分类变量X和Y的22列联表为 : 来源 学科网 1 y 2 y 总计 1 xa1010a 2 xc3030c 总计6040100 对同一样本 ,以下数据能说明X与Y有关系的可能性最大的一组为( ) A. 45,15acB. 40,20acC. 35,25acD. 30,30ac 【答案】 A 【解析】由题意可得,当 10 a a 与 30 c c 相差

25、越大, X 与 Y 有关系的可能性最大,分析四组选项,A 中的 a,c 的值最符合题意,故选A. 6 【广西柳州市2018 届高三毕业班上学期摸底联考】为了解某社区居民的家庭年收入与年支出的关系, 随机调查了该社区5 户家庭,得到如图统计数据表: 收入x(万元)8.3 8.5 9.9 11.4 11.9 支出y(万元)6.3 7.4 8.1 8.5 9.7 据上表得回归直线方程 ? ?ybxa,其中0.76,baybx,据此估计,该社区一户收入为15 万元家 庭的年支出为() A.11.4 万元B. 11.8 万元C. 12.0 万元D. 12.2 万元 【答案】 B 7 【2017 届广西省

26、高三上学期教育质量诊断性联合考试】2015 年年岁史诗大剧 芈月传 风靡大江南北, 影响力不亚于以前的甄嬛传某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较 好的线性相关关系,年龄在10,14,15,19,20,24,25,29,30,34的爱看比例分别为10%, 18%,20%,30%,%t现用这5 个年龄段的中间值x代表年龄段,如12 代表10,14,17代 表15,19,根据前四个数据求得x关于爱看比例y的线性回归方程为?4.68 %ykx,由此可推测t的 值为() A. 33B. 35C. 37D. 39 【答案】 B 【解析】前4 个数据对应的19.5x, 0.195y (

27、把百分数转化为小数),而 0 4.68 0 ykx0.0468bx,0.19519.50.0468b,0.0124b, 1.244.68 %yx,当 3034 32 2 x,1.24324.6835t,故选 B 8 【湖 北省荆州中学2018 届高三第二次月考】已知 x、y取值如下表 : x 0 1 4 5 6 8 y 1.3 1.8 5.6 6.1 7.4 9.3 从所得的散点图分析可知: y与x线性相关 ,且0.95 ? y xa,则a_ 【答案】 145 【解析】4x,5 25y,因线性回归方程通过样本点中心( , )x y,故有5 250 954a, 1.45a 9 【河南省豫北重点中

28、学2017 届高三 4 月联考】某互联网公司借助手机微信平台推广自己的产品,对今 年前 5 个月的微信推广费用 x与利润额y(单位:百万元)进于了初步统计,得到下列表格中的数据: x 24568 y 304060 p 70 经计算,月微信推广费用x与月利润额y满足线性回归方程6.517 5?.yx,则p的值为 _ 【答案】50 【解析】 24568 5 5 x , 30406070 40 55 pp y ,代入回归直线方程 406.5 517.550 5 p ,解得50p 10 【湖南师大附中2018届高三上学期月考】在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成 为全球性的威胁,为了考察

29、某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表: 感染未感染总计 服用104050 未服用203050 总计3070100 参考公式: 2 2 n adbc K abcdacbd 2 P Kk 0.150.100.050.0250.0100.0050.001 k2.0722.7063.8415.0246.6357.87910.828 参照附表,在犯错误的概率最多不超过_ (填百分比)的前提下,可认为“该种疫苗由预防埃博 拉病毒感染的效果” 【答案】5% 【解析】由题意可得, 2 2 10010 302040 4.7623.841 50 5030 70 k,参照附表,可得

30、:在犯错误的 概率不超过 5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为5%. 11 【湖北省重点高中联考协作体2017年秋季高三期中考试】在统计学中,偏差是指个别测定值与测定 的平均值之差,在成绩统计中,我们把某个同学的某刻考试成绩与该科班平均分的差叫某科偏差,班主任 为了了解个别学生的偏科情况,对学生数学偏差 x(单位:分)与物理偏差 y(单位:分)之间的关系进 行偏差分析,决定从全班40 位同学中随机抽取一个容量为8 的样本进行分析,得到他们的两科成绩偏差 数据如表: (1)已知x与y之间具有线性相关关系,求y关于x的线性回归方程; (2)若这次考试该班数学平均分为

31、120 分,物理平均分为92 ,试预测数学成绩126 分的同学的物理成 绩 参考公式: 11 2 22 11 ? nn iiii ii nn ii ii xxyyx ynxy b xxxnx , ? ? a ybx 参考数据: 8 1 324 ii i x y, 8 2 1 1256 i i x 【答案】(1) 11 42 ? y x; ( 2)94 (2)由题意设该同学的物理成绩为w, 则物理偏差为92w,而数学偏差为1261206, 则( 1)的结论可得 11 926 42 w,解得94w, 故可以预 测这位同学的物理成绩为94分 12 【百校联盟2018届高三开学摸底联考】某工厂为了对新

32、研发的产品进行合理定价,将该产品按事先 拟定的价格进行试销,得到一组检测数据 ,1,2,6 ii x yi,如下表所示: 已知变量, x y具有线性负相关关系,且 6 1 39 i i x , 6 1 480 i i y ,现有甲、乙、丙三位同学通过计算求 得其回归直线方程分别为:甲 454yx ;乙 4106yx ;丙 4.2105yx ,其中有且仅有一位 同学的计算结果是正确的.学+ 科网 (1)试判断谁的计算结果正确?并求出,a b的值; (2)若由线性回归方程得到的估计数据与检测数据的误差不超过1,则该检测数据是“理想数据”,现 从检测数据中随机抽取2 个,求这两个检测数据均为“理想数

33、据”的概率. 【答案】(1)8,90ab,(2) 1 5 P. 【解析】(1)因为变量,x y具有线性负相关关系,所以甲是错误的. 又易得6.5,80xy,满足方程,故乙是正确的.由条件可得 (2)由计算可得“理想数据”有3个,即4,90 , 6,83 , 8,75. 从检测数据中随机抽取2个,共有15种不同的情形, 其中这两个检测数据均为“理想数据”有3种情形 . 故所求概率为 31 155 P 13 【山西实验中学、南海桂城中学2018届高三上学期联考】某公司为确定下一年度投入某种产品的宣 传费,需了解年宣传费 x(单位 :千元 )对年销售量 y(单位 : t)和年利润z(单位 :千元 )

34、的影响 .对近 8 年的 年宣传费 i x和年销售量1,2,8 i y i数据作了初步处理,得到下面的散点图及一些统计量的值. 表中 8 1 1 8 iii i wx ww. (1) 根据散点图判断yabx与ycdx哪一个适宜作为年销售量y关于年宣传费x的回归类型? (给出判断即可,不必说明理由) (2)根据( 1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的利润z与,x y的的关系为0.2zyx.根据( 2)的结果回答下列问题: ()年宣传费49x时,年销售量及年利润的预报值是多少? ()年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据 1122 , nn

35、u vu vu v,其回归直线 vu的的斜率和截距的最小二乘估计为 1 2 1 ? ?, n ii i n i i uuvv vu uu . 【答案】 ( 1)ycdx适宜作为年销售量y关于年宣传费x的回归方程类型; (2)100.68?6yx; (3)年销售量y的预报值576.6,年利润z的预报值66.32. 年宣传费为 46.24 千元 . ( 3)由( 2)知,当49x时,年销售量y的预报值100.668485?76.6y,年利润 z的预报值 576.60.249?66.32z. 根据( 2)的结果知,年利润z的预报值0.2 1006813.620.?12zxxxx. 所以当 13.6

36、6.8 2 x,即46.24x时, ? z 取得最大值 . 故年宣传费为46.24 千元时,年利润的预报值最大. 14 【华大新高考联盟2018 届 11 月教学质量测评】某地区2008 年至 2016 年粮食产量的部分数据如下 表: (1)求该地区2008 年至 2016 年的粮食年产量y与年份t之间的线性回归方程; (2)利用(1)中的回归方程, 分析 2008 年至 2016 年该地区粮食产量的变化情况,并预测该地区2018 年的粮食产量. 附 :回归直线的斜率和截距的最小二乘估计公式分别为 11 2 22 11 ? nn iiii ii nn ii ii ttyyt ynty b tt

37、tnt , ? ? a ybt. 【答案】(1)6.520122 0?6 .2yt; (2)测该地区2018 量为 299. 2 万吨 . 【解析】(1)由所给数据可以看出,粮食年产量y与年份t之间是近似直线上升,下面来求线性回归方程, 为此对数据预处理如下: 对预处理后的数据,容易算得 4202421 1101929 0,3.2 55 xy , 22 222 4212112 19429503.2260 6.5 40 4224 ? 5 0 b , 3.26.503?.2a. 由上述计算结果,知所求线性回归方程为 ? ?25720126.520123.2yb tat, 即6.520122 0?6

38、 .2yt. (2)由( 1)知, ? 6.50b,故 2008 年至 2016 年该地区粮食产量逐年增加,平均每两年增加6. 5 万 吨. 将2018t代入( 1)中的线性回归方程,得6.56260.22?99.2y,故预测该地区2018 量为 299. 2 万吨 . 15 【湖南省衡阳市第八中学2018届高三上学期第三次月考】某市根据地理位置划分成了南北两区,为 调查该市的一种经济作物A(下简称A作物)的生长状况,用简单随机抽样方法从该市调查了500 处 A作物种植点,其生长状况如表: 其中生长指数的含义是:2 代表“生长良好”, 1 代表“生长基本良好”,0 代表“不良好, 但仍有收成”

39、, 1 代表“不良好,绝收” (1)估计该市空气质量差的A作物种植点中,不绝收的种植点所占的比例; (2)能否有99% 的把握认为“该市A作物的种植点是否绝收与所在地域有关”? (3)根据( 2)的结论,能否提供更好的调查方法来估计该市A作物的种植点中,绝收种植点的比例?请 说明理由 . 2 2 n adbc K abcdacbd 【答案】 (1) 11 12 (2) 有 99% 的把握认为“该市A 作物的种植点是否绝收与所在地域有关,(3 ) 采用分层抽 样比采用简单随机抽样方法好 【解析】(1)调查的 500 处种植点中共有120 处空气质量差,其中不绝收的共有110 处, 空气质量差的A 作物种植点中,不绝收的种植点所占的比例 11011 12012 (2)列联表如下: 收绝收合计 南区160 40 200 北区270 30 300 合计430 70 500 K 2= 2 500427030 160 200 300 70430 9.967 9.9676.635 , 有 99% 的把握认为“该市A 作物的种植点是否绝收与所在地域有关 (3)由( 2)的结论可知该市A 作物的种植点是否绝收与所在地域有关, 因此在调查时,先确定该市南北种植比例,再把种植区分南北两层采用分层抽样比采用简单随机抽样方法 好学科 + 网

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1