核心素养测评六十一变量的相关性与统计案例
(20分钟50分)
一、选择题(每小题5分,共25分)
1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得χ2的值为5,又已知P(χ2≥3.841)=0.05,P(χ2≥6.635)=0.01,则下列说法正确的是( )
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
【解析】选A.依题意χ2=5,且P(χ2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”.
2.下面四个图中反映出回归模型的拟合精度较高的为( )
A.图①
B.图②
C.图③
D.图④
【解析】选A.根据图中显示的分布情况即可看出,图①显示的点比较均匀地落在水平的带状区域中,所以拟合精度较高.
3.(多选)“吸烟有害健康,吸烟会对身体造成伤害”.美国癌症协会研究表明,开始吸烟年龄X 分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1
表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法错误的是( )
A.r1=r2
B.r1>r2>0
C.0 D.r1<0 【解析】选ABC.由题意可知,开始吸烟年龄递增时,得肺癌的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的危险度呈负相关,所以r1<0,同理可知,得肺癌的危险度与每天吸烟支数呈正相关,所以r2>0.因此可得r1<0 4.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线=x+近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( ) A.线性相关关系较强,的值为1.25 B.线性相关关系较强,的值为0.83 C.线性相关关系较强,的值为-0.87 D.线性相关关系太弱,无研究价值 【解析】选B.散点图里变量的对应点分布在一条直线附近,且比较密集,故可判断语文成绩和英语成绩之间具有较强的正线性相关关系,且直线斜率小于1. 5.(2020·南昌模拟)某公司在2015~2019年的收入与支出如表所示: 收入x(亿元) 2.2 2.6 4.0 5.3 5.9 支出y(亿元) 0.2 1.5 2.0 2.5 3.8 根据表中数据可得回归方程为y=0.8x+a,依此估计2020年该公司收入为8亿元时支出为( ) A.4.2亿元 B.4.4亿元 C.5.2亿元 D.5.4亿元 【解析】选C.根据表中数据,计算=×(2.2+2.6+4.0+5.3+5.9)=4, =×(0.2+1.5+2.0+2.5+3.8)=2, 所以=2-0.8×4=-1.2, 所以回归直线方程为=0.8x-1.2, 计算x=8时=0.8×8-1.2=5.2(亿元), 即2020年该公司收入为8亿元时的支出为5.2亿元. 二、填空题(每小题5分,共15分) 6.(2020·长春模拟)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l 1:=0.68x+,计算其相关系数为r1,相关指数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为l 2:=x+0.68,相关系数为r2,相关指数为.以下结论中,不正确的序号是________. ①r1>0,r2>0 ②> ③=0.12 ④0<<0.68 【解析】由图可知两变量呈现正相关,故r1>0,r2>0,且r1 故①正确,②不正确. 又回归直线l 1:=0.68x+必经过样本点的中心(3.5,2.5),所以=2.5-0.68×3.5=0.12,③正确. 回归直线l 2:=x+0.68必经过样本点的中心(3,2),所以2=×3+0.68, 所以=0.44,也可直接根据图象判断0<<0.68(比较两直线的倾斜程度),故④正确. 答案:② 7.某学校社团为调查学生课余学习围棋的情况,随机抽取了100名学生进行调查.根据调查结果绘制的学生日均学习围棋时间的频率分布直方图如图所示,将日均学习围棋时间不低于40分钟的学生称为“围棋迷”. 根据已知条件完成下面的2×2列联表,并据此资料判断________(填“有”或“没有”)95%的把握认为“围棋迷”与性别有关. 非围棋迷围棋迷合计 男 女10 55 合计 【解析】由频率分布直方图可知,在抽取的100人中,“围棋迷”有100×0.25=25(人), 从而2×2列联表如表所示: 非围棋迷围棋迷合计 男30 15 45 女45 10 55 合计75 25 100 将2×2列联表中的数据代入公式计算,得 χ2= =≈3.030, 因为3.030<3.841,所以没有95%的把握认为“围棋迷”与性别有关. 答案:没有 8.下表为“民安生鲜超市”的员工工作年限x(单位:年)与平均月薪y(单位:千元)的对照表. x 3 4 5 6 y 2.5 3 λ 4.5 利用最小二乘法求得y关于x的线性回归方程为=0.7x+0.35,则(4,3),(5,λ),(6,4.5),这三个样本点中落在回归直线上方的个数为______个. 【解析】由表中的数据,可得 ==4.5, ==, 因为样本点的中心(,)一定在回归直线上,所以=0.7×4.5+0.35,解得 λ=4. 故当x=4时,=0.7×4+0.35=3.15>3,所以点(4,3)在回归直线=0.7x+0.35的下方; 当x=5时,=0.7×5+0.35=3.85<4,所以点(5,λ)在回归直线=0.7x+0.35的上方; 当x=6时,=0.7×6+0.35=4.55>4.5,所以点(6,4.5)在回归直线=0.7x+0.35的下方. 综上,三个样本点中落在回归直线=0.7x+0.35上方的有1个. 答案:1 三、解答题 9.(10分)(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下: 方法一:从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线 y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额 的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠. 方法二:从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠. (15分钟35分) 1.(5分)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如表: 学生 1 2 3 4 5 6 7 8 编号 数学 60 65 70 75 80 85 90 95 成绩 物理 72 77 80 84 88 90 93 95 成绩 给出散点图如图: 根据以上信息,判断下列结论: ①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系; ③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高. 其中正确的个数为( ) A.0 B.1 C.2 D.3 【解析】选B.由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同 学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1. 2.(5分)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表: 男女总计 爱好40 20 60 不爱好20 30 50 总计60 50 110 由χ2=算得, χ2=≈7.8. 附表: P(χ2≥k0) 0.05 0.010 0.001 k0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【解析】选A.根据独立性检验的定义,由χ2的观测值为k≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”. 3.(5分)在2019年3月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示: 价格x 9 9.5 m 10.5 11 销售量y 11 n 8 6 5 由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=________. 【解析】==8+, ==6+. 回归直线一定经过样本点的中心(,), 即6+=-3.2+40, 即3.2m+n=42. 又因为m+n=20,即解得 答案:10 4.(10分)已知某企业近3年的前7个月的月利润(单位:百万元)如折线图所示: (1)试问这3年的前7个月中哪个月的月平均利润最高? (2)通过计算判断这3年的前7个月的总利润的发展趋势. (3)试以第3年的前4个月的数据(如表),用线性回归的拟合模式估计第3年8月份的利润. 月份x 1 2 3 4 利润y(单位:百万元) 4 4 6 6 相关公式:==,=-. 【解析】(1)由折线图可知5月和6月的月平均利润最高. (2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元), 第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元). 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元),所以这3年的前7个月的总利润呈上升趋势. (3)因为=2.5,=5,12+22+32+42=30,1×4+2×4+3×6+4×6=54, 所以==0.8,所以=5-2.5×0.8=3.因此线性回归方程为=0.8x+3. 当x=8时,=0.8×8+3=9.4. 所以估计第3年8月份的利润为9.4百万元. 5.(10分)(2020·珠海模拟)某种仪器随着使用年限的增加,每年的维护费相应增加. 现对一批该仪器进行调查,得到这批仪器自购入使用之日起,前5年平均每台仪器每年的维护费用大致如表: 年份x(年) 1 2 3 4 5 维护费y(万元) 0.7 1.2 1.6 2.1 2.4 (1)根据表中所给数据,试建立y关于x的线性回归方程=x+. (2)若该仪器的价格是每台12万元,你认为应该使用满五年换一次仪器,还是应该使用满八年换一次仪器?并说明理由. 参考公式:用最小二乘法求线性回归方程=x+的系数公 式:== ,=-. 【解析】(1)=3,=1.6,=9,=4.8, x i y i=0.7+2.4+4.8+8.4+12=28.3, =1+4+9+16+25=55. 所以,===0.43, =-=1.6-0.43×3=0.31. 所以回归方程为=0.43x+0.31. (2)若满五年换一次仪器,则每年每台仪器的平均费用为:y1==4(万元) 若满八年换一次设备,则每年每台设备的平均费用为: y2===3.745(万元). 因为y1>y2,所以应该使用满八年换一次仪器. 赠送:高中生物必修一考前知识总结 1、蛋白质的基本单位氨基酸, 其基本组成元素是CH、O、N。 2、氨基酸的结构通式:肽键:—NH—CO— 3、肽键数=脱去的水分子数=氨基酸数—肽链数 4、多肽分子量=氨基酸分子量 x氨基酸数—水分子数x18 5、核酸种类:DNA和RNA基本组成元素:C、H、O、N、P 6、DNA的基本组成单位:脱氧核苷酸; RNA的基本组成单位:核糖核苷酸。 7、核苷酸的组成包括:1分子磷酸1分子五碳糖1分子含氮碱基 8、DNA主要存在于细胞核中,含氮碱基为A、G、C、T; RNA主要存在于细胞质中,含氮碱基为A、G、C、U; 9、细胞的主要能源物质是糖类,直接能源物质是ATP。 10、淀粉、纤维素、糖原属于多糖。组成元素C、H、O 11、脂质包括:脂肪、磷脂和固醇。固醇包括胆固醇、性激素和维生素D。 12、水在细胞中存在形式:自由水、结合水 13、自由水比例高,细胞代谢旺盛。 14、细胞中含有最多的化合物:水 15、血红蛋白中的无机盐是:Fe2+,叶绿素中的无机盐是:Mg2+动物血钙过低,导致抽搐。 16、被多数学者接受的细胞膜模型叫流动镶嵌模型。 17、细胞膜的成分:脂质、蛋白质和少量糖类。细胞膜的基本骨架是磷脂双分子层。 18、制备细胞膜用哺乳动物成熟的红细胞,没有细胞核众多的细胞器 细胞膜的结构特点是:具有流动性;功能特点是:具有选择透过性。 19、具有双层膜的细胞器:线粒体、叶绿体; 不具膜结构的细胞器:核糖体、中心体; 线粒体通过内膜向内折叠形成嵴增大膜面积;叶绿体内有基粒,由类囊体薄膜堆叠形成; 线粒体和叶绿体中均有少量的DNA 蛋白质的合成场所是核糖体;有“消化车间”之称的是溶酶体; 中心体存在于动物和某些低等植物体内(如水绵)、与细胞有丝分裂有关。 与植物细胞细胞壁形成有关、与动物细胞分泌蛋白质有关的细胞器是高尔基体。 20、细胞核的结构包括:核膜、核仁和染色质。(染色质由DNA和蛋白质结合而成。) 细胞核的功能:是遗传物质储存和复制的场所,是细胞代谢和遗传的控制中心。 21、原核细胞(细菌)和真核细胞(酵母菌)最本质的区别:有无以核膜为界限的细胞核 22、物质从高浓度到低浓度的跨膜运输方式是:自由扩散和协助扩散; 需要载体的运输方式是:协助扩散和主动运输; 需要消耗能量的运输方式是:主动运输; 23、酶的化学本质:多数是蛋白质,少数是RNA 24、酶的特性:高效性、专一性、作用条件较温和 25、ATP的名称是三磷酸腺苷,结构式是:A—P~P~P。 ATP是各项生命活动的直接能源,被称为能量“通货”。 26、ATP与ADP相互转化的反应式: 27、ATP,ADP,与DNA,RNA的基本组成元素均是C、H、O、N、P 28、叶片中的色素包括两类:叶绿素和类胡萝卜素。前者又包括叶绿素a和叶绿素b,后者包括胡萝卜素和叶黄素。以上四种色素分布在叶绿体的类囊体薄膜上。 29、叶绿素主要吸收蓝紫光和红光,类胡萝卜素主要吸收蓝紫光。因此蓝紫光和红光的光合效率较高。 30、光合作用的反应式: 31、光合作用释放出的氧气,其氧原子来自于水 32、在绿叶色素的提取和分离实验中,无水乙醇作用是溶解色素,二氧化硅能使研磨充分,碳酸钙作用是防止研磨中色素遭到破坏。 33、分离色素用层析液,溶解度越高,扩散速度越快。 34、色素分离后的滤纸条上,色素带从上到下的顺序是:胡萝卜素、叶黄素、叶绿素a、叶绿素b 35、光合作用包括两个阶段:光反应和暗反应。前者的场所是类囊体薄膜,后者的场所是叶绿体基质。 36、光反应为暗反应提供[H]和ATP 37、有氧呼吸反应式: 38、动物有氧细胞产生ATP的场所有细胞质基质和线粒体。 有氧呼吸的三个阶段均能产生ATP。绿色植物细胞产生ATP除上述场所外,还有类囊体薄膜。 39、在最适温度、最适pH下,酶的活性最高。酶的催化效率可用单位时间内反应物的剩余量(生成物的增加量)来表示。 39、淀粉遇碘液变蓝 41、检测还原糖用斐林试剂,其由0.1g/ml的NaOH溶液和0.05g/ml的CuSO4溶液组成,与还原糖发生反应生成砖红色沉淀。使用时注意现配现用。 42、鉴定生物组织中的脂肪可用苏丹Ⅲ染液和苏丹Ⅳ染液。前者将脂肪染成橘黄色,后者染成红色。 43、鉴定蛋白质(如蛋白酶)可用双缩脲试剂。使用时先加NaOH溶液,后加2~3滴CuSO4溶液。反应生成紫色络合物。 44、给染色体染色常用的染色剂是龙胆紫或醋酸洋红溶液。 45、“观察DNA和RNA在细胞中的分布”中,用甲基绿和吡罗红 两种染色剂染色,DNA被染成绿色,RNA被染成红色。 46、原生质层包括:细胞膜、液泡膜以及这两层膜之间的细胞质。 47、健那绿染液是专一性染线粒体的活细胞染料,可以使活细胞中线粒体呈现蓝绿色。 48、在分泌蛋白的合成、加工、运输和分泌过程中,有关的细胞器包括:核糖体、内质网、高尔基体、线粒体。 49、氨基酸形成肽链,要通过脱水缩合的方式。 50、只有活细胞才能发生质壁分离及复原。质壁分离的外因是细胞液浓度<外界溶液浓度;内因是原生质层的伸缩性比细胞壁的伸缩性大。 51、细胞膜和其他生物膜都是选择透过性(功能特点)膜。 52、细胞有氧呼吸的场所包括:细胞质基质和线粒体。 53、有氧呼吸中,葡萄糖是第一阶段参与反应的,水是第二阶段参与反应的,氧气是第三阶段参与反应的。第三阶段释放的能量最多。 54、酵母菌的异化作用类型是:兼性厌氧型 55、检测酵母菌培养液中CO2的产生可用澄清石灰水,也可用溴麝香草酚蓝水溶液。 CO2可使后者由蓝色变绿色再变黄色。 56、检测酒精的产生可用橙色的重铬酸钾溶液。在酸性条件下,该溶液与酒精发生化学反应,变成灰绿色。 57、细胞体积越大,其相对表面积越小,细胞的物质运输效率就越低。细胞的表面积与体积的关系限制了细胞的长大。 58、连续分裂的细胞,从一次分裂完成时开始,到下一次分裂完成时为止,称为一个细胞周期。 59、有丝分裂间期发生的主要变化是:完成DNA分子的复制和 有关蛋白质的合成(染色质复制)。 60、有丝分裂分裂期各阶段特点: 前期:染色体、纺锤体出现,核膜、核仁消失; 中期:染色体的着丝点整齐地排列在赤道板上; 后期:着丝点分裂,染色体数目暂时加倍; 末期:染色体、纺锤体消失,核膜、核仁出现。 有染色单体时,染色体:染色单体:DNA=1:2:2(前、中) 无染色单体时,染色体:DNA=1:1(间、后、末) 61、细胞有丝分裂的重要意义,是将亲代细胞的染色体经过复制,精确地平均分配到两个子细胞中。 62、赤道板是虚拟平面(观察不到),细胞板(壁)是真实结构。 动植物有丝分裂的区别:前期(纺锤体的形成机制不同);末期子细胞形成方式不同(植物:细胞板→细胞壁;动物直接缢裂) 63、观察根尖分生区细胞的有丝分裂,选材后需经解离→漂洗→染色→制片(压片)。解离的目的是用药液使组织细胞分散开来。解离后细胞死亡,不能观察连续分裂的过程。 64、在个体发育中,由一个或一种细胞增殖产生的后代,在形态、结构和生理功能上发生稳定性差异的过程,叫做细胞分化。 细胞分化的实质:基因的选择性表达(遗传物质不变)。 65、植物组织培养利用的原理是:细胞全能性 66、由基因所决定的细胞自动结束生命的过程叫细胞凋亡。是自然生理过程,有积极意义。 67、细胞癌变的根本原因是:原癌基因和抑癌基因发生突变。