文档库 最新最全的文档下载
当前位置:文档库 › 高中数学第三章统计案例31独立性检验假设检验素材苏教版选修23

高中数学第三章统计案例31独立性检验假设检验素材苏教版选修23

高中数学第三章统计案例31独立性检验假设检验素材苏教版选修23
高中数学第三章统计案例31独立性检验假设检验素材苏教版选修23

数学选修2-3第三章-统计案例阶段测试3(含详

数学选修2-3第三章-统计案例阶段测试3(含详细答案)

阶段测试三 (第三章统计案例) (时间:120分钟,满分:150分) 一、选择题(每小题5分,共60分) 1.下列关系中是相关关系的是() ①路程与时间、速度的关系; ②加速度与力的关系; ③产品成本与产量的关系; ④圆周长与面积的关系; ⑤广告费支出与销售额的关系. A.①②④B.①③⑤ C.③⑤D.③④⑤ 2.下列说法中表述恰当的个数为() ①相关指数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好; ②在线性回归模型中,R2表示解释变量对预报变量的贡献率,R2越接近于1,表示解释变量

和预报变量的线性相关关系越强; ③若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当. A.0 B.1 C.2 D.3 3.(2016·重庆南开中学期末)巧克力很甜、很好吃,数学很妙、很有趣,某中学统计了部分同学“爱吃巧克力”与“数学成绩好”的关系,得到下表: 经计算得k≈4.167,由此可以判断()

参考数据: A.至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”有关 B .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”有关 C . 至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”无关 D .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”无关 4.某车间为了规定工时定额,需要确定加 工零件所花费的时间,为此进行了5次试验,收集数据如下:

经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是() A.成正相关,其回归直线经过点(30,75) B.成正相关,其回归直线经过点(30,76) C.成负相关,其回归直线经过点(30,76) D.成负相关,其回归直线经过点(30,75) 5.下列关于等高条形图说法正确的是() A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 6.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

数学选修23第三章统计案例教案

第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.

高中数学第三章统计案例2独立性检验教学案北师大版选修2_3

§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]

[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:

高二数学1-2 独立性检验

独立性检验 教学重点、独立性检验的基本方法,独立性检验的步骤 难点:.基本思想的领会及方法应用. 知识点 一、独立性检验的基本概念和原理 独立性检验是研究相关关系的方法。 1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。 2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个 3.条形图 为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比. 通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢? 4.独立性检验的步骤 为了回答下面问题,我们先假设H :吸烟与患肺癌没有关系,看看能够得到什么样 的结论。 不患肺癌患肺癌合计不吸烟 a b a+b 吸烟 c d c+d 合计a+c b+d a+b+c+d 样本容量 n=a+b+c+d 如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:

()()() ()()()() 2 2 0a c a c d c a b ad b c a b c d ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈?+≈+?-≈++---= ++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中 为样本容量 若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为 ()2 2 996577754942209956.63278172148987491 K ?-?=≈???, 这个值到底能告诉我们什么呢? 统计学家经过研究后发现,在 H 0成立的情况下, 2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2 K 的观测值超过 6. 635 的概率非常小,近似为0 . 01, 是一个小概率事件.现在2 K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量2 K 的观测值k 建立了一个判断H 0是否成立的规则: 如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系. 在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过 2( 6.635)0.01P K ≥≈, 即有99%的把握认为H 0不成立. 假设检验 备择假设H 1 不成立的前提下进行推理 10成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发 生,意味着H 1成立的可能性(可能性为(1-α))很大 下任上例的解决步骤 第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系? H 1:吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 ()K ()()()() n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

单元测试:选修2-3第三章《统计案例》

选修2-3第三章《统计案例》 (时间120分钟 满分150分) 一、选择题(共60分) 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相 同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1 次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A.310 B.29 C.78 D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100% 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89

高中数学第三章统计案例章末小结知识整合与阶段检测教学案北师大版选修2_334.doc

第三章统计案例 知识整合与阶段检测 [ 对应学生用书P42] 一、回归分析 1.线性回归分析 对于一组具有线性相关关系的数据( x1,y1) , ( x2,y2) ,, ( x n,y n) ,其线性回归直线方程为 y= a+bx, n n x i- xy i- y x i y i- n x · y i = 1 i =1 其中 b==, n n x i- x 2 2 2 x i- n x i = 1 i = 1 a= y - b x . 2.相关系数 n x i- x y i- y i = 1 r = n n x i- x 2·y i- y 2 i = 1 i =1 n x i y i- n x · y i = 1 =, n n 2 2 2 - n y 2 x i- n x ·y i i =1 i = 1 | r | 值越大,相关性越高,| r | 值越接近0,线性相关程度越低. 二、独立性检验

独立性检验的一般步骤(1)列出 2×2列联表; (2) 代入公式计算 2 n ad- bc 2 χ =a+c a+ b b+d c+d ; (3)根据χ2的值的大小作出判断. 对应阶段质量检测三 见 8开试卷 ( 时间 90 分钟,满分120 分 ) 一、选择题 ( 本大题共10 小题,每小题 5 分,共50 分.在每小题给出的四个选项中, 只有一项是符合题目要求的) 1. ( 全国新课标 ) 在一组样本数据 ( x1,y1) , ( x2,y2) ,, ( x n,y n)( n≥2,x1,x2,, x 不全相等 ) 的散点图中,若所有样本点( x,y )( i=1,2 ,,n) 都在直线y=2x+ 1 上,则n i i 1 这组样本数据的样本相关系数为( ) A.- 1 B. 0 1 C. 2 D. 1 解析:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为 1. 答案: D 2.已知x与y之间的一组数据: x 0 1 2 3 y 1 3 5 7 则 y 与 x 的线性回归方程y= a+ bx 必过点( ) A. (2,2) B. (1.5,0) C. (1,2) D. (1.5,4) 解析:线性回归方程y=a+ bx 必过点--( x,y ) . 答案: D 3.下列现象的相关程度最高的是( ) A.某商店的职工人数与商品销售额之间的相关系数为0.87 B.流通费用率与商业利润之间的相关系数为-0.94 C.商品销售额与商业利润之间的相关系数为0.51 D.商品销售额与流通费用率之间的相关系数为-0.81

2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3

§3.2 独立性检验的基本思想及其初步应用 学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2 的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法. 知识点一 分类变量及2×2列联表 思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表: 体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计 270 520 790 如何判定“喜欢体育还是文娱与性别是否有联系”? 答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表 一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表. y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a + b + c +d 知识点二 等高条形图 1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. 2.如果通过直接计算或等高条形图发现a a + b 和 c c +d 相差很大,就判断两个分类变量之间有关系. 知识点三 独立性检验

1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 2.K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d为样本容量. 3.独立性检验的具体做法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0. (2)利用公式计算随机变量K2的观测值k. (3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 1.列联表中的数据是两个分类变量的频数.( √) 2.事件A与B的独立性检验无关,即两个事件互不影响.( ×) 3.K2的大小是判断事件A与B是否相关的统计量.( √) 类型一等高条形图的应用 例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下: 组别阳性数阴性数总计 铅中毒病人29736 对照组92837 总计383573 试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 考点定性分析的两类方法 题点利用图形定性分析 解等高条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

数学:第三章《统计案例》测试(2)(新人教A版选修2-3)

高中数学精品资料 2020.8 高中新课标选修(2-3) 第三章统计案例综合测试题 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841 K< K>B.2 3.841 C.2 6.635 K< K>D.2 6.635 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4 组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 不患肺病患肺病合计 不吸烟7775 42 7817 吸烟2099 49 2148 合计9874 91 9965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90%B.95%C.99%D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴24 31 55 女婴8 26 34

合计 32 57 89 A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 答案:C 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度 5- 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54 如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143 C.200 D.243 答案:B 10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表: 优秀 不优秀 合计

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

高中数学 选修1-2 3.独立性检验

3.独立性检验 教学目标 班级____姓名________ 1.了解分类变量、列联表、随机变量2 K . 2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点. 1.分类变量:变量不同的值表示个体所属的类别不同. 2.列联表:两个分类变量的频数表. 3.随机变量:) )()()(()(22 d b c a d c b a bc ad n K ++++-=,010.0)635.6(2 ≈≥K P (小概率事件) 4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”; (2)假设结论不成立,即“0H :两个分类变量没有关系”; (3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的) (4)按照上述规则,误判概率为)(02k K P ≥. 0k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 )(02k K P ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 (5)拓展: ①令|| d c c b a a W +-+=,则) )(() )((22d b c a d c b a n W K ++++?=; ②令) )(() )((00d c b a n d b c a k w ++++? = ; ③02 k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02 k K P ≥; ④可以用)(0w W P ≥来作为判断依据. 二、例题分析. 例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.

高中数学选修2-3第三章《统计案例》测试题

高中数学选修2-3第三章《统计案例》测试题 姓名___________学号______(满分100分,时间90分钟) 一、选择题:(每题5分,共50分,请将准确答案填在答题卡内) 1.已知一个线性回归方程为?y =1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.5 2.对有线性相关关系的两个变量建立的回归直线方程 ???y a bx =+中,回归系数? b ( ) A .能等于0 B .小于0 C .可以小于0 D .只能等于0 3.能表示n 个点与相应直线在整体上的接近程度的是( ) A.1 ()n i i y i =-∑ B 1 ()n i i i y =-∑ C. 2 1 () n i i y i =-∑ D. 21 ()n i i y y =-∑ 4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2 = ()()()()() n ad bc a b c d a c b d -++++算得K 2 =2 110(40302030)7.860506050 ??-?≈???附表: P (K 2≥k ) 0.10 0.05 0.025 0.01 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^ =-3+bx ,若∑i =1 10x i =17,∑i =1 10 y i =4,则b 的值为( ) A .2 B .1 C .-2 D .-1 6.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( ) A. y ^ =x +1 B. y ^=x +2 C. y ^=2x +1 D . y ^ =x -1 7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

高中数学选修1-2《独立性检验基本思想及其初步应用》教案

高中数学选修1-2《独立性检验基本思想及其初步应用》教案 High school mathematics elective 1-2 "basic idea of independe nce test and its preliminary application" teaching plan

高中数学选修1-2《独立性检验基本思想及 其初步应用》教案 前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角 度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的 作用,是学习和研究现代科学技术必不可少的基本工具。本教案根据数学课程标准 的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和 计划、并以启迪发展学生智力为根本目的。便于学习和使用,本文档下载后内容可 按需编辑修改及打印。 教学要求:通过探究“吸烟是否与患肺癌有关系”引出 独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量 的含义. 教学过程: 教学过程: 一、复习准备: 独立性检验的基本步骤、思想

二、讲授新课: 1.教学例1: 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? ① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论; 第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 第三步:由学生计算出的值; 第四步:解释结果的含义. ② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.

统计案例之独立性检验

统计案例之独立性检验 班级姓名学号 参考公式:,其中. 1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生 互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响, 采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下: 表一:男生表二:女生 (1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率; (2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.

2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北 京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动. (1)根据以上数据完成以下2×2列联表: 喜爱运动不喜爱运动总计 男10 16 女 6 14 总计30 (2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少? 3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关, 现从高一学生中抽取人做调查,得到如下列联表: 已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为, (Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关? 并说明你的理由;

(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取 人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率, 4.某学校高三年级有学生 1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表: 身高达标身高不达标总计 经常参加体育锻炼40 不经常参加体育锻炼15 总计100 (1)完成上表; 5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.

第三章 统计案例 思想方法篇

1 回归分析与独立性检验的理解与加深 一、回归分析 1.回归方程y ^ =b ^ x +a ^ ,其中: b ^ =∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑n i =1 x i y i -n x y ∑n i = 1 x 2i -n x 2 ,a ^ =y -b ^ x . (注:b ^ =∑n i =1x i y i -n x y ∑n i = 1 x 2i -n x 2主要方便计算,其中(x i ,y i )为样本数据,(x ,y )为样本点的中心) 公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势. 公式联系:是进行残差分析的基础. 2.样本相关系数的具体计算公式: r = ∑n i =1 (x i -x )(y i -y ) ∑n i =1 (x i -x )2∑n i = 1 (y i -y )2 = ∑n i =1 x i y i -n x y (∑n i =1 x 2i -n x 2)(∑n i = 1 y 2i -n y 2 ) 公式作用:反映两个变量之间线性相关关系的强弱.当r 的绝对值接近1时,表明两个变量的线性相关性越强;当r 的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系.规定当r >0.75时,认为两个变量有很强的线性相关关系. 公式联系:(1)由于分子与回归方程中的斜率b 的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r >0时,两个变量正相关;当r <0时,两个变量负相关. (2)常配合散点图判断两个随机变量是否线性相关. 散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.

相关文档
相关文档 最新文档