文档库 最新最全的文档下载
当前位置:文档库 › 高中数学一轮复习 第10讲 变量间的相关关系与统计案例

高中数学一轮复习 第10讲 变量间的相关关系与统计案例

高中数学一轮复习 第10讲 变量间的相关关系与统计案例
高中数学一轮复习 第10讲 变量间的相关关系与统计案例

第10讲 变量间的相关关系与统计案例

随堂演练巩固

1.两个变量之间的相关关系是一种( ) A.确定性关系 B.线性关系 C.非线性关系

D.可能是线性关系也可能不是线性关系 【答案】 D

【解析】 变量之间的相关关系是一种非确定性的关系,如果所有数据点都在一条直线附近,那么它们之间就是一种线性相关关系,否则不是线性相关关系. 2.有五组变量:

①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和其身体健康情况; ④正方形的边长和面积;

⑤汽车的重量和百公里的耗油量. 其中两个变量成正相关的是( ) A.①③ B.②④ C.②⑤ D.④⑤ 【答案】 C

【解析】 由正相关与负相关的概念可知②⑤是正相关,①③为负相关,④为函数关系,故选C. 3.下面关于2

K 的说法正确的是( )

A.2

K 在任何相互独立的问题中都可以用于检验有关还是无关 B.2K 的值越大,两个事件的相关性就越大

C.2K 是用来判断两个分类变量是否相关的随机变量,当2

K 的值很小时可以推定两类变量不相关

D.2

K 的计算公式是2

()

()()()()

n ad bc k a b c d a c b d -=

++++

【答案】 B

【解析】 2

K 只适用于22?型列联表问题,且2

K 只能推定两个分类变量相关,但不能推定两个 变量不相关.选项D 中2

K 公式错误,分子上少了平方.

4.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:

为了判断主修统计专业是否与性别有关系,根据表中的数据,得到2

K 的观测值

250(1320107)423272030k ??-?=≈???.844,

因为2

3K ≥.841,所以在犯错误的概率不超过的前提下,认为主修统计专业与性别有关系.

【答案】 0.05

【解析】 由2

K 的观测值4k ≈.844>3.841,故在犯错误的概率不超过0.05的前提下认为主修统

专业与性别有关系. 5.若施化肥量

x 与水稻产量y 的回归直线方程为

?525080kg y

x =+,,当施化肥量为时预计水稻产量为 . 【答案】 650 k g

【解析】 将x =80代入?5250y

x =+中即可得水稻的产量约为650 k g.

课后作业夯基 基础巩固

1.下列两个变量之间的关系是相关关系的是( ) A.正方体的棱长与体积

B.单位面积产量为常数时,土地面积与产量

C.日照时间与水稻的亩产量

D.电压一定时,电流与电阻 【答案】 C

【解析】 A 、B 、D 中两个变量间的关系都是确定的,所以是函数关系,C 中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量.故选C.

2.一位母亲记录了儿子3 —9岁的身高,数据(略),由此建立的身高与年龄的回归模型为 ?7197393y

x =.+.,用这个模型预测这个孩子10岁时的身高,正确的叙述是( ) A.身高一定是145.83 cm B.身高在145.83 cm 以上 C.身高在145.83 cm 左右 D.身高在145.83 cm 以下 【答案】 C

【解析】 用回归模型?7197393y

x =.+.,只能作预测,其结果不一定是个确定值. 3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( ) A.?1234y

x =.+ ?B 123x 5y

.=.+ C. ?123008y

x =.+. ?D 008x 123y

.=.+. 【答案】 C

【解析】 D 显然错误,把(4,5)代入A 、B 、C 检验,满足的只有C. 4.最小二乘法的原理是( ) A.使得1[()]n

i

i i y

a bx =-+∑最小 B.使得21[()]n i

i i y a bx =-+∑最小 C.使得221[()]n

i

i i y

a bx =-+∑最小 D.使得

21

[()]n i

i i y

a bx =-+∑最小

【答案】 D

【解析】 原理应为“使得样本数据的点到回归直线的距离的平方和最小”,故选D.

5.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的

几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程y =0.7x +0.35,那么表中m 的 值为( )

A.4

B.3.15

C.4.5

D.3

【答案】 D

【解析】 由题意可知,直线?07035y x x y =.+.,过点(,), 45353x y m =.,=.,=,又代入方程得故选D.

6.以下四个命题,其中正确的是( )

①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样

②两个随机变量相关性越强,则相关系数的绝对值越接近于1

③在回归直线方程?0212y

x =.+,中当解释变量x 每增加一个单位时,预报变量?y 平均增加0.2个单位 ④对分类变量X 与Y ,它们的随机变量2

K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大 A.①④ B.②④ C.①③ D.②③ 【答案】 D

【解析】 ①是系统抽样;对于④,随机变量2

K 的观测值k 越小,说明两个变量有关系的把握程度越 小.

7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

则在犯错误的概率不超过 的前提下认为多看电视与人变冷漠有关系.( ) A.0.01 B.0.025 C.0.05 D.0.10 【答案】 A

【解析】 可计算2

K 的观测值k =11.377>6.635.

8.已知一个线性回归方程为?1y =.5x +45(x i ∈{1,7,5,13,19}),则y = . 【答案】 58.5

【解析】 线性回归方程为y ?1y

=.5x +45,经过点()

x y ,,由x =9,知y =58.5. 9.某小卖部为了了解热茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的热茶

的杯

数与当天气温,并制作了对照表:

由表中数据算得线性回归方程?

??

y bx a

=+中的?b2

≈-,预测当气温为-5 ℃时,热茶销售量

为杯.(已知回归系数?b=1

2

2

1

?

?,

n

i i

i

n

i

i

x y nx y

a y bx

x nx

=

=

-

=-

-

)

【答案】 70

【解析】根据表格中的数据可求得

1(181310

4

x=++-1)=10,1(243438

4

y=+++64)=40.

∴a?

?40

a y bx

=-=-(-2)1060

?=.

∴y??

2605

y x x y

=-+,=-,

当时=-2(5)6070

?-+=.

10.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未

使用血清的人一年中的感冒记录作比较,提出假设

H:“这种血清不能起到预防感冒的作用”,利

用22

?列联表计算得2

K的观测值3

k≈.918,经查临界值表知2

(3

P K≥.841)0

≈.05.则下列结

论中,正确结论的序号是 .

①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;

②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;

③这种血清预防感冒的有效率为95%;

④这种血清预防感冒的有效率为5%.

【答案】①

【解析】2

K的观测值3

k≈.9183

≥.841,而2

(3

P K≥.841)0

≈.05,所以在犯错误的概率不超

过0.05的前提下认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和

该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.

11.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得

数据如下:

(1)y与x是否具有线性相关关系?

(2)如果y与x具有线性相关关系,求回归直线方程.

(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?

【解】 (1)由表中数据,画出散点图如下:

由散点图可知,x ,y 具有很好的线性相关关系.

(2)设所求的回归直线方程为???y

bx a =+,列出下表:

5591x y =,=.7,

10

2

1

38i

i x

==∑ 500, 1021

87i i y ==∑ 777, 10

1

i i i x y ==∑55 950,

则有10

1

102

2

21

1055950105591.7

?0.668385001055

10i i

i i i x y

x y

b

x x

==--??==

≈-?-∑∑, ?a

y =-?91bx =.7-0.6685554?=.96. 因此,所求的回归直线方程为?06685496y

x =.+.. (3)当x =200时,y 的估计值为?0y

=.66820054?+.96=188.56189≈, 因此,加工200个零件所用的工时约为189分钟.

12.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位 老年人,结果如下:

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;

(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与

性别有关系?

(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.

【解】 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿

者提供帮助的老年人的比例的估计值为7014500

=%.

2

(2)K 的观测值2500(4027030160)20030070430

k ??-?=≈???9.967.由于9.967>6.635,

所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关系. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老

年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女 的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好. 拓展延伸

13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:

(1)利用所给数据求年需求量与年份之间的回归直线方程???y

bx a =+; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.

【解】 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此

对数据预处理如下:

据预处理后的数据,容易算得

x =0, y =3.2.

?b

= ()2222

4(21)(2)(11)2194294224-?-+-?-+?+?+++260640==.5, ??32a

y bx =-=.. 由上述计算结果,知所求回归直线方程为???257(2006)65(2006)32y

y x a x -=-+=.-+., ?65(2006)2602y

x =.-+.. (2)利用直线方程①,可预测2012年的粮食需求量为

6.5(2012?-2006)+260.2=6.56260?+.2=299.2(万吨)300(≈万吨).

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

《平行关系的性质》公开课教学设计【高中数学必修2(北师大版)

《平行关系的性质》教学设计 教材分析: 本节内容在立体几何学习中,具有重要的意义和地位.本节课是在前面已经学习空间点、线、面位置关系的基础上,结合有关的实物模型,通过直观感知、操作确认(合情推理,不要求证明)归纳出平行关系的性质定理.本节课的学习对培养学生空间感与逻辑推理能力起到重要作用。 本节课的设计遵循从具体到抽象的原则,适当运用多媒体辅助教学手段,借助实物模型,通过直观感知、操作确认、合情推理归纳出直线与平面平行的判定定理,将合情推理与演绎推理有机结合,让学生在观察分析、自主探索、合作交流的过程中,揭示直线与平面平行的性质,养成积极主动、勇于探索、自主学习的学习方式,发展学生的空间观念和空间想象力,提高学生的数学逻辑思维能力. 教学目标: 【知识与能力目标】 1. 掌握直线与平面平行的性质定理; 2. 掌握两平面平行的性质定理; 3.能熟练应用直线与平面、平面与平面平行的性质定理解决相关问题. 【过程与方法】 1. 学生通过观察实物及模型,归纳得出直线与平面平行、平面与平面平行的性质定理. 2. 通过读图、识图、画图的过程,培养空间想象能力及运用图形和符号语言进行交流的能 力. 【情感态度与价值观】 学生在观察、探究、发现中学习,在自主、合作、交流中学习.体验学习的乐趣,增强自信心,树立积极地学习态度,提高学习的自我效能感. 教学重难点: 【教学重点】 归纳出直线与平面平行、平面与平面平行的性质定理. 【教学难点】 直线与平面平行、平面与平面平行的性质定理的合情推理及其应用. 课前准备: 课件、学案、实物模型.

教学过程: 一、课题引入: 上节课我们学习了线面平行、面面平行的判定定理.那今天我们一起来线面平行、面面平行的性质定理.也就是如果给你线面平行、面面平行能得到什么结论呢? 问题1:如果一条直线与一个平面平行,那么这条直线与这个平面内的直线有哪些位 置关系?(观察长方体) 问题2:如果一条直线和一个平面平行,如何在这个平面内做一条直线与已知直线平 行?(可观察教室内灯管和地面) 问题3:若直线a ∥平面α,过直线a 的平面β与平面α有哪些位置关系?当平面β 与平面α相交于直线b 时,直线a 与直线b 有怎样的位置关系?请尝试证明你的结论. 问题4:观察长方体1111D C B A ABCD -,面ABCD 与面1111D C B A 互相平行,那么在面 ABCD 内直线l 与面1111D C B A 是怎样的位置关系?与1111D C B A 面内的直线 是什么位置关系,那你如何找到此面内和l 平行的直线呢? 二、新课探究: 1.直线和平面平行的性质 文字语言:直线和平面平行的性质定理:一条直线与一个平面平行,则过这条直线的 任一平面与此平面的交线与该直线平行. 图形语言: 符号语言://a α,a β?,=α βb //a b ?. 注: 直线和平面平行的性质定理可简述为“若线面平行,则线线平行”.可以用符号表示: 若a ∥α,αβ?,b α β=,则a ∥b .这个性质定理可以看作直线与直线平 行的判定定理,用该定理判断直线a 与b 平行时,必须具备三个条件:(1)直线a 和平面α平行,即a ∥α;(2)平面α和β相交,即b α β=;(3)直线a

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

高中数学概率统计专题

高中数学概率统计专题文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

高三文科数学:概率与统计专题 一、选择题: 1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为 A.1 3 B. 1 2 C. 2 3 D. 3 4 3、在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相 等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=1 2x+1上,则这组样本 数据的样本相关系数为 (A)-1 (B)0 (C)1 2(D)1 4.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为 (A)10 3 (B) 1 5 (C) 1 10 (D) 1 20 5.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是 A.1 4B. π 8 C.1 2 D.π4

6.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( ) 二、填空题: 7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______。 8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____. 9.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 方程y ^=b ^x +a ^由表中数据得回归直线 中的b ^=-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题 10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售。如果当天卖不完,剩下的玫瑰花做垃圾处理。 (Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n ∈N )的函数解析式。 (Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 日需求量 n 14 15 16 17 18 19 20 频数 10 20 16 16 15 13 10 (1)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数; (2)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量 气温(℃) 18 13 10 -1 用电量(度) 24 34 38 64

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

概率统计-历届全国高中数学联赛真题专题分类汇编

概率统计 1、(2009一试8)某车站每天8 00~900∶∶,900~1000∶∶都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间是相互独立的,其规律为 一旅客820∶【答案】27 【解析】旅客候车的分布列为 候车时间的数学期望为10305070902723361218 ?+?+?+?+?= 2、(2010一试6)两人轮流投掷骰子,每人每次投掷两颗,第一个使两颗骰子点数和大于6者为胜,否则轮由另一人投掷.先投掷人的获胜概率是 . 【答案】 12 17 3、(2012一试8)某情报站有,,,A B C D 四种互不相同的密码,每周使用其中的一种密码,且每周都是从上周未使用的三种密码中等可能地随机选用一种.设第1周使用A种密码,那么第7周也使用A种密码的概率是.(用最简分数表示) 【答案】 61 243 【解析】用k P 表示第k 周用 A 种密码的概率,则第k 周末用A 种密码的概率为 1k P -.于是,有11(1),3k k P P k N *+=-∈,即1111()434k k P P +-=--由11P =知,14k P ? ?-???? 是首项为34,公

比为13-的等比数列.所以1131()443k k P --=-,即1311()434k k P -=-+,故761243 P = 4、(2014一试8)设D C B A ,,,是空间四个不共面的点,以 2 1 的概率在每对点之间连一条边,任意两点之间是否连边是相互独立的,则B A ,可用(一条边或者若干条边组成的)空间折线连接的概率是__________. 【答案】 3 4 2221219B C D -?-=点相连,且与,中至少一点相连,这样的情况数为()() 22(3)AB AD DB 无边,也无CD 边,此时AC,CB 相连有2种情况,,相连也有2种情况, ,,,,AC CB AD DB A B 但是其中均相连的情况被重复了一次,故可用折线连接的情况数为 222+2-1=7. 483++==.644以上三类情况数的总和为329748,故A,B 可用折线连接的概率为 5、(2015一试5)在正方体中随机取三条棱,它们两两异面的概率为. 【答案】 2 55 【解析】设正方体为ABCD-EFGH ,它共有12条棱,从中任意选出3条棱的方法共有3 12C =220种. 下面考虑使3条棱两两异面的取法数,由于正方体的棱共确定3个互不平行的方向(即AB 、AD 、AE 的方向),具有相同方向的4条棱两两共面,因此取出的3条棱必属于3个不同的方向.可先取定AB 方向的棱,这有4种取法.不妨设取的棱就是AB ,则AD 方向只能取棱EH 或棱FG ,共2种可能,当AD 方向取棱是EH 或FG 时,AE 方向取棱分别只能是CG 或DH. 由上可知,3条棱两两异面的取法数为4×2=8,故所求的概率为82 22055 =.

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

高中数学概率统计教案

专题二 概率统计(文科) (一)统计 【背一背基础知识】 一.抽样方法 抽样方法包含简单随机抽样、系统抽样、分层抽样三种方法,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 二.用样本估计总体 1.频率分布直方图:画一个只有横、纵轴正方向的直角坐标系,把横轴分成若干段,每一段对应一个组的组距,然后以此段为底作一矩形,它的高等于该组的 频率 组距 ,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在频率分布直方图中,每个小矩形的面积等于相应数据的频率,各小矩形的面积之和等于 1; 2.茎叶图:茎叶图是一种将样本数据有条理地列出来,从中观察样本分布情况的图.在茎叶图中,“茎”表示数的高位部分,“叶”表示数的低位部分. 3.样本的数字特征: (1)众数:一组数据中,出现次数最多的数据就是这组数据的众数(一组数据中的众数可能只有一个,也可能有多个).在频率分布直方图中,最高的矩形的中点的横坐标即为该组数据的众数; (2)中位数:将一组数据由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.在频率分布直方图中,中位数a 对应的直线x a =的左右两边的矩形面积之和均为0.5,可以根据这个特点求频率分布直方图中的中位数; (3)平均数:设n 个数分别为1x 、2x 、L 、n x ,则()121 n x x x x n = +++L 叫做这n 个数的算数平均数.在频率分布直方图中,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和; (4)方差:设n 个数分别为1x 、2x 、L 、n x ,则 ()()() 2222 121n s x x x x x x n ? ?=-+-++-????L 叫做这n 个数的方差,方差衡量样本的稳定

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

相关文档
相关文档 最新文档