§11.1 随机抽样
A组
1.判断下面结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样是一种不放回抽样.()
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()
(3)系统抽样在起始部分抽样时采用简单随机抽样.()
(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.
()
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()
2.在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是()
A.随机抽样B.分层抽样
C.系统抽样D.以上都不是
3.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()
A.700 B.669 C.695 D.676
4.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________.
5.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.
B组
1.(2012·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()
A.101 B.808 C.1 212 D.2 012
2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取
一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()
A.6 B.8 C.10 D.12
3.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()
A.7 B.15 C.25 D.35
4.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为()
5.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多
300人,现在按1
100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为()
A.8 B.11 C.16 D.10
6.(2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.
7.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.
8.(2012·福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.
9.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.
10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________.
C组
1.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250
②5,9,100,107,111,121,180,195,200,265
③11,38,65,92,119,146,173,200,227,254
④30,57,84,111,138,165,192,219,246,270
关于上述样本的下列结论中,正确的是()
A.②、③都不能为系统抽样B.②、④都不能为分层抽样
C.①、④都可能为系统抽样D.①、③都可能为分层抽样
2.(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()
A.7 B.9 C.10 D.15
3.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.
答案40
4. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,
采用系统抽样方法,按1~200编号分为40组,分别为1~5,
6~10,…,196~200,第5组抽取号码为22,第8组抽取号码
为______.若采用分层抽样,40岁以下年龄段应抽取______人.
5.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,
9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号
码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
6.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.
§11.2 用样本估计总体
A组
1.判断下面结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. ( )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.
( )
2. 某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________. 3. 一个容量为20的样本,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;
[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 4. (2012·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的
茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s 2=1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)
5. 某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试
成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
B 组
1. (2013·重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率
为
( )
A.0.2 B .0.4 C .0.5
D .0.6
2. (2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),
[80,100].若低于60分的人数是15,则该班的学生人数是
( )
A .45
B .50
C .55
D .60
3. (2012·陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的
茎叶图(如图所示),则该样本的中位数、众数、极差分别是 ( ) A .46,45,56
B .46,45,53
C.47,45,56 D.45,47,53
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则()
A.m e=m o=x.m e=m o<x
C.m e<m o<x.m o<m e<x
5.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x,方差为s2,则()
A.x=5,s2<2
B.x=5,s2>2
C.x>5,s2<2
D.x>5,s2>2
6.(2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为________;
(2)命中环数的标准差为________.
7.(2012·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,
26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
8.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
9.(2012·安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
(1)
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;
(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.
10.(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在
[50,90)之外的人数.
1.(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是
()
2.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
3.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是
()
A.70,75 B.70,50
C.75,1.04 D.62,2.35
4.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.
5.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
6.某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.
(1)
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第
二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?
(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求:第4组至少有一名学生被
考官A面试的概率.
§11.3 变量间的相关关系、统计案例
A组
1.判断下面结论是否正确(请在括号中打“√”或“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()
(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^
=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.
( )
(5)事件X ,Y 关系越密切,则由观测数据计算得到的χ2的值越大. ( )
(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.
( ) 2. 下面哪些变量是相关关系
( )
A .出租车车费与行驶的里程
B .房屋面积与房屋价格
C .身高与体重
D .铁块的大小与质量
3. 为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根
据这一数据分析,下列说法正确的是
( )
A .有99%的人认为该电视栏目优秀
B .有99%的人认为该电视栏目是否优秀与改革有关系
C .有99%的把握认为该电视栏目是否优秀与改革有关系
D .没有理由认为该电视栏目是否优秀与改革有关系
4. 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为
打鼾与患心脏病是________的(填“有关”或“无关”).
5. 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感
冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,已知P (χ2≥3.841)≈0.05.对此,四名同学作出了以下的判断: p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%. 则下列结论中,正确结论的序号是________.
①p ∧﹁q ;②﹁p ∧q ;③(﹁p ∧﹁q )∧(r ∨s ); ④(p ∨﹁r )∧(﹁q ∨s ).
B 组
1. 某地区调查了2~9岁的儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为y ^
=8.25x +60.13,下列叙述
正确的是
( )
A .该地区一个10岁儿童的身高为142.63 cm
B .该地区2~9岁的儿童每年身高约增加8.25 cm
C .该地区9岁儿童的平均身高是134.38 cm
D .利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 2. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,
直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图), 以下结论中正确的是 ( )
A .直线l 过点(x ,y )
B .x 和y 的相关系数为直线l 的斜率
C .x 和y 的相关系数在0到1之间
D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
3. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i
=1,2,…,n ),用最小二乘法建立的回归方程为y ^
=0.85x -85.71,则下列结论中不正确...的是
( )
A .y 与x 具有正的线性相关关系
B .回归直线过样本点的中心(x ,y )
C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg
D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg
4. 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
计算可得χ2=
110×(40×30-20×20)60×50×60×50
≈7.8.
附表:
参照附表,得到的正确结论是
)
A .有99%以上的把握认为“爱好该项运动与性别有关”
B .有99%以上的把握认为“爱好该项运动与性别无关”
C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5. (2013·大连模拟)某产品的广告费用x 与销售额y 的统计数据如下表:
根据上表可得回归直线方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为
( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
6. 以下四个命题,其中正确的序号是________.
①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;
③在回归直线方程y ^
=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^
平均增加0.2个单位; ④对分类变量X 与Y ,它们的随机变量χ2来说,χ2越小,“X 与Y 有关系”的把握程度越大. 7. 已知回归方程y ^
=4.4x +838.19,则可估计x 与y 的增长速度之比约为________.
8. 某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身
高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
9. 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂
生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂: 乙厂:
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?
10.(2013·重庆)从某居民区随机抽取i )与月储蓄y i (单位:千元)的数
据资料,算得∑i =1
10
x i =80,∑i =1
10
y i =20,∑i =1
10
x i y i =184,∑i =1
10
x 2i =720.
(1)求家庭的月储蓄y ^ 对月收入x 的回归直线方程y ^ =b ^ x +a ^
; (2)判断变量x 与y 之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:回归直线方程y ^
=b ^
x +a ^
中,b ^
=
∑i =1
n
x i y i -n x y
∑i =1
n
x 2i -n x
2
,a ^ =y -b ^
x ,其中x ,y 为样本平均值.
C 组
1. 下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③回归方程y ^
=b ^
x +a ^ 必过(x ,y );
④有一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系. 其中错误的个数是
( )
A .0
B .1
C .2
D .3
2. (2013·福建)已知x 与y 之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是
( )
A.b ^
>b ′,a ^
>a ′ B.b ^
>b ′,a ^