1、样本是总体中:D
A、任意一部分
B、典型部分
C、有意义的部分
D、有代表性的部分
E、有价值的部分
2、参数是指:C
A、参与个体数
B、研究个体数
C、总体的统计指标
D、样本的总和
E、样本的统计指标
3、抽样的目的是:E
A、研究样本统计量
B、研究总体统计量
C、研究典型案例
D、研究误差
E、样本推断总体参数
4、脉搏数(次/分)是: B
A、观察单位
B、数值变量
C、名义变量 D.等级变量 E.研究个体
5、疗效是: D
A、观察单位
B、数值变量
C、名义变量
D、等级变量
E、研究个体
6、抽签的方法属于 D
A分层抽样B系统抽样C整群抽样D单纯随机抽样 E二级抽样
7、统计工作的步骤正确的是 C
A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断
C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料
E搜集资料、整理资料、分析资料、进行推断
8、实验设计中要求严格遵守四个基本原则,其目的是为了:D
A便于统计处理 B严格控制随机误差的影响
C便于进行试验 D减少和抵消非实验因素的干扰 E以上都不对
9、对照组不给予任何处理,属 E
A、相互对照
B、标准对照
C、实验对照
D、自身对照
E、空白对照
10、统计学常将P≤0.05或P≤0.01的事件称 D
A、必然事件
B、不可能事件
C、随机事件
D、小概率事件
E、偶然事件
11.医学统计的研究内容是 E
A.研究样本 B.研究个体C.研究变量之间的相关关系 D.研究总体
E.研究资料或信息的收集.整理和分析
12.统计中所说的总体是指:A
A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体
C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体
13.概率P=0,则表示 B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小
D某事件发生的可能性很大 E以上均不对14.总体应该由 D
A.研究对象组成B.研究变量组成C.研究目的而定 D.同质个体组成E.个体组成
15. 在统计学中,参数的含义是 D
A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量
16.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于 A
A.计数资料B.计量资料C.总体D.个体E.样本
17.统计学中的小概率事件,下面说法正确的是:B A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件
C.发生概率小于0.1的事件 D.发生概率小于0.001的事件E.发生概率小于0.1的事件
18、统计上所说的样本是指:D
A、按照研究者要求抽取总体中有意义的部分
B、随意抽取总体中任意部分
C、有意识的抽取总体中有典型部分
D、按照随机原则抽取总体中有代表性部分
E、总体中的每一个个体
19、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 B
A、计算
B、计数
C、计量
D、等级
E、都对
20、红细胞数(1012L-1)是:B
A、观察单位
B、数值变量
C、名义变量
D、等级变量
E、研究个体
21、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:C
A.所有成年男子B.该市所有成年男子C.该市所有健康成年男子
D.120名该市成年男子E.120名该市健康成年男子
22、某地区抽样调查1000名成年人的血压值,此资料属于:
A、集中型资料
B、数值变量资料
C、无序分类资料
D、有序分类资料
E、离散型资料
23、抽样调查的目的是:
A、研究样本统计量
B、研究总体统计量
C、研究典型案例
D、研究误差
E、样本推断总体参数
24、测量身高、体重等指标的原始资料叫:B
A计数资料B计量资料C等级资料D 分类资料 E有序分类资料
25、某种新疗法治疗某病患者41人,治疗结果如下:
治疗结果治愈显效好转恶化死亡
治疗人数8 236 3
1
该资料的类型是: D
A计数资料 B计量资料 C无序分类资料D有序分类资料E数值变量资料
26、样本是总体的 C
A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分
27、将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C
A统计设计B收集资料C整理资料 D分析资料E以上均不对
28、良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B
A抽样误差 B系统误差C随机误差 D责任事故E以上都不对
29、以下何者不是实验设计应遵循的原则 D
A对照的原则B随机原则C重复原则 D交叉的原则E以上都不对
数值变量资料的统计描述
1、编制频数表的步骤如下,除了:E
A、找全距
B、定组距
C、分组段
D、划记
E、制分布图
2.描述计量资料的主要统计指标是:A
A.平均数
B.相对数
C.t值
D.标准误
E.概率
3、一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:D
A、身高变异大于体重
B、身高变异小于体重
C、身高变异等于体重
D、无法比较
E、身高变异不等于体重
4、一组变量值,其大小分别为10,12,9,7,11,39,其中位数是:C
A.9
B.7
C.10.5
D.11E、12
5、描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是B
A.极差
B.标准差
C.均数
D.变异系数E、标准误
6、随机抽取某市12名男孩,测得其体重均值为3.2公斤,标准差为0.5公斤,则总体均数95%可信区间的公式是:C
A、3.2±t0.05.11 ×0.5
B、3.2 ±t0.05.12 ×0.5/
C、 3.2 ±t0.05.11 ×0.5/
D、
3.2±1.96×0.5/ E、3.2 ±2.58×0.5/
7.X=30,∑X2=190, ∑5. 某组资料共5例, 则均数和标准差分别是 D
A.6 和 1.29
B.6.33 和 2.5
C.38 和
6.78 D.6 和 1.58 E 6和2.5
8.以下指标中那一项可用来描述计量资料离散程度。D A.算术均数B.几何均数C.中位数D.极差 E.第50百分位数
9.偏态分布资料宜用下面那一项描述其分布的集中趋势。C
A.算术均数B.标准差C.中位数D.四分位数间距E.方差
10.下面那一项可用于比较身高和体重的变异度 C A.方差B.标准差C.变异系数D.全距E.四分位数间距
11.正态曲线下.横轴上,从均数到+∞的面积为。C A.97.5% B.95%C.50% D.5% E.不能确定
12、横轴上,标准正态曲线下从0到1.96的面积为: D
A.95%
B.45%
C.97.5%
D.47.5%
E.49.5%
13、一份考卷有3个问题,每个问题1分,班级中20%得3分,60%得2分,10%得1分,10%得0分,则平均得分C
A、1.5
B、1.9
C、2.1
D、2
E、不知道班级中有多少人,所以不能算出平均得分
14.下面那一项分布的资料,均数等于中位数。E
A.对数正态B.左偏态 C.右偏态 D.偏态E.正态
15.对于正态分布资料的95%正常值范围,宜选用(B )
A. ±2.58s
B. ±1.96s
C. ±2.58
D. ±1.96
E. ±1.645
16.做频数表时,以组距为5,下列哪项组段划分正确 A A.0一,5一,10一,…B.0—5,5一10,10一,…
C.一5,一10,一15,…D.0—4,5—9,10一,…E.5一,7一,9一,…
17.均数与标准差之间的关系是 A
A.标准差越小,均数代表性越大B.标准差越小,均数代表性越小
C.均数越大,标准差越小D.均数越大,标准差越大 E.标准差越大,均数代表性越大
18、要评价某市一名8岁男孩的身高是否偏高或偏矮,应选用的统计方法是:A
A.用该市8岁男孩身高的95%或99%正常值范围来评价B.作身高差别的假设检验来评价 C.用身高均数的95%或99%可信区间来评价
D.不能作评价E以上都不对
19、来自同一总体中的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?( A ) A.Sx B.S C.x
D.CV E S2
20、标准差越大的意义,下列认识中错误的是:A
A、观察个体之间变异越大
B、观察个体之间变异越小
C、样本的抽样误差可能越大
D、样本对总体的代表性可能越差
E、以上均不对
21、离散指标如下,除了:E
A、全距
B、标准差
C、变异系数
D、四分位数间距
E、中位数
22、常用平均数如下,除了:E
A、均数
B、几何均数
C、中位数
D、众数
E、全距
※:集中趋势指标:算术平均数、几何平均数、中位数和百分位数
离散趋势指标:全距、方差、标准差、四分位间距、变异系数
23.表示血清学滴度资料平均水平最常计算 B
A算术均数 B几何均数 C中位数 D全距 E率
※:算术均数:正态分布或近似正态分布;例:大多数正常生物的生理、生化指标(血红蛋白、白细胞数等)
几何均数:非对称分布,按从小到大排列,数据呈倍数关系或近似倍数关系;如:抗体的平均滴度、药物的平均效价
中位数:资料呈明显偏态分布、一端或两端无确定数值、资料的分布情况不清楚;如:某些传染病或食物中毒的潜伏期、人体的某些特殊测定指标(如发汞、尿铅等)
全距:表示一组资料的离散程度
24.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C
A X
B G
C M
D S
E CV
※:X:正态分布或近似正态分布
G:非正态分布、按大小排列后,各观察值呈倍数关系M:明显的偏态分布、资料一端或两端无确定值、资料情况分布不清楚
S与CV均为离散趋势指标
25、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),
问该食物中毒的平均潜伏期为多少小时:C A、5 B、5.5 C、6D、lO E、12
※:按大小排列后为:30 24+ 16 10 6 3 2 2 2,
取第5位的值,即为 6
26、标准差越大的意义,下列认识中错误的是:B
A、观察个体之间变异越大
B、观察个体之间变异
越小
C、样本的抽样误差可能越大
D、样本对总体的代表
性可能越差 E、以上均不对
27、均数与标准差适用于:A
A、正态分布的资料
B、偏态分布
C、正偏态分布
D、
负偏态分布 E、不对称分布
28.各观察值均加(或减)同一数后:B
A均数不变,标准差改变 B均数改变,标准差不变 C
两者均不变 D两者均改变 E以上均不对
※:均值加(或减)同一数,标准差不改变
29.统计学上通常认为P小于等于多少的事件,在一次观
察中不会发生:
A、0.01
B、O.05
C、0.1
D、0.5
E、
1.O
※:小概率事件:P≤0.05或P≤0.01的随机事件,通常
称作小概率事件,即发生的可能性很小,统计学上认为一
次抽样是不可能发生的。
30.比较12岁男孩和18岁男子身高变异程度大小,宜采
用的指标是:D
A全距 B标准差 C方差D变异系数E极
差
※:变异程度的大小应选择变异系数。
31.下列哪个公式可用于估计医学95%正常值范围 A A X±1.96S B X±1.96SX C
μ±1.96SX D μ±t0.05,υSX E X±2.58S
※:值的范围,并非区间范围,区间范围为:X±1.96Sx 32.标准差越大的意义,下列认识中错误的是 B
A观察个体之间变异越大B观察个体之间变异越小
C样本的抽样误差可能越大
D样本对总体的代表性可能越差 E以上均不对
33.正态分布是以 E
A t值为中心的频数分布B参数为中心的频数
分布 C变量为中心的频数分布
D观察例数为中心的频数分布 E均数
为中心的频数分布
34.确定正常人的某项指标的正常范围时,调查对象是 B
A从未患过病的人B排除影响研究指标的疾病和因
素的人
C只患过轻微疾病,但不影响被研究指标的人 D排除了
患过某病或接触过某因素的人 E以上都不是
35.均数与标准差之间的关系是 E
A标准差越大,均数代表性越大 B标准差越小,均数代表性越小
C均数越大,标准差越小D均数越大,标准差越大 E 标准差越小,均数代表性越大
※:标准差越小,均数的代表性越好!
数值变量资料的统计推断
1.抽样研究中,S为定值,若逐渐增大样本含量,则样本:A
A.标准误减小B.标准误增大C.标准误不改变D.标准误的变化与样本含量无关E.以上都对2、12名妇女分别用两种测量肺活量的仪器测最大呼气率(l/min),比较两种方法检测结果有无差别,可进行:D A、成组设计u检验B、成组设计t检验 C、配对设计u 检验 D、配对设计t检验E、X2检验
3.比较两种药物疗效时,对于下列哪项可作单侧检验( )。C
A.已知A药与B药均有效 B.不知A药好还是B药好
C.已知A药不会优于B药
D.不知A药与B药是否均有效
E.已知A药与B药均无效
4.两个大样本均数比较的u检验, |u|=1.98,则统计结论是 D
A.P <0.05
B.P <0.01
C.P >0.05
D.P =0.05E、P <0.005
5.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验 C
A、t值符号相反,结论相反
B、t值符号相同,结论相同
C、t值符号相反,但结论相同
D、t值符号相同,但大小不同,结论相反
E、t 值符号与结论无关
6.下面那一项小,表示用该样本均数估计总体均数的可靠性大。C
A.CV B.S C.S D.R E.四分位数间距
7.两个小样本数值变量资料比较的假设,首先应考虑。E A.t检验B.u检验C.秩和检验D.t检验和秩和检验均可 E.资料符合t检验还是秩和检验8.抽样误差是指 D
A.总体参数与总体参数间的差异B.个体值与样本统计量间的差异
C.总体参数间的差异D.样本统计量与总体统计量间的差异E.以上都不对
9、统计推断的内容: D
A.是用样本指标估计相应的总体指标
B.是检验统计上的―假设‖
C.a、b均不是
D.a、b均是E、以上都错
10、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:C
A.两样本均数差别越大
B.两总体均数差别越大
C.越有理由认为两总体均数不同
D.越有理由认为两样本均数不同
E.样本均数与总体均数不同
11. 表示均数的抽样误差大小的统计指标是 C
A.标准差
B.方差
C.均数标准误
D.变异系数
E.极差
12、反映均数抽样误差的统计指标是:
A、标准差
B、标准误
C、变异系数
D、全距
E、方差
13、当自由度v→∞时,tO.05值:C
A、≠l.96
B、<1.96
C、=1.96
D、>1.96
E、=2.58
14、α=0.05, t>t0.05,ν,统计上可认为(D )
A、两总体均数差别无显著意义
B、两样本均数差别无显著意义
C、两总体均数差别有显著意义
D、两样本均数差别有显著意义
E、以上均不对
15、作单侧检验的前提是:D
A、已知新药优于旧药
B、已知新药差于旧药
C、不知新药好还是旧药好
D、已知新药不比旧药差
E、已知新旧药差不多好
16、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用:A A、配对设计t检验 B、成组设计两样本均数比较的t检验
C、成组设计两样本几何均数比较t检验
D、两样本均数比较u检验
E、x2检验
17、对两组大样本率的比较,可选用:E
A、u检验
B、x2检验
C、四格表确切计算概率法
D、以上都不对
E、A,B都可以
18、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是:B
A、两数值接近
B、两S2数值接近
C、两相差较大
D、两S2相差较大
E、以上都不对
19、抽样调查男生和女生各100名,并分别统计出身高与体重均数,其中同性别的身高与体重均数不可作假设检验,是因为:A
A、资料不具备可比性
B、身高资料不呈正态分布
C、体重资料不呈正态分布
D、样本含量较小20、由10对(20个)数据组成的资料作配对t检验,其自由度等于:C
A、10
B、20
C、9
D、18
21、对两样本均数作t检验,n1=20,n2=20,其自由度等
于:C
A、19
B、20
C、38
D、40
E、39
22.从一个总体中抽取样本,产生抽样误差的原因是 A A总体中个体之间存在变异 B抽样未遵循随机化原则 C被抽取的个体不同质
D组成样本的个体较少 E分组不合理
23.两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则 E
A 说明两样本均数差别愈大
B 说明两总体均数差别愈大
C 说明样本均数与总体均数差别愈大
D 愈有理由认为两样本均数不同
E 愈有理由认为两总体均数不同
※:
24.由10对(20个)数据组成的资料作配对t检验,其自由度等于C
A 10
B 20
C 9
D 18
E 19
25.t检验结果,P>0.05,可以认为 B
A两总体均数差别无显著性 B两样本均数差别无显著性C两总体均数差别有显著性
D两样本均数差别有显著性 E以上都不对
※:
26.下列哪项不是t检验的注意事项 D
A资料应具备可比性B下结论切忌绝对化C根据资料选择适宜的检验方法
D分母不宜过小 E资料应服从正态分布27.在一项抽样研究中,当样本量逐渐增大时 B
A 标准差逐渐减少
B 标准误逐渐减少
C 标准差逐渐增大
D 标准误逐渐增大
E 标准差和标准误都逐渐增大28.t<t0.05(v),统计上可认为 C
A两总体均数,差别无显著性B两总体均数,差别有显著性
C两样本均数,差别无显著性 D两样本均数,差别有显著性 E以上均不是
※:t<t0.05(v),则P>0.05 两样本均数,差别无显著性,无统计学意义!
29.两样本均数的t检验中,检验假设(H0)是 B
A μ1≠μ2Bμ1=μ2C X1≠X2 D X1=X2 E X1=X2
30.同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A
A. Sx B .S C .x D .CV E S2 ※:标准误:一、用来衡量抽样误差大小,标准误越小,样本均数与总体均数越接近即样本均数的可信度越高;
二、结合标准正态分布与t分布曲线下的面积规律,估计总体均数的置信区间;三、用于假设检验。31.标准差与标准误的关系是:C
A两者相等 B后者大于前者C前者大于后者D 不一定 E 随样本例数不同
※:公式:Sx=S/n
32.在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内C
A均数加减1.96倍的标准差 B均数加减2.58倍的标准差
C均数加减1.96倍的标准误 D均数加减2.58倍的标准误 E以上都不对
※:区间范围,并非值的范围,值的范围为:均数加减1.96倍的标准差!X±1.96S
33.同一自由度下,P值增大 C
A t值不变
B t值增大
C t值减小
D t值与P值相等
E t值增大或减小
※:单侧u<1.645,双侧u<1.96,则P>0.05
单侧t<t(0.05,v)双侧t<t(0.05/2,v)则P>0.05 差异无统计学意义
34.两样本作均数差别的t检验,要求资料分布近似正态,还要求 D
A两样本均数相近,方差相等 B两样本均数相近
C两样本方差相等D两样本总体方差相等 E两样本例数相等
35、表示均数的抽样误差大小的统计指标是: C
A标准差B方差C均数标准误D变异系数E、全距
36、统计推断的内容 D
A、是用样本指标估计相应的总体指标
B、是检验统计上的―假设‖
C、a 、b 均不是
D、a 、b 均是 E. 以上都错
37、下面()是错误的: B
A.标准误大,说明用样本均数代表总体均数可靠性大B.标准误小,说明用样本均数代表总体均数可靠性大C.标准差大,标准误也大
D.样本含量大,标准误则小E.标准误常用来估计总计均数可信区间
38、两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则:E
A、说明两样本均数差别愈大
B、说明两总体均数差别愈大
C、说明样本均数与总体均数差别愈大 D愈有理由认为两样本均数不同 E、愈有理由认为两总体均数不同
39、要评价某市一名8岁男孩的身高是否偏高或偏矮,应
选用的统计方法是:A
A.用该市8岁男孩身高的95%或99%正常值范围来评价B.作身高差别的假设检验来评价
C.用身高均数的95%或99%可信区间来评 D.不能作评价E以上都不对
40、造成均数抽样误差的原因是 A
A.个体差异B.群体差异C.样本均数不同 D.总体均数不同E以上都不对
41、同一自由度下,P值增大 C
A t值不变
B t值增大
C t值减小
D t值与P 值相等
E t值增大或减小
42、确定假设检验的检验水准后,同一资料 B
A.单侧t检验显著,则双侧t检验必然显著
B.双侧t检验显著,则单侧t检验必然显著
C.双侧t检验不显著,则单侧t检验也不显著
D.单、双t检验结果没有联系E以上都不对
43、两样本均数比较时,分别取以下检验水准,以所犯第二类错误最小A
A、α=0.05
B、α=0.01
C、α=0.10
D、α=0.02
E、α=0.15
分类变量资料的统计描述与推断
1.描述分类变量资料的主要统计指标是:B
A.平均数
B.相对数
C.变异系数
D.相关系数
E.百分位数
2.男性人口数/女性人口数,这一指标为:C
A、率
B、构成比
C、相对比
D、动态数列
E、不是相对数
3、构成比有个重要特点是( A )。
A、百分比总和必等于100%
B、百分比总和必小于100%
C、百分比总和必大于100%
D、以上均不对
E、以上都错
4.标化后的总死亡率( A )。
A.仅仅作为比较的基础,它反映了一种相对水平
B.它反映了实际水平
C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对
5.关于相对数,下列哪一个说法是错误的 D
A.相对数是两个有联系的指标之比
B.常用相对数包括相对比,率与构成比
C.计算相对数时要求分母要足够大
D.率与构成比虽然意义不同,但性质相近, 经常可以混用
E.计算相对数时不要求分母要足够大
6. 随机选取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为_____C_____ A.35% B.16.7% C.18.3% D.无法计算 E、30%
7. 对两地的结核病死亡率比较时作率的标准化,其目的是:D
A.为了能更好地反映人群实际死亡水平
B.消除两地总人数不同的影响
C.消除各年龄组死亡率不同的影响
D.消除两地人口年龄构成不同的影响 E、以上都不对
8.四格表资料的卡方检验时无需校正,应满足的条件是( D)。
A.总例数大于40
B.理论数大于5
C.实际数均大于l
D.总例数大于40且理论数均大于或等于5
E.总例数小于40
9.计算相对数的目的是 C
A. 为了进行显著性检验B.为了表示绝对水平C.为了便于比较D.为了表示实际水平E.为了表示相对水平
10.相对数使用时要注意以下几点,其中哪一项是不正确的 B
A.比较时应做假设检验B.离散程度和变异程度C.不要把构成比当率分析D.二者之间的可比性E.分母不宜过小
11、四个样本率作比较,χ2>χ20.01(3),可认为:A
A、各总体率不同或不全相同
B、各总体率均不相同
C、各样本率均不相同
D、各样本率不同或不全相同 E. 各总体率和各样本率均不同或不全相同
12、检验适用于比较:D
A、两个率差别的显著性
B、多个率差别的显著性
C、两个或多个构成比差别的显著性
D、以上都可以
E、以上都错
13、某研究者对50份痰液标本,每份分别接种在甲乙培养基上,观察结核杆菌的生长情况并想比较两种培养基的培养效果是否一致,资料见下表。问应该选择的统计方法是:C
A.确切概率法
B.四格表资料的检验
C.配对计数资料的检验
D.行乘列表资料的检验
E.配对计量资料的t检验
甲培养基乙培养基合计
﹢ 23 12 35
﹣ 7 8 15 合
计 30 20 50
14、从统计学的角度看,下列指标属于绝对数的是D
A、甲区的急性传染病人数为乙区的1.25倍
B、甲区某年急性传染病的发病率为382/10万
C、甲区占某市急性传染病的比重为18%
D、某区某男身高168厘米
E、甲区某年急性传染病的死亡率为52.2/10万
15.构成比的重要特点是各组成部分的百分比之和 C A一定大于1B一定小于l C一定等于1D一定等于0E随资料而异
16.计算相对数的目的是C
A为了进行显著性检验 B为了表示绝对水平
C为了便于比较 D为了表示实际水平E 为了表示相对水平
※:相对比=甲指标计数/乙指标计数*100%
17.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是B
A率 B构成比C相对比D绝对数E标化率18.四个样本率作比较,x2>x2 0.01(3),可以认为 A
A各总体率不同或不全相同B各总体率均不相同C 各样本率均不相同
D各样本率不同或不全相同E样本率与总体率均不相同
※:P2<0.01<0.05,则有统计学意义,各总体率存在差异。
19.卡方检验中自由度的计算公式是 D
A行数×列数B n-1C N-k D(行数-1)(列数-1) E行数×列数-1
20.作四格表卡方检验,当N>40,且__________时,应该使用校正公式 E
A T<5
B T>5
C T<1
D T>5
E 1 ※:在样本例数n较小或1 21.若X2≥X2 0.05(ν)则 A A P≤0.05 B P≥0.05 C P<0.05 D P=0.05 E P>0.05 22.相对数使用时要注意以下几点,其中哪一项是不正确的 B A比较时应做假设检验 B 注意离散程度的影响 C不要把构成比当率分析 D 二者之间的可比性 E 分母不宜过小 ※:1.计算相对数的分母不宜过小;2.分析时不能以构成比代替率;3.正确计算平均率;4.相互比较时应注意可比性;5.样本率或构成比的比较应进行假设检验 23.反映某一事件发生强度的指标应选用 D A 构成比 B 相对比 C 绝对数 D 率E变异系数 ※:构成比:各组成部分构成比的总和为100%或1; 相对比:方便两个指标的比较 率:说明某现象发生的频率或强度 24.反映事物内部组成部分的比重大小应选用 A A构成比 B 相对比C绝对数D率E变异系数 25.计算标化率的目的是 D A使大的率变小, B使小的率变大 C使率能更好的代表实际水平 D消除资料内部构成不同的影响,使率具有可比性 E 起加权平均的作用 26.在两样本率比较的X2检验中,无效假设(H0)的正确表达应为 C A μ1≠μ2 B μ1=μ2 c π1=π2 D π1≠π2 E B=C ※:卡方检验的H0假设应用π,u t q等检验均用μ 率的比较用π,均数的比较用μ 27.四格表中四个格子基本数字是 D A两个样本率的分子和分母B两个构成比的分子和分母 C两对实测数和理论数D两对实测阳性绝对数和阴性绝对数 E两对理论数 28、相对数使用时应注意以下各点,除了:E A、分母不宜过小 B、不要把构成比当率分析 C、可比性 D、比较时应作假设检验 E、平均水平与变异程度 29、某种职业病检出率为:D A、100/100ρ100/100 B、检出病人数/在册人数ρ实有病人数/受检人数100/100ρ C、实存病人数/在册人数 100/100 D、检出人数/受检人数 E、以上全不对ρ 30、说明一个地区死亡水平的指标主要是:D A.病死率B.死因构成比C.死因顺位D.死亡率E.上述都不对 31、相对数中的构成指标是说明: B A.反映事物发生的严重程度B.事物内部构成比重C.两个有关指标的比 D.动态变化 E.以上都不是32、X2四格表中四个格子基本数字是:C A.两个样本率的分子与分母 B.两个构成比的分子与分母 C.两对实测阳性绝对数和阴性绝对数 D.两对实测数和理论数 E.以上都不对 33、四格表X2 检验的自由度是___。B A.0B.1 C.2D.4 E.5 34、某地某年肝炎病人数占同年传染病人数的10.1%,这是一种什么指标:B A.时点患病率B.构成比C.发病率D.集中趋势E.相对比 35、一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列情况:A A.该病患病率将增加 B.该病患病率将减少 C.该病发病率将增加 D.该病发病率将减少E.该病的生存率增加 36、四个样本率作比较,x2>x20.01(3),可以认为:A A、各总体率不同或不全相同 B、各总体率均不相同 C、各样本率均不相同 D、各样本率不同或不全相同 E、样本率与总体率均不相同 37、计算标化率的目的是:D A、使大的率变小, B、使小的率变大 C、使率能更好的代表实际水平 D、消除资料内部构成不同的影响,使率具有可比性 E、起加权平均的作用 38、出生率习惯上用:B A.百分率 B.千分率 C.万分率 D.十万分率 E无所谓 39、百分率作比较,有1个理论数小于5,大于1,其它都大于5,C A只能作校正卡方检验B不能作卡方检验 C作卡方检验不必校正 D必须先作合理的合并 E可作四格表精确概率法40、四格表卡方检验中,X2 A两样本率不同 B两样本率相同C两总体率不同 D两总体率相同 E样本率与总体率不同 统计表与统计图 1.为表示某地近20年来婴儿死亡率的变化情况,宜绘制(A)。 A.普通线图 B.直方图 C.直条图 D.散点图 E.统计地图 2.某医院收集了近期门诊病人的病种构成情况资料,宜绘制:B A.直条图 B.圆图 C.线图 D.直方图 E.半对数线图 3. 图示某地某年流行性乙型脑炎患者的年龄分布,宜绘制: D A.条图 B.百分条图 C.圆图 D.直方图 E.线图 4. 比较1995年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是 C A.直方图 B.半对数图 C.条图 D.线图 E.百分图 5.比较某地1990~1997年肝炎发病率宜绘制 C A直条图 B构成图C普通线图D直方图E统计地图 6.关于统计资料的列表原则,错误的是 B A.横标目是研究对象,列在表的左侧;纵题目是分析指标,列在表的右侧 B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用―*‖标出,写在表的下面 E.标题在表的上端,简要说明表的内容 7.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用 A A直条图 B 线图 C 直方图 D 圆形图 E 百分条图 8.描述某地某地210名健康成人发汞含量的分布,宜绘制 B A直条图 B直方图C线图D百分条图 E 散点图 9、对某市七个区的SO2年平均浓度作比较,应绘制()图:B A.构成图B.直条图C.直方图D.线图E.曲线图 10、要反映某一城市连续五年甲肝发病率的变化情况,应选用C A、直条图 B、直方图 C、普通线图 D、百分条图 E、圆形构成图 全科医生培训统计学试题 l、统计中所说的总体是指:A A、据研究目的确定的同质的研究对象的全体。 B、随意想象的研究对象的全体。 C、根据地区划分的研究对象的全体。 D、根据时间划分的研究对象的全体。 E、根据人群划分的研究对象的全体。 2、比较某地1990~1997年肝炎发病率宜绘制:C A、直条图 B、构成图 C、普通线图 D、直 方图E、统计地图 3、将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A、统计设计 B、收集资料 C、整理资料 D、分析资料 E、以上均不对 4、从一个总体中抽取样本,产生抽样误差的原因是:A A、总体中个体之间存在变异 B、抽样未遵循随机化原则 C、被抽取的个体不同质 D、组成样本的个体较少 E、分组不合理 5、概率P=0,则表示:A A、某事件必然不发生 B、某事件必然发生 C、某事件发生的可能性很小 D、某事件发生的可能性很大 E、以上均不对 6、某地区抽样调查1000名成年人的血压值并制作成频数表,此资料属于: A A、计量资料 B、计数资料 C、等级资料 D、半定量资料 E、离散型资料 7、某计量资料的分布性质未明,要计算集中趋势指标,下列__C______适宜 A、X B、G C、M D、S E、CV 8、构成比的重要特点是各组成部分的百分比之和_C________ A、一定大于1 B、一定小于l C、一定等于1 D、一定等于0 E、随资料而异 9、各观察值均加(或减)同一数后:B A、均数不变,标准差改变 B、均数改变,标准差不变 C、两者均不变 D、两者均改变 E、以上均不对 10、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为_____C____(小时) A、5 B、5.5 C、6 D、lO E、12 11、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A、全距 B.标准差 C.方差 D.变异系数E、极差 12、下列关于统计表的要求,叙述错误的是:E A、标题位于表的上方中央 B、不宜有竖线及斜线 C、备注不必列入表内 D、线条要求三线式或四线式 E、无数字时可以不填 13、统计学上通常认为P<____B______的事件,在一次观察中不会发生 A、0.01 B、O.05 C、0.1 D、0.5 E、1.O 14、表示血清学滴度资料平均水平最常计算:B A、算术均数 B、几何均数 C、中位数 D、全距 E、率 15、下列哪个公式可用于估计医学正常值范围(95%): A A、X±1.96S B、X±1.96SX C、μ±1.96SX D、μ±t0.05,υSX E、X±2.58S 16、两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则:E A、说明两样本均数差别愈大 B、说明两总体均数差别愈大 C、说明样本均数与总体均数差别愈大D愈有理由认为两样本均数不同 E、愈有理由认为两总体均数不同 17、标准差越大的意义,下列认识中错误的是:B A、观察个体之间变异越大 B、观察个体之间变异越小 C、样本的抽样误差可能越大 D、样本对总体的代表性可能越差 E、以上均不对 18、计算相对数的目的是:C A. 为了进行显著性检验 B.为了表示绝对水平 C.为了便于比较D.为了表示实际水平E.为了表示相对水平 19、均数与标准差适用于:C A.正偏态分布B.负偏态分布C.正态分布D.偏态分布E.不对称分布 20、样本是总体的:C A.有价值的部分B.有意义的部分C.有代表性的部分 D.任意一部分E.典型部分 21、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是:B A、率 B、构成比 C、相对比 D、绝对数 E、标化率 22、四个样本率作比较,x2>x20.01(3),可以认为:A A、各总体率不同或不全相同 B、各总体率均不相同 C、各样本率均不相同 D、各样本率不同或不全相同 E、样本率与总体率均不相同 23、由10对(20个)数据组成的资料作配对t检验,其自由度等于:C A、10 B、20 C、9 D、18 E、19 24、对两样本均数作t检验,n1=20,n2=20,其自由度等于:C A、19 B、20 C、38 D、39 E、40 25、下列哪项不是t检验的注意事项:D A、资料应具备可比性 B、下结论切忌绝对化 C、根据资料选择适宜的检验方法, D、分母不宜过小 E、资料应服从正态分布 26、在一项抽样研究中,当样本量逐渐增大时:B A.标准差逐渐减少B.标准误逐渐减少 C.标准差逐渐增大 D.标准误逐渐增大E.标准差和标准误都逐渐增大 27、比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用:A A、条图 B、线图 C、直方图 D、圆形图 E、直条构成图 28、描述某地某地210名健康成人发汞含量的分布,宜绘制:B A、条图 B、直方图 C、线图 D、百分条图 E、统计地图 29、卡方检验中自由度的计算公式是:D A、行数×列数 B、 n-1 C、 N-k D、(行数-1)(列数-1) E、行数×列数-1 30、作四格表卡方检验,当N>40,且_____E_____时,应该使用校正公式。 A、T<5 B、T>5 C、T D、T<5 E、1 31、若X2≥X2 0.05(ν)则:A A.P≤0.05B.P≥0.05C.P<0.05D.P=0.05E.P>0.05 32、正态分布曲线下,横轴上从均数μ到μ+l.96σ的面积为 D A.97.5%B.95% C.48.8%D.47.5% E.45% 33、某医生在进行科室病例资料统计时,拟用算术平均数表示平均水平,应当选用什么样的资料: C A.个体差异较小的变量值B.个体差异较大的变量值 C.性质相同的变量值D.性质不同的变量值E.差异相同的变量值 34、变异系数是表示资料的:D A.变异数B.对称分布C.集中趋势D.相对变异 E.平均水平 35、确定正常人的某项指标的正常范围时,调查对象是:B A.从未患过病的人B.排除影响研究指标的疾病和因素的人 C.只患过轻微疾病,但不影响被研究指标的人D.排除了患过某病或接触过某因素的人E.以上都不是 36、下列是有关参考值范围的说法,其中正确的是 E A.参考值范围应根据正常人范围的95%来制定 B.如果随机测量某人的某项指标,其值在正常人范围的 95%之内,那么应认为此人的此项指标正常 C.如果某项指标超出了参考值范围,那么其应为不正常 D.求正态资料的参考值范围,精确度越高越好E.所谓的正常和健康都是相对的,在正常人或健康人身上都存在着某种程度的病理状态 37、均数与标准差之间的关系是:E A.标准差越大,均数代表性越大 B.标准差越小,均数代表性越小 C.均数越大,标准差越小 D.均数越大,标准差越大 E.标准差越小,均数代表性越大 38、18.关于统计资料的列表原则,错误的是 B A.横标目是研究对象,列在表的右侧;纵题目是分析指标,列在表的左侧 B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用―*‖标出,写在表的下面 E.标题在表的上端,简要说明表的内容 39、说明两个有关联的同类指标的比即为 B A.率B.相对比C.构成比 D.频率 E.频数 40、抽样误差的定义为:C A.个体值与样本统计量间的差异 B.样本统计量之间的差异 C.样本统计量与总体参数间的差异 D.总体参数间的差异 E.个体值与样本统计量间的差异 41、在统计学中,参数的含义是:D A.变量 B.参与研究的数目C.研究样本的统计指标 D.总体的统计指标E.与统计研究有关的变量42、相对数使用时要注意以下几点,其中哪一项是不正确的:B A.比较时应做假设检验B.注意离散程度的影响 C.不要把构成比当率分析D.二者之间的可比性E.分母不宜过小 43、用变异系数比较变异程度适用于:c A.相同指标,均数相差较大B.不同指标,均数相差 较小 C.不同指标,均数相差较大D.相同指标,标准差相差较大 E.以上均不是 44、正态分布是以:E A.t值为中心的频数分布B.参数为中心的频数分布 C.变量为中心的频数分布D.观察例数为中心的频数分布 E.均数为中心的频数分布 45、反映某一事件发生强度的指标应选用:D A、构成比 B、相对比 C、绝对数 D、率 E、变异系数 46、t<t0.05(v),统计上可认为:C A、两总体均数,差别无显著性 B、两总体均数,差别有显著性 C、两样本均数,差别无显著性 D、两样本均数,差别有显著性 E、以上均不是 47、反映事物内部组成部分的比重大小应选用:A A、构成比 B、相对比 C、绝对数 D、率 E、变异系数 48、计算标化率的目的是:D A、使大的率变小, B、使小的率变大 C、使率能更好的代表实际水平 D、消除资料内部构成不同的影响,使率具有可比性 E、起加权平均的作用 49、两样本均数的t检验中,检验假设(H0)是:B A、μ1≠μ2 B、μ1=μ2 C、X1≠X2 D、X1=X2 E、X1=X2 50、在两样本率比较的X2检验中,无效假设(H0)的正确表达应为:C A、μ1≠μ2 B、μ1=μ2c、π1=π2D、π1≠π2E、B=C 三、单项选择题 1.统计学研究的指标具有什么特性( D ) (A)稳定性(B)可加性(C)正态性(D)变异性 2.为反映两种或两种以上疾病的病死率随时间推移的变化速度,应选用( C ) (A)普通线图(B)多边图(C)半对数线图(D)散点图 3.为比较两个同级、同类医院某年的治愈率。若各医院各科病人数的内部构成不同时,为避免产生假象,关键在于进行( C ) (A)分科比较(B)分病比较(C)率的标准化(D)率的检验 4.在进行成组设计资料的t检验前,要注意两个前提条件,一要考查各样本是否来自正态总体,二要( B )(A)核对数据(B)作方差齐性检验(C)求、s、(D)作变量代换 5.已知新方法的疗效不低于常规方法,为确定新疗法可 否取代常规方法,将两法进行平行对比观察后,应选择 ( A ) (A)单侧检验(B)双侧检验(C)χ2检验 (D)t检验 6.下列资料属于等级资料的是( D )。 A.白细胞计数B.住院天数 C.门急诊就诊人数 D.患者治疗结果评定(治愈、好转、有效、无效) E.患者年龄 7.比较身高和体重两组数据变异度大小宜采用( B )。 A.方差B.变异系数 C.标准差 D.极差 E.四分位数间距 8.正态曲线下、横轴上,从一∞到均数的面积为( B ) A.95%B.50%C.97.5% D.不能确定(与标准差的大小有关) E.99% 9.当样本量增大时,以下说法正确的是( C )。 A.标准差会变小 B.均数标准误会变大 C.均数标准误会变小 D.标准差会变大 E.均数标准误不变 10.完全随机设计、随机区组设计的自由度、SS各可分 解为几部分( A )。 A.3,2 B.4,2 C.3,3 D.2.2 E.4,3 1.收集资料的方法是:e A.收集各种报表 B.收集各种工作记录 C.进行专 题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:d A.调查资料、审核资料、整理资料 B.收集资料、审核 资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理 资料、分析资料 E.以上都对 3.在抽样研究中样本是:d A.总体中的一部分 B.总体中任意一部分 C.总体 中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部 分 4.计量资料、计数资料和等级资料的关系:是:c A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制: A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E. >20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是d : A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是:c A.从未患过病的人 B.健康达到了要求的人 C.排 除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 b E.排除了患过某病或接触过某因素的人 12.标准误:b A.与标准差呈反比 B.与标准差呈正比 C.与标 准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指:e A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示:d A.95%的正常值范围 B.95%的可信区间 C.99%的 正常值范围 D.99%的可信区间 E.以上都不对 15.构成比通常以下列哪项指标为比例基数a : A.100% B.1000? C.10000/万 D.100000/10万 E.视具体情况而定 16.一事物各构成比部分相对数之和应为:c A.大于1 B.小于1 C.等于1 D.不一定 E.以上都不对 16.一事物各构成比部分相对数之和应为:c A.大于1 B.小于1 C.等于1 D 、47.5% E 、不能确定 18. 进行统计分析的资料必须是( a ) A 、完整、准确、及时的 B 、随机取得的 C 、满足条件齐同的 D 、数量足够的 E 、以上都对 19.指出下列变量中哪一个指标为统计量a A.p B.σ C.μ D.π E.β 20.计算样本率的抽样误差适用公式为:a A. B. E.以上都不对 21.R ×C 表的2 χ检验的自由度为:d A.1R - B.1C - C.1RC - D.(1)(1)R C -- E.2R C ?- 22.实验设计的基本原则为e A.齐同原则 B.随机原则 C.对照原则 D.重复原则 E.以上都是 23.在相关分析中:a A.r 越接近1,散点图越集中 B. r 越接近0,散点图越集中 C.0r <,散点图越集中 D.0r >,散点图越集中 E.以上全不对 24.已知1r =,则一定有:c A.1b = B.1a = C. ,0 Y X S = D. ,Y X Y S S = E. ,Y X X S S = 25.相关分析的主要内容包括:d A.确定变量间的数量关系 B.确定变量之间有无关系 C.确定变量之间有无因果关系 D.确定变量之间关系的密切程度 E.以上都不是 26.在配对法秩和检验中,共有8对数据,且差值中没出 现0, 27 T - = ,则 T + = b: A. -3 B.9 C.-9 D.-27 E.30 27.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说:c A.正秩和的绝对值大于负秩和的绝对值 B.正秩和的绝对值小于负秩和的绝对值 C.正秩和的绝对值与负秩和的绝对值不会相差很大 D.正秩和的绝对值与负秩和的绝对值相等 E.正秩和的绝对值与负秩和的绝对值相差很大 28.在成组设计两样本比较的秩和检验中,甲组中最小数据有2个(0.2,0.2),乙组中最小数据也有2个(0.2, 0.2),则数据0.2 的秩次为:d A.2 B.3 C.4.5 D.2.5 E.3.5 29.当第二类错误β由0.2变到0.3时,则第一类错误α是:b A.增大 B.减小 C.不确定 D.不变化 E.以上都不对 30.下列指标除了哪项均为疾病统计指标:c A.治愈率 B.某病病死率 C.某病死亡专率 D.感染率 E.发病率 31.计算某抗体滴度的平均水平,一般宜选择(b )A、算术均数 B、几何均数 C、中位数 D、百分位数 E、极差 32.统计推断的内容( e ) A、是用样本指标估计相应的总体指标 B、是检验统计上的“假设” C、估计正常值范围 D、A、B均不是 E、A、B均是 33.比较身高与体重的变异程度宜用的指标是( d )A、标准差 B、标准误 C、四分位间距 D、变异系数 E、全距 34.观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是(a ) A、20.14 B、6.15 C、8.5 D、 20 E、 10 35.当n一定时,第二类错误β由0.2变到0.3时,第一类错误α( b ) A、增大 B、减小 C、不确定 D、不变化 E、以上都不对 36.两小样本计量资料比较的假设检验,应首先考虑( d )A、用 t检验 B 、用u检验 C、用秩和检验 D 、资料符合 t检验还是秩和检验的条件 E、任选一种检验方法 37.抽样误差指的是( b ) A、个体值与总体值之差 B、样本统计量之间及样本统计量与总体参数值之差 C、个体值与统计量值之差 D、总体参数值与总体参数值之差 E、以上都不对 38.同一双变量资料进行直线相关与回归分析,有( b )A、0,0 r b >< B、0,0 r b >> C、0,0 r b <> D、r b = E、r与b的符号无关 39.用均数和标准差可全面描述下列哪项资料的特征(c ) A、正偏态分布 B、负偏态分布 C、正态分布 D、非对称分布 40.四个样本率作比较, 22 0.01,(3) χχ > ,可认为( a )各总体率不等或不全相等 B、各总体率均不相等 C、各样本率均不相等 D、各样本率不等或不全相等 E、各总体率相等 一,名词解释 1.标准差与标准误 (1)标准差(S)表示单个测量值对其均数(X)的离散程度,标准误( S X)表示样本统计量对总体参数的离散程度; (2)S大, S X小; (3)S用于描述观测值变异范围, S X用于推断估计总体参数的可信区间和假设检验; (4)计算公式:S= 1 ) (2- - ∑n X X 或S= ) 1(p np- , S X=S/n或Sp=n p p/) 1(- 。 2. X±1.96S与X± t v,2/05.0S (1)X即算术平均数,它描述的是一个变量所有观察值的平均水平,适用于频数分不对称的数据;S即标准差,表示单个测量值对其均数(X)的离散程度. 标准误 ( S X)它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,是说明均数抽样误差大小的指标,它与均数的大小成正比,与样本含量n的平方根成反比,即 S X=S/n;t v,2/05.0表示自由度为v、双侧尾部面积为0.05的t界值。 (2)X±1.96S表示从正态总体中抽样,样本含量较大时,观测值95%的波动范围;X± t v,2/05.0S X 表示从正态总体中抽样,样本含量较大时,总体均数95%的可信区间。 3.总体与样本 (1)总体是指根据研究目的确定的同性质的所有研究对象的某项或某几项指标测量值的集合;根据总体集合所包括元素是否有限,可分为有限总体和无限总体,总体具有特定的分布特征和参数。 (2)样本是指以某种方式按预先规定的概率从总体中随机抽取的、足够数量的和能代表总体分布特征的一部分观察单位某指标数据的集合。 (3)根据研究目的,从总体中抽取部分有代表性的样本,用样本统计量推断中体参数。 4.r与b (1)r表示直线相关系数;b表示直线回归系数。 (2)资料要求:直线回归要求因变量Y在给定X=Xo的条件下服从正态分布;X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。直线相关要求两个变量X、Y腹从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。(3)统计量:相关分析主要是描述两个变量之间线性关系的密切程度和方向;回归分析说明两变量依存变化的数量关系,不仅可以揭示变量X对变量Y的影响大小,还可以有回归方程进行预测和控制。 (4)统计量:回归分析中主要统计量为截距a和回归系数b,相关分析统计量为相关系数r;回归系数有单位,相关系数无单位。 (5)联系:①r与b符号一致即对一组数据若同时计算r 与b,它们的正负号是一致的。②假设检验等价即对同一样本,r和b的假设检验得到的t值相等。用回归解释相关,r的平方称为决定系数,2r =SS回归/SS总。 5.完全随机设计与随机区组设计 (1)完全随机设计亦称单因素设计或成组设计,是指将同质的受试对象随机分到各处理组中进行实验观察或从不同总体中随机抽样进行对比的方法。 (2)随机区组设计亦称配伍组设计,是指配对设计的扩展,是将几个条件(如性别、种族、年龄、工作环境等)相似的受试对象配成一个区组,然后在个区组内按随机原则分组,每组分别予以不同的处理的方法。 6.发病率与患病率 (1)发病率表示在某一时期内特定人群中患某病新病例的频数,计算公式:某病发病率=某时期某病新病例数/同期间内平均人口数 X 比例基数。 (2)患病率也称现患率,表示某一时点某人群中患某病的频数,计算公式:某病患病率=某地某试点某病患病例数/该地同期内调查人口总数 X 比例基数。 7.Ⅰ型错误与Ⅱ型错误 (1)假设检验中,无论是接受还是拒绝原假设均有可能犯错误。 (2)Ⅰ型错误是指在假设检验中拒绝了一个实际成立的原假设所犯的错误,其概率记为α;Ⅱ型错误是指在假设检验中接受了一个实际不成立的原假设所犯的错误,其概率记为β。 (3)当样本含量确定是,α越大,则β越小,反之,α越小,则β越大。 (4)增大样本量可同时降低α和β。 8.Syx与Sb (1)Sb表示回归系数的标准误,Sb=Syx/ ∑-2) (x x ;(2)Syx表示y的剩余标准差,即扣除x对Y的线性影响后y对回归线的离散程度,度量了实际散点远离回归直线的离散程度,反映了模型的可靠性。越小模型越好。 Syx= ∑-2^) (y y /2 - n=2-n/ 剩 SS . 9.敏感度与特异度 (1)敏感度又被称为真阳性率,表示实际患病者且被待评价的诊断方法诊断为患者的概率,反映了待评价的诊断方法检出患者的能力,该值愈大愈好。 (2)特异度又称为真阴性率,表示实际未患病者被待评价的诊断方法诊断为非患者的概率,反映了待评价的诊断方法检出非患者的能力,该值愈大愈好。 10.OR与RR (1)RR称为相对危险度,表示在不同条件下某疾病发生的概率之比,反映暴露因素与疾病联系强度及其病因学意义的大小。 (2)OR称为比数比,也称优势比,指暴露组的疾病危险性为非暴露组的多少倍。在病历对照研究中,通常用其来作为RR的近似估计值。 二.填空。 1,方差分析是建立在数据变异结构基础之上的F分布的小概率事件原理,其基本思想是分析变异,即将数据总变 异分解为各种原因引起的变异和随机误差引起的变异,过比较来源的变异推断处理组间有无差别。应用条件:组定量资料的比较、观察值为独立随即样本, 分布、样本较大时正态性条件可以放大、方差齐性、 可比性。 2,参考值范围(reference range) (normal range), 范围称为该指标的正常值范围。绝大多数:可以是90% 95%、99%等等,最常用的是95%。正常人: 人群。又称参考值范围,是指特定健康人群的解剖、 生化等各种数据的波动范围。习惯上是确定包括95% 的界值。 医学参考值范围的制定方法:a 人作为参照样本b,对选定的参照样本进行准确的测定c 决定取单侧范围还是双侧范围值d e,估计参考值范围的界限(c,d,e为统计学方法)。参考值范围与可信区间区别是什么? 答: (1)意义不同: 数量(如95%或99%) 个体值的估计范围,如95% 围,意味该数值范围只包括95%的个体值,有5% 不在此范围内。 参数所在范围。如95%的可信区间,意味着做100 算得100个可信区间,平均有95 数(估计正确)有5个可信区间不包括总体均数(误)。(2)计算方法不同: 参考值范围用X±uαS计算。信区间用X±tα、νSx或X±uαSx计算; 后者用标准误。 3.诊断试验的评价:金标准、随机对照、同期测试、 基本指标:敏感度(a/a+b)、特异度(d/d+c) (a+d/a+b+c+d)、误诊率(c/c+d)、漏诊率(b/a+b) 4.(1)I型错误指拒绝了实际上成立的H0所犯的―弃真错误,其概率大小用α表示。Ⅱ型错误则是指―接受‖实际上不成立的H0所犯的―取伪‖错误,其概率大小用表示。当样本含量n确定时,α愈小,β愈大;反之,愈大,β 用中要重点减少α(如一般的假设检验),则取α=0.05若在应用中重点减少β( 想用一种方法代替另一种方法的检验等),则取α 或0.20甚至更高。 (2 的H0假设”时所犯的错误,当H0 概率等于检验水准α 拒绝实际上不成立的H0 常用β表示,其大小与抽样误差大小及设定的检验水准有关。 1-β实有差别时检出该差别的能力; 5. 假设检验的目的和意义是什么? 答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。 6. (1)标准化法只适用于因两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的可比性问题,标准化法不能解决。 (2)由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。 (4)两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,还应作假设检验。 7.医学实验设计:三个要素:受试对象(随机性,同质性、数量性、独立性、反应性、依从性)、处理因素(内容、有几个、每个因素有几个水平;标准化;施加途径;混杂因素)、试验效应(客观性、特异性、剂-效梯度、精准度)诊断试验设计原则:书:对照原则、随机化原则、重复原则、均衡原则。笔记:足够的样本含量(标准误、标准差、1-β)、对照原则、设置均衡对照、盲法。 8,最小二乘法原则是指使各实际散点(Y)到回归直线( ^ y)的纵向距离的平方和最小。即使 ∑-2^) (Y Y 最小。 9.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数。它与计数资料不同:属性分组有程度差别,个体大小顺序排列。也与计量资料不同:每个观察单位未确切定量。 10. 直线回归与直线相关的区别与联系。 答:两者的联系:①对于既可以作相关又可作回归分析的同一组数据,计算出的b与r正负号一致。②相关系数与回归系数的假设检验等价,即对于同一样本,tb=tr。③同一组数据的相关系数和回归系数可以相互换算:r=bY·X×SX/SY。④用回归解释相关:由于决定系数r2=SS 回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。 两者的区别:①资料要求上:相关要求X、Y服从双变量 正态分布,这种资料进行回归分析称为Ⅱ型回归;回归要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。②应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y 如何依赖于X 而变化。③意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。④计算上: YY XX XY l l l r /=,XX XY l l b /=。⑤取值范围:-1≤r ≤1,- ∞<b <∞。⑥单位:r 没有单位,b 有单位。 (1)影响样本含量的条件:.在样本含量越大,抽样误差越小。 (2)诊断试验设计原则:书:对照原则、随机化原则、重复原则、均衡原则。笔记:足够的样本含量(标准误、标准差、1-β)、对照原则、设置均衡对照、盲法。 诊断试验评价的原则: 金标准、随机对照、同期测试、盲法。 (3)统计图:1)统计图的制作原则和要求有哪些? 答:统计图的绘制原则和要求有:①根据资料性质和分析目的正确选用适当的统计图。例如分析比较独立的、不连续的、无数量关系的多个组或多个类别的统计量(如例数、相对数和均数等)宜选用直条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述某变量的频数分布宜选用直方图,描述或比较不同事物内部构成比时用圆图或百分比条图等。②与统计表相似,统计图必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题放在图的下方。③统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。④统计图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。 2)常用的统计图有哪几种,各适用于什么类型资料? 答:常用的统计图有直条图、直方图、圆图或构成比直条图、线图和统计地图。直条图适用于比较独立分类组的统计指标,直方图适用于描述频数分布,圆图和构成比直条图适用于描述构成比,线图适用于描述某统计量随时间或另一统计量变化而变化的趋势,统计地图适用于描述统计指标的地理分布。 3)统计表与统计图有何联系和区别? 答:统计表和统计图都是清晰地、有条理地展示数据,让读者易于领会统计资料的核心内容,易于做比较分析。统计图将统计数据形象化,可以给读者留下深刻的印象。但统计图只能提供概略的情况,而不能获得确切数值,因此不能完全代替统计表,常需要同时列出统计表作为统计图 的数值依据。 四.计量资料: 用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。 计数资料: 先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得资料,称为计数资料。 等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。 计量资料:统计描述(频数分布、集中趋势、离散趋势、统计图表)统计推断(抽样误差、标准误、t u F 检验、秩和检验) 计数资料:统计描述(频数分布、相对数及其标准化、统计图表)统计推断(u 卡方检验、秩和检验) 几个容易混淆的基本概念 1、抽样误差与标准误 抽样研究才有抽样误差 抽样误差的概念 标准误是衡量抽样误差大小的指标 2、标准差与标准误关系 联系:离散度指标,计算上的联系 区别:描述对象不同,意义与应用不同,与n 的关系不同 3、参考值范围与可信区间关系 联系:均为一个数值范围 区别:意义不同, X ±1.96S 与X ± t v ,2/05.0S 同一资 料两范围的不同 4、假设检验的意义 是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同(不能推断差别大小)。 5、检验假设与检验结论 无效假设与备择假设(单双侧); 是对总体所作,H0假设总体相同或两者无关,检验方法建立于此; 对检验方法的H0与H1作总结; 检验结论有统计结论与专业结论; 是针对检验假设(总体)而作的; 6、线性相关与线性相关系数 前提是散点图有线性趋势; 两变量线性关系密切程度和变化方向; 检验的意义与 r 值的意义; 7、线性回归与线性回归系数 前提是散点图有线性趋势; 配线求直线回归方程; 线性回归系数b 意义; 1、总体:根据研究目的确定的同质研究对象的全体. 2、样本:从总体中随机抽取的一部分观察单位. 3、同质:指事物的性质、影响条件或背景相同或非常相近。 4、变异:指同质的个体之间的差异 5、参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。 6、统计量:样本的统计指标,如样本均数、标准差,参数附近波动的随机变量。 7、变异系数:当两组资料单位不同,或单位相同,均数相差甚远时,不能用标准差大小来比较它们的离散程度,可用变异系数比较它们的离散程度,变异系数小的离散程度小,变异系数大的离散程度大。 8、频数分布数值变量资料在某一范围内观察值的个数称为频数,频数分布描述观察值在其所取值范围的分布情况. 9、统计推断随机事件是否发生虽然不确定的,但应用统计方法,通过对局部的观察可发现其有统计规律性。 10、全距:用R表示,它是一组观察值的最大变量值与最小变量值之差。 11、抽样误差由于抽样原因引起样本率与总体率的差别. 12、标准差:是最常用的表示变量值离散程度的指标,总体标准差用σ表示,样本标准差用S表示。 13、标准误:均数的标准差即标准误与总体标准差相差一个常数的倍数 1.什么是误差? 误差是指实际测量(或观察)值与客观真值之差,包括系统误差和随机误差 2.简述在医学统计中最常用的三种平均数指标? 三种平均数:(1)均数(2)几何均数(3)中位数 3. t检验的前提条件是什么? 1)正态分布(2)方差齐性 4.简述常用的相对数指标? 1)率(2)构成比(3)相对比 5. 简述四格表资料卡方检验的条件? (1)T》5,N 》40(2)如1《T〈5,N〉40用校正卡方(3)如T<1或N<40用精确检验 1、统计工作的基本步骤是()、()、()。 2、统计表的结构主要由()、()、()和()组成。 3、平均数主要包括()、()和()。 4、统计资料可分为()、()和()三种。 5、(线)图可描述一事物随另一事物变化的趋势,(半对数线)图描述一事物随另一事物变化的速度。 6、用(中位数)和(四分位间距)可全面描述偏态分布的计量资料的特征 7、频数分布的两个特征是(集中趋势)和(离散趋势)1.比较一批儿童的身高和体重的变异程度宜用标准差。() 2.直方图可以用于反映一批新生儿出生体重的分布情况。() 3.某地区某病连续3年患病率分别为6.0%、9.0%、12.0%,则该病3年总的患病率为:(6.0+9.0+12.0)/3=9.0%。() 4.当抽样研究的样本含量增大时,均数的标准误会变小。() 5.当自由度趋向无穷大时,t分布就是标准正态分布。() 6.两样均数比较的t检验的目的在于检验两样本均数差别是否等于0。() 7.χ2检验可用于两个样本均数的比较。() 8.直线相关反映两变量的相互直线关系。() 9.相关关系一定是因果关系。() 10.若t检验结果为拒绝H0,则P值越小,说明两总体均数差别越大。() 1.计量标准化率时,通常以什么作为标准人口? 2.计算参考值范围的方法有哪些? 3.简述非参数检验的应用条件。 4.等级相关特别适用于哪些资料? 1. 卫生统计工作的基本步骤包括 _____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高 2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知 A药降血压疗效只会比 B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯 I型错误的概率越小 C. 检验效能 1- 定得越小, 犯 II型错误的概率越小 D. P 值越小, 越有理由拒绝 H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X )差别的 t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将 90 名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的 t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的 t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对 9. 某医师治疗了两例视网膜炎患者,1 例有效,下列哪项说法是错误的:_____。 A. 有效率为 50%B.最好用绝对数表示 C.必须用率表示时,应同时给出其可信区间 D.分母太小,用相对数不可靠E.不能得知总体有效率 10. 经调查甲乙两地的冠心病粗死亡率均为 4/105,经统一年龄构成后,甲地标化率为 4.5/105,乙地为 3.8/105。因此可认为 _____ 。 A. 甲地人群平均年龄较乙地大B.甲地人群实际冠心病死亡率较乙地高 C.甲地老年人构成较乙地大 D.甲地各年龄别冠心病死亡率都较乙地高 E.甲地人群冠心病平均死亡风险较乙地高 11.不适宜用 Poisson分布描述的实例是_____。 A.广深高速公路一定时间发生的交通事故数分布 B.每毫升水样品中大肠杆菌数分布 C.放射性物质在单位时间内放射出质点数分布 D.单位空间中某些昆虫数分布 E.一定人群中乙型肝炎病人数分布 12.调查某地居民 1600 人,得蛔虫感染率为 50%,则其总体率的 95%可信区间为 _____。 A.47.55~52.45% B.48.75~51.25% C.45~55%D.49.68~50.32% E.据此资料不可推知 13. 以下不是χ2 检验的用途。 A. 推断两个或两个以上总体率之间有无差别 B. 交叉分类资料两属性间有无相关关系 C. 检验频数分布与理论分布的拟合优度 D. 推断两个或两个以上总体构成比之间有无差别 E. 推断两个或两个以上总体均数之间有无差别 14.在两组样本比较的秩和检验中,实验组的观察值为0,3,7,14,32,对照组的观察植为,0,2,4,4,8。编秩中零值的秩应分别编为 ______。 A.1; 2,3 B.3; 1.5,1.5 C. 2; 2,2 D. 1; 2.5,2.5 E. 不参加编秩 15. 根据某地 6 至 16 岁学生近视情况的调查资料, 反映患者的年龄分布可用 _____。 A.普通线图 B.半对数线图 C. 直方图 D. 直条图 E.复式直条图 16. 根据样本算得两个变量 X 与 Y 之间的相关系数 r,经 t 检验,P<0.01,可认为_____。 A. X 与 Y 间相关密切 B. B. 总体相关系数ρ=1 C. 总体相关系数ρ=0 D. 总体相关系数ρ≠0 E. 总体相关系数ρ>0 17. 对药物半衰期较长的某药作不同剂量疗效的临床试验,以下_____设计不适宜。 A. 配对设计 B. 完全随机设计 C .交叉设计 D. 配伍组设计 E. 以上设计都不合适 18. 现时寿命表的期望寿命_____。 A. 受人群数量的影响 B. 不能进行不同地区间的比较 C. 受人口年龄别构成的影响 D. 是各年龄别死亡率的综合反映 E. 是死亡年龄的平均数 19. 与实验相比,_______________。 A. 调查中对非研究因素控制更为严格 B. 调查不对研究对象作人为干预 C. 调查结果更为可靠 D. 调查设计要遵循随机和均衡的原则 E. 调查研究的样本可以更小 20. 在某化疗药物治疗肺癌的临床随访研究中, 不属于截尾数据的是_____。 A. 随访对象死于其它疾病 B. 随访对象因在随访期间移民出国 C. 随访对象因严重付作用未能完成治疗 D. 随访对象到研究结束时仍未死亡 E. 随访对象失去联络 1. 在研究中,研究者对每个观察单位的某项特征进行测量和观察,这种特征称为_____ 。对_____的测得值称为_____。 2. 在建立检验假设是应当注意检验假设是针对__________ 而言,而不是针对__________。 3. 在制统计图时,标题说明资料的内容,位于图的_____,必要时注明______、_______ 。 4. 确定样本含量时应当具备的条件有:(1)建立检验假设, (2)定出__________, (3)提出期望的 __________, (4)必须知道由样本推断总体的一些信息, 如__________ , 还有____________。 5. 极差是全部数据中的__________与__________ 之差,它描述了数据变异的幅度。 三、名词解释:简单解释以下名词。(每题 4 分) 1. II 型错误 2. 非参数检验 3. 正常值范围 4. 组内变异 1. 简述怎样描述一组计量资料的集中趋势和离散趋势 2. 试述假设检验中 I 型错误与 II 型错误的意义及关系。 3. 试比较完全随机设计和随机区组设计资料的方差分析基本思想。 4. 医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素。 5. 试述死亡概率、生存概率与生存率的关系。 1. 在医学统计学中样本与总体的关系是__________。 A 样本是总体中有代表性的一部分 B 样本是总体中最有特点的一部分 C 样本是总体中典型的一部分 D 样本是总体中有意义的一部分 E 样本是总体中精心挑选出来的一部分 2. 以下关于概率的定义中,__________是错误的。 A. 当概率小于 0.05, 则为不可能事件 B. 当概率等于1, 则为必然事件 C. 当概率在 0 至 1 之间时, 为随机事件 D. 当重复实验次数足够大时, 事件发生频率接近概率 E. 当概率等于零, 则为非随机事件 3. 频数表不能__________。 A. 反映频数分布的特征 B. 方便进一步统计分析计算 C. 便于发现异常值 D. 精确估计算术均数的值 E. 用于分类资料 4. 在描述定量资料的集中趋势时, 以下论述中错误的是__________。 A. 均数适宜于对称分布资料 B. 几何均数和中位数都适宜于正偏倚分布 C. 同一正偏倚分布资料, 估计的均数值小于中位数值 D. 对称分布资料的均数值等于中位数值 E. 几何均数特别适宜于细菌学和免疫学检测指标的描述 5. 用大量来自同一总体的独立样本对总体参数作估计时,关于 95%可信区间(CI),正确的说法是__________。 A. 大约有 95%样本的 95%CI覆盖了总体参数 B. 对于每一个 95%CI而言,总体参数约有 95%的可能落在其内 C. 各个样本的 95%CI是相同的 D. 对于每一个 95%CI而言,有 95%的可能性覆盖总体参数 E. 以上说法都不对6. 在假设检验中,关于 P 值与 值,下列说法不正确的是__________。 A. α值是决策者事先确定的一个可以忽略的、小的概率值 B. P 值是在 H0 成立的条件下,出现当前值以及更极端状况的概率 C. α值并不一定要取 0.05, 根据实际需要甚至可以取到 0.15 D. 在同一次假设检验中,作单侧检验时所得 P 值比作双侧检验时所得 P 值小 E. α值越小,所得结论越可靠 7. 当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是____ 。 A.完全等价且 F=t B.方差分析结果更准确C.t 检验结果更准确 D.完全等价且 t=FE.以上都不对 8. 下列关于方差分析的陈述中正确的是____。 A. 方差分析用于比较各组的总体方差是否相等 B. 方差分析结果有统计学意义表明各样本均数来自同一总体 C. 方差分析中判断 F 值相对应的 P 值时需查双侧界值表 D. 方差分析得到的 F 值越大, 表明总体均数差别越大 E. 方差分析得到的 F 值越小, 越没有理由怀疑 H0 成立 9. 调查某疫苗在儿童中接种后的预防效果,在某地全部1000 名易感儿童中进行接种,经一定时间后从中随机抽取 300名儿童做效果测定,得阳性人数228 名。若要研究该疫苗在该地儿童中的接种效果,则________。 A. 该研究的样本是 1000 名易感儿童 B. 该研究的样本是 228 名阳性儿童 C. 该研究的总体是 300 名易感儿童 D. 该研究的总体是 1000 名易感儿童 E. 该研究的总体是 228 名阳性儿童 10. Poisson分布独有的特征是______。 A. 离散型分布 B. 参数是总体均数 C. 方差等于均数 D. 当样本较小时是偏倚分布 E. 当样本足够大时近似正态 11.在比较两个率时,进行标准化的目的是______。A.使两个率之间的差异减小 B. 使两个率更能代表二人群的实际水平 C. 使两个率更能代表二人群的相对水平 D. 任两个率进行比较都必须先进行标准化 E. 代替假设检验发现两个率之间的差别 12. 用 A法和 B 法分别检测 100名确诊的癌症病人,A 法的阳性率为 pA,B 法的阳性率为 pB。检验两种方法阳性率差异的方法应采用______。 A. 检验两样本率是否相等的 u检验 B. 检验两总体率是否相等的 u检验 C. 检验两样本率是否相等的χ2 检验 D. 检验两总体率是否相等的χ2 检验 E. 两非独立样本的总体率是否相等的χ2 检验 13.两独立样本比较的秩和检验结果判定为______。 A.T越大,P 越大B.T越大, P 越小C. T值在界值范围内, P 小于相应的 D.T值在界值范围内,P 大于相应的 E.以上都不对14. 关于基于秩次的非参数检验, 下列说法错误的是______。 A. 符号秩和检验中, 差值为零不参加编秩 B. 随机区组设计资料的秩和检验中, 各组混合编秩 C. 当符合正态假定时, 非参数检验犯 II类错误的概率较参数检验大 D. 当样本足够大时, 秩和分布近似正态 E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 15. 为比较某地两年几种疾病的患病率, 可采用______。 A. 直方图 B.复式直条图 C. 线图 D. 构成比直条图 D.圆图 16. 回归分析是研究______。 A. 两变量 X, Y 变化的关联性 B. 两变量 X, Y 变化的方向性 C. 因变量依赖自变量变化的数量关系 D. 两变量变化的紧密程度 E. 一个变量对另一个变量的相关比例 17. 为减少测量顺序对比较新药与常规药治疗结果的影响, 作统计设计时最好应采用以下哪项措施______。 A. 设对照组 B. 随机化安排 C. 增加实验次数 D. 盲法 E. 以上都不行 18. 关于寿命表, 以下正确的陈述是______。 A. 现时寿命表资料来自对特定人群某时点的调查 B. 定群寿命表资料来自对特定人群某时点的调查 C. 期望寿命又称平均寿命, 指所有调查对象死亡时年龄的平均值 D. 随访某特定人群的死亡情况所得资料可做现时寿命表分析 E. 因期望寿命受人群年龄构成的影响, 不能直接比较不同地区的期望寿命 19. 关于随机抽样, 以下论述中正确的是______。 A. 单纯随机抽样适合大规模的抽样调查 B. 当学生学号按入学成绩编排时, 评价学生成绩的抽样调查可采用系统抽样 C. 整群抽样的优点是抽样误差较小 D. 分层抽样可以通过分层控制非研究因素对调查结果的影响 E. 在一次抽样调查中只能采用一种抽样方法 20. 以下指标中, ______的分母不是用平均人口数。 A.死因别死亡率 B.粗死亡率 C.某疾病发病率 D.婴儿死亡率 E.以上都不是 1. 设计是整个研究中的____________一环,也是今后工作应遵循的依据。 2. 由于寿命表是根据年龄组死亡率计算出来的,因此,寿命表中各项指标不受人口______ ______的影响,不同人群的寿命表指标具有良好的可比性。 3. 当研究者不知道总体参数时, 从总体随机抽取一定数量的观察单位作为______ 进行________。通过样本指标来说明总体特征,这种由样本获取有关总体信息的过程称______ 。 4. 在完全随机设计资料的方差分析中,总变异可以分解为_________和________两个部分,相应的总自由度也可分解为________ 和________ 。 5. 在相关回归分析中,对同一组数据若同时计算 r 与b,它们的________是一致的,并且________ 等价。 1. 检验效能 2. 参数检验 3. 可信区间 4. 组间变异 1. 试比较标准差和标准误的关系与意义。 2. 请简述对两总体均数作独立样本假设检验可以采用的统计方法及适用条件。 3. 简述非参数检验的应用条件和优缺点。 4. 简述二项分布、Poisson 分布、正态分布三者的关系。 5. 试述直线相关与直线回归的区别与联系。 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B) A 条图 B 百分条图或圆图C线图 D直方图 2、均数和标准差可全面描述 D资料的特征 A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A)A变异系数 B方差 C 标准差 D 四分位间距 统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x 医学统计学试题及答案 The latest revision on November 22, 2020 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY- 医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。 考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128 《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩 ____________ 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有 意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均 数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。() 11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。() 12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r 《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关 7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描 第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )( 医学统计学模拟试题(A) 一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题1 分) 1. 卫生统计工作的基本步骤包括_____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯I型错误的概率越小 C. 检验效能1- 定得越小, 犯II型错误的概率越小 D. P 值越小, 越有理由拒绝H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对 一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。 统计推断主要包括假设检验和参数估计两个方面。 参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O “医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。 3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时, 自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t r l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 《生物统计学》试卷 一.判断题(正确的打“√”错误的打“×”,每题2分,共10分) 1. 分组时,组距和组数成反比。( ) 2. 粮食总产量属于离散型数据。 ( ) 3. 样本标准差的数学期望是总体标准差。 ( ) 4. F 分布的概率密度曲线是对称曲线。 ( ) 5. 在配对数据资料用t 检验比较时,若对数n=13,则查t 表的自由度为12。 ( ) 二. 选择题(每题2分,共10分) 1. x ~N (1,9),x 1,x 2,…,x 9是X 的样本,则有( ) A. 31 -x ~N (0,1) B.11-x ~N (0,1) C.91-x ~N (0,1) D.以上答案均不正确 2. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1% 计算平均年龄,则平均年龄的标准误( ) A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 3. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间,则( ) A.应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值 4. 1-α是( ) A.置信限 B.置信区间 C.置信距 D.置信水平 5. 如检验k (k=3)个样本方差s i 2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为( )。 A.方差的齐性检验 B. t 检验 C. F 检验 D. u 检验 三. 填空题(每题1分,共10分) 1、统计学的3个基本特点: 、 、 。 2、统计资料的特点: 、 、 。 3、统计资料可分为 、和 、两类,后者又可分为 、和 。 4、统计表由 、 、 、 、 组成,通常分为 和 。 5、显著性检验又称 ,是统计学的核心内容。 6、随机实验的每一个可能的结果称为 。 7、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 和 。 8、数据资料按其性质不同各分为 资料和 资料两种。 9、小概率事件原理判定的基础是 。 10、试验设计的三大基本原则是设置重复、 和 。 四、名词解释(每题4分,共40分) 1、样本: 2、随机抽样: 3、总体: 4、随机误差: 5、参数: 6、概率事件原理: 7、平均数: 8、准确性: 密 线 封 层次 报读学校 专业 姓名 (注:红色字体表示已经改正,多余表示删除的内容) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A) A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体 均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2(B)n1+ n2–1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) 医学统计学试题及答案 1、2、3套 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图 B百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似 正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C标准差 D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数 不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资 料的t检验时,自由度是(D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映(A) A抽样误差的大小 B总体参数的波动大小 C重复实验准确度的高低 D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C)生物统计学期末复习题
医学统计学试题及答案
医学统计学试题及答案
生物统计学考试试卷及答案
《医学统计学》期末模拟考试题(四)
医学统计学试题及答案
生物统计学期末复习题库及答案
医学统计学模拟试题
生物统计学试题及答案
(完整word版)医学统计学上机考试复习题及答案
医学统计学练习题与答案
医学统计学部分试题及答案解析
医学统计学模拟试卷与答案
医学统计学试题及其答案
医学统计学试题及答案
《生物统计学》试卷与参考答案
医学统计学模拟试卷及答案
医学统计学试题及答案
医学统计学试题及答案1、2、3套