文档库

最新最全的文档下载
当前位置:文档库 > 统计学

统计学

一、选择题

1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是.

A.中位数

B.几何均数

C.均数

D.P95百分位数

E.频数分布

2.算术均数与中位数相比,其特点是.

A.不易受极端值的影响

B.能充分利用数据的信息

C.抽样误差较大

D.更适用于偏态分布的资料

E.更适用于分布不明确的资料

3. 用频数表计算平均数时,各组的组中值应为。

A. 本组段变量值的平均数

B. 本组段变量值的中位数

C. 本组段的上限值

D. 本组段的下限值

E. (本组段上限值+本组段下限值)/2

4. 变异系数越大说明。

A.标准差越大

B.平均数越大

C.标准差、平均数都大

D.平均数小

E.以均数为准变异程度大

5.均数和标准差的关系是____________。

A. 均数越大,标准差越小

B. 均数越大,标准差越大

C. 标准差越大,均数对各变量值的代表性越好

D. 标准差越小,均数对各变量值的代表性越好

E. 均数和标准差都可以描述资料的离散趋势

6. 把P25,P50,P75标在一个数轴上,则。

A. P50一定在P25和P75的中点

B. P50一定不在P25和P75的中点

C. P50一定靠近P25一些

D. P50一定靠近P75一些

E. 以上都不是

7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用。

A.全距

B.标准差

C.变异系数

D.方差

E.四分位数间距

8. 已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为。

A. 9天

B. 9.5天

C. 10天

D. 10.2天

E. 11天

9.已知某地一群7岁男童身高均数为100cm,标准差为5cm;体重均数为20kg,标准差为3kg,则身高和体重的变异程度有:

A. 身高的变异程度大于体重的变异程度

B. 身高的变异程度等于体重的变异程度

C. 身高的变异程度小于体重的变异程度

D.身高的变异程度与体重的变异程度之比为5:3

E. 因单位不同,无法比较

10. 测得200名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不正确的是________。

A. 可用频率表法计算均数B.可用直接法计算均数

C. 可用直接法计算标准差

D. 可用加权法计算标准差

E. 可用直条图表示频率分布图

11.如果一种新药的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是.

A.该病患病率增加

B.该病患病率减少

C.该病的发病率增加

D.该病的发病率减少

E.该疾病的死因构成比增加

12. 计算乙肝疫苗接种后血清学检查的阳转率,分母为________。

A. 乙肝易感人数B.平均人口数

C. 乙肝疫苗接种人数

D. 乙肝患者人数

E. 乙肝疫苗接种后的阳转人数

13.计算标准化死亡率的目的是.

A.减少死亡率估计的偏倚

B.减少死亡率估计的抽样误差

C.便于进行不同地区死亡率的比较

D.消除各地区内部构成不同的影响

E.便于进行不同时间死亡率的比较

14. 计算患病率时平均人口数的计算方法是________。

A. 年初人口数与年末人口数的平均值

B.全年年初人口数

C.全年年末人口数

D.生活满一年的总人口数

E.生活至少在半年以上的总人口数

15.死因构成比反映的是.

A.各种疾病发生的严重程度

B.疾病发生的主要原因

C.疾病在人群的分布情况

D.各种死因的相对重要性

E.各种疾病的死亡风险大小

16. 患病率与发病率的区别是.

A. 患病率高于发病率

B.患病率低于发病率

C.计算患病率不包括新发病例

D.发病率更容易获得

E.患病率与病程有关

医学统计学:是运用概率论与数理统计的原理和方法,收集、整理、分析医学中反映随机现象的数字资料,并推断其客观规律的一门学科。

总体:根据研究目的所确定的、具有某种相同性质的所有个体的集合。

样本:同一总体中一部分有代表性的个体所构成的集合。样本必须具备的三个条件是:同一性、随机性、可重复性。

同质:是指根据研究目的所确定的观察单位其性质应大致相同。

变异:是指由个体差异引起的现象。

总体参数:反映总体状态或性质的指标称为总体参数。一般用希腊字母来表示,如μ:总体均数

样本统计量:用于描述样本特征的指标,它是不含有未知参数的样本的函数。样本统计量主要用于提取样本信息,如样本均数。

误差:是指观测值与真实值之间的差异。

系统误差:也称统计偏倚,由一些固定因素产生。系统误差的大小通常恒定或按照一定规律变化,具有明确的方向性。这类误差可人为进行消除或控制。

随机测量误差:在测量过程中,由于各种偶然因素的影响,也会造成同一测量对象多次测定的结果不完全相同,这种随机产生的误差称为随机测量误差。随机测量误差往往没有固定的大小和方向,但具有一定的统计规律(如服从正态分布)。随机测量误差不可避免,但可以通过多次测量获得的平均值对真实进行估计。

抽样误差:由于抽样而引起的样本统计量与总体参数之间的差异,在统计学上称为抽样误差。抽样误差主要来源于个体的变异,如果没有个体变异,就不存在抽样误差。抽样误差可以用统计方法进行分析,一般来说,样本含量越大,则抽样误差越小,样本统计量与总体参数越接近。

定量资料(计量资料):测定观察单位某项指标所获得的统计资料。其特征是:每个观察单位对应一个具体的测量值。

定性资料:计数资料:将观察单位的某项指标的观测结果按性质或类别的不同,分两类计数而得的统计资料。

等级资料:将观察单位的某项指标的观测结果按性质的不同程度,分等级计数而得的统计资料。其特征是:各等级之间存在“递进关系”。

实验设计三要素:研究对象、处理因素、研究效应。三原则:对照、随机、重复

研究对象:根据研究目的所确定的同质的实验观察个体。同质(纳入标准、排除标准)总体、样本。

处理因素:根据研究目的对研究对象给予的某种干预或措施。

实验效应:处理因素作用于研究对象的反应或结果,通常以指标(变量)的形式来表达。效度(准确度):观察值与真值的接近程度,受系统误差的影响。

信度(精密度):重复观察时,观察值与其均值的接近程度,受随机误差的影响。

对照原则:在确定接受处理因素的实验组时,要同时设立不施加处理因素的对照组。通过对照消除非处理因素对实验结果的影响。

实验对照:对照组施加基础实验条件(非处理因素)。

自身对照:实验在同一受试对象上进行。

标准对照:以现有的标准或正常值作对照。某种新的方法能否代替传统方法的研究。

随机化原则:指每个受试对象以均等机会被抽取、被随机地分配到试验组和对照组。即每个受试对象接受处理的机会均等。

随机区组设计:先将可能影响实验结果的非处理因素进行分层,即区组化(blocking ),然后在每一层内进行随机化分组。 重复原则:在相同条件下进行多次研究或观察,以保证实验的可靠性与科学性。即要求研究对象要有足够多的数量(样本量)。 调查设计:调查研究有两种方法,一是普查,另一种是抽样调查。 普查:是指对研究总体的每一个个体逐一进行调查,也称为全面调查。普查涉及的范围广、时间长、工作量大,需要大量的人力、物力和时间,其主要目的是摸清研究总体的基本情况。 抽样调查:是一种非全面的调查,它是根据一定的原则,从研究总体中抽取一部分个体作为样本,利用样本所携带的信息对总体的状态作出估计和推断。常用的抽样方法有随机抽样和顺序抽样。 随机抽样:总体中的每个个体被抽中的机会是相等的,总体中的任一个体是否被抽中是相互独立的 简单随机抽样:将总体内所有个体全部编号,采用随机的方法确定被抽个体的编号,这些编号所对应的个体就构成一个随机样本。一个随机样本中所包含的个体数称为样本含量。 分层随机抽样:先将总体按一定的特征划分成若干层,然后在每个层抽取一定数量的个体合起来构成样本。 整群随机抽样:先将总体按一定特征分成若干群体,以群体为单位进行随机抽样,将抽到的群体中的全部个体作为样本 顺序抽样:又称为系统抽样。是按某种既定的顺序从总体中抽取一定数量的个体构成样本。 最简单也是最常用的是等距抽样,即抽取了第一个调查个体(i)后,每隔相等的距离(k)确定其他调查个体: i, i+k, i+2k, … , i+(n -1)k 相对数:两个有联系的指标之比。类型:比、率。 统计表:将统计分析的事物及其指标用表格列出,称为统计表。统计表可代替冗长的文字叙述,便于计算、分析和对比。结构及要求:表题、标目、横标目、纵标目。 统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料的几何图形。 随机试验:在相同条件下可以重复进行的试验;可能出现的试验结果不止一个;试验前不能预知本次试验会出现哪一个结果。 随机事件:基本事件:随机试验所得的结果。随机事件:由基本事件及其复合而成的事件。 频率:若在n 次试验中,事件A 出现了m 次,则称 为事件A 在n 次试验中出现的频率。0 ≤ f (A ) ≤ 1 概率:反映随机事件A 发生的可能性大小的量,通常记为P (A )。它是随机事件本身所固有的一种本质属性。

离散型随机变量:随机变量所有可能的取值为有限个或可列无限多个实数。

连续型随机变量:随机变量的取值充满一个实数区间或整个实数轴。 正态分布:也叫高斯分布,一种最常见、最重要的连续型分布。特点:中间频数多,两端越来越少,且左右大致对称。 总体参数:反映总体状态或性质的指标称为总体参数。 样本统计量:不含未知参数的样本的函数。样本统计量主要用于提取样本信息 标准误:样本统计量的标准差称为标准误。它是反映样本统计量对总体参数离散程度的量,用于度量抽样误差的大小。 标准差:是描述观察值(个体值)之间的变异程度。 区间估计:点估计的实质是用一个数值(样本统计量的值)去估计未知参数的真值。这种估计一般是有误差的。人们希望弄清这种估计的近似程度,这就需要估计出一个范围,并了解()m f A n

这个范围包含未知参数的可信程度,这样的范围在数轴上就是一个区间。这种用一个区间来估计未知参数的方法称为对未知参数的区间估计。

这里提到的可信程度称为可信度或置信度,估计出来的区间称为可信区间或置信区间。

小概率原理:小概率事件在一次试验中几乎不可能发生;小概率事件在无穷多次试验中必然会发生。一般地,若一个事件发生的概率P≤0.05,则认为它是一个小概率事件。

统计假设:把任何一个在总体的未知分布上所作的假设称为统计假设。记为H0

参数假设:对仅涉及到总体分布中所包含的一个或几个未知参数的统计假设,称为参数假设。.非参数假设:对直接给出在未知分布形式上的统计假设,称为非参数假设。

统计检验:推断统计假设是否成立的方法称为统计假设检验,简称为统计检验或假设检验。一类错误和二类错误

假设检验:

参数检验:总体分布已知,需要检验参数是否相等。

非参数检验:总体分布未知,需要检验总体分布是否相同。

直线相关:两变量在直线意义下的相关关系。

散点图:为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。

相关系数:反映两变量间在直线意义下联系的密切程度和方向的量,称为总体相关系数,记为ρ。一般情况下,用样本相关系数r作为总体相关系数ρ的估计值。

直线回归:研究两个变量之间的数量依存关系