文档库 最新最全的文档下载
当前位置:文档库 › 安医大生统计学期末

安医大生统计学期末

安医大生统计学期末
安医大生统计学期末

《卫生统计学》期末复习提要

一、期末考试有关问题的说明

<一>出题的指导思想、原则及题目类型

出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。

出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。凡自学的章节不考。

<二>答题要求

选择题:要求选择无误,每题只选一个最佳答案。

计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。

二、期末复习范围和重点

绪言

<一>重点复习的名词:

计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。

计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。

总体(population):表示大同小异的对象(某个测量值)全体。

样本(sample):从研究总体中随机抽取的一部分有代表性的个体

变异(variation):同一总体内的个体间存在差异。

抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。

概率: 某事件出现机会大小的量。

<二>重点复习的问题:

1、根据计量、计数、等级资料的概念正确识别统计资料的类型。

等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

2、统计工作的步骤及搜集资料的来源和要求。

1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

2.收集资料:应采取措施使能取得准确可靠的原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。

3、抽样研究的原因及目的,产生抽样误差的原因。

<三>一般复习的名词:

同质:一些个体处于同一总体么就是指他们大同小异,具有同质性。

参数::参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

随机化抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

样本含量:

<四>一般复习的问题:

1、卫生统计学的内容及学习卫生统计学的意义。

2、统计工作各个步骤的基本内容和关系。

集中趋势与离散趋势

<一>重点复习的名词:

频数分布表:当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table)。

中位数(median ,M):将原始观察值从小到大或者从大到小排序后,位次居中的那个数。

<二>重点复习的问题:

1、对频数分布特征的描述。

频数分布分为集中趋势(central tendency)和离散趋势(tendency of dispersion)。

常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。算数均数适用于对称分布,特别是正太分布的资料;几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布资料,常用于描述偏峰分布的资料。

常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。极差只利用最大值和最小值的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时,或均数相差较大时变量间变异程度的比较。实际应用中,常将算数均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。

2、平均指标:算术均数、几何均数、中位数的意义及应用条件,算术均数的计算。

3、变异指标:全距、标准差、变异系数的意义及应用条件,标准差和变异系数的计算。

4、 正态分布的两个参数及正态曲线下面积的分布规律。

正态分布的特征:服从正态分布的变量的频数分布由μ 、σ 完全决定。

(1) μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x = μ 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ 。

(2) σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

正态曲线下面积的分布规律:如果用其标准差作为衡量单位,则以均数为中心,正负1个标准差内,即(μ-σ,μ+σ)区间内,正态分布曲线下的面积为总面积的68.27%;正负2个标准差内,即(μ-2σ,μ+2σ)区间内,面积为95.44%;正负3个标准差,即(μ-3σ,μ+3σ)区间内,面积为99.74%。这是由正态分布的性质所决定的。 <三>一般复习的问题:

1、除<二>4外,正态分布的其余特点。 2、u变换的形式和作用。

3、查阅标准正态曲线下面积表的方法。

均数的抽样误差及标准误 <一>重点复习的名词:

均数的抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。

标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

总体均数的可信区间:用统计量 X 和Sx 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。 <二>重点复习的问题:

1、 标准误的意义、计算及应用。

标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。 ? 标准误的计算公式: ?

n

对于任意分布,在样本

含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由

公式 计算。

2、 标准差与标准误的区别与联系。

X σ=X

s

=X s =

样本均数标准误的大小与标准差成正比,与样本含量n 的平方根成反比,即在同一总体中随机抽样,样本含量n 越大,抽样误差越小。

3、 总体均数可信区间的意义和计算。

根据总体标准差σ 是否已知及样本含量n 的大小,总体均数置信区间的计算有t 分布和Z 分布(标准正态分布)两种方法。 1. t 分布方法

当总体标准差σ未知时,正态总体N (μ, σ2

)的样本均数的t 变换结果服从 t 分布,若“砍去”t 分布双侧尾部面积α = 0.05 = 5%,故有95%的t 值满足不等式: -t 0.05/2, ν < < t 0.05/2, ν

-t 0.05/2, ν

< μ < + t 0.05/2, ν μ:( -t 0.05/2, ν , + t 0.05/2, ν ) 总体均数μ 的(1- α ) 可信区间置信区间的一般计算式为

± t α/2, ν 均数的单侧置信区间为 μ > -t α/2, ν 或 μ < + t α/2, ν 2正态分布近似方法

(1)当总体标准差σ 已知时,总体均数的双侧置信区间为 ± Z α/2 (2)当σ 未知但n 足够大时(n > 50),t 分布的极限分布是标准正态分布,可用z α/2代替公式(5-9)中的t α/2, ν,则总体均数的双侧置信区间为

± Z α/2 同理, 与(5-8)和(5-9)式相对应, 单侧置信区间则为

-z α 或 -z α + z α 或 + z

α

X X s μ

-X s X X s X X X s X

s X X

s X X s X X s X

X σX X s X X X X X

σX σX s X s

1、抽样误差的规律。

2、提高对总体均数可信区间估计精度的办法。

均数的假设检验

<一>重点复习的名词:

检验假设H0:零假设(null hypothesis),又称原假设。

检验水准α:根据问题的背景,规定一个“小”的概率α,若P值小于α,就认为“P值较小”,若P值不小于α,就认为“P值较大”。通常取α=0.05或0.01以保证犯假阳性错误的概率不超过0.05或0.01。这个α称为检验水准。假设检验中的P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。

可比性:

第Ⅰ类错误和第Ⅱ类错误::假阳性错误称为第I 类错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;假阴性错误称为第II 类错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。

<二>重点复习的问题:

1、t值;t分布与标准正态分布的关系。

2、假设检验的基本思想和步骤。

基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。

步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。

3、样本均数与总体均数比较的t检验。

4、两大样本均数比较的u检验。

5、配对设计三种形式的特点及t检验的H。、H1。

配对设计三种形式的特点:1)异体配对:两个受试对象。2)自身配对:同一受试对象的两个部位分别接受两种处理。3)统一受试对象接受某种处理之前和之后的数据,也可以视为自身配对。

6、假设检验时需注意的问题。(重点是可比性和犯第Ⅰ类及第Ⅱ类错误的含义与概率)

可比性:

I 类错误: H0为真(实际无差别),假设检验结果拒绝H 0,接受H 1(推论有差别)所犯的错误称为I 类错

误(type I error),I 类错误的概率记作a 。

II 类错误: H1为真(实际有差别),假设检验结果拒绝H 1 ,接受H 0(推论无差别)所犯的错误称为II 类错误(type II error),II 类错误的概率记作β。

1- β称为检验效能,过去称把握度(power of test ),即两总体确有差别,按a水准能发现该差别的能力。

<三>一般复习的名词:自由度、假设检验。

<四>一般复习的问题:

1、配对设计的t检验。

2、两小样本均数比较的t检验。

3、t检验的应用条件。

方差分析

一般复习的问题:

1、方差分析的基本思想。

2、完全随机设计的特点和方差分析法。

3、配伍组设计的特点和方差分析法。

4、多个样本均数的两两比较。

相对数

<一>重点复习的名词:

构成比:(proportion)说明某一事物内部各组成部分所占的比重或分布。

率:(rate)说明一定时期内某现象发生的频率或强度。

相对比:,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。比=A/B

动态数列:(dynamic series)是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

<二>重点复习的问题:

1、构成比、率、相对比、定基比、环比的计算。

比=A/B

定基比,即统一用某个时间的指标作基数,其它各时间的指标都与之相比;

环比,即以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。

2、下述指标的意义及计算:死因构成,发病率,患病率,死亡率,病死率。

死因构成(proportion of dying of a specific cause)指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性。死因构成比=同年某死因死亡数/同年内死亡总数*100% (频率型)

发病率(incidence rate,IR)表示在一定时期内,在可能发生某病的一定人群中新发生某病的强度。某病发病率=时期内新发生的某病病例数/年平均人口数*1年(强度型)

患病率(prevalence rate,PR)指某时点上受检人数中现患某种疾病的频率,通常用于描述病程较长或发病时间不易明确的疾病的患病情况。患病率=现患病人数/检查人口数

(频率型)

死亡率(mortality rate)指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。死亡率=同年内死亡人数/年平均人口数*1年(强度型)

病死率(case fatality rate,CFR)指在某一期间内(1年)患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可反映一个医疗单位医疗水平和质量。

某病病死率=同年某病死亡人数/同年患该病总数*100% (频率型)

3、动态数列的分析。

动态数列(dynamic series) 是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

4、应用相对数时需注意的问题。(重点是不能以比代率)

1.计算相对数的分母一般不宜过小。

2.分析时不能以构成比代替率容易产生的错误有

(1)指标的选择错误如住院病人只能计算某病的病死率,不能认为是某病的死亡率;

(2)若用构成指标下频率指标的结论将导致错误结论,如某部队医院收治胃炎的门

2.诊人数中军人的构成比最高,但不一定军人的胃炎发病率最高。

3.不能用构成比的动态分析代替率的动态分析。

4.对观察单位数不等的几个率,不能直接相加求其总率。

5.在比较相对数时应注意可比性通常应注意:

(1)观察对象,研究方法、观察时间、地区和民族等因素应相同或相近;

(2)其它影响因素在各组的内部构成是否相同。

6.对样本率(或样本构成比)的比较应随机抽样,并做假设检验。

<三>一般复习的名词:时期动态数列、时点动态数列、标准化法。

<四>一般复习的问题:

1、动态数列的分类。

2、标准化法的意义及基本思想。

3、标准化率的直接法和间接法计算。

4、应用标准化法的注意事项。

二项分布及其应用

<一>重点复习的问题:

1、率的抽样误差概念。

在抽样研究中所获得的样本率与总体率也存在率的抽样误差。

2、率的标准误的意义及计算。

表示率抽样误差大小的统计指标成为率的标准误。由于总体率和总体率的标准误一般未知,常用样本率p来估计

总体率π,用杨频率的标准误S p来估计总体率的标准误:

率的标准误是衡量样本率稳定性和可靠性的统计指标,它反应率的抽样误差大小,率的标准误越小,表示率的抽样误差越小,用以估计总体率的可靠性就越大。

3、总体率可信区间的意义及计算。

当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。总体率的可信区间可根据样本含量n和样本频率p的大小,选用查表法或正态近似法来估计其总体概率π的(1-α)置信区间。

P93 例子

<二>一般复习的名词:

二项分布:

<三>一般复习的问题:

1、二项分布的概率函数与图形。

2、二项分布的特点。

3、样本率与总体率比较的u检验。

4、两个样本率比较的u检验。

Poisson分布及其应用

<一>一般复习的名词:

Poisson分布:

<二>一般复习的问题:

1、Poisson分布的概率函数及图形。

2、Poisson分布的特点。

3、总体均数可信区间的意义及计算。

4、样本均数与总体均数比较的u检验。

5、两样本均数比较的u检验。

χ2检验

<一>重点复习的名词:

理论频数: theoretical frequency,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

<二>重点复习的问题:

1、χ2检验的基本思想。

2、四格表资料χ2检验和校正χ2检验的应用条件及方法。

3、计数资料相关分析的设计特点和推断目的。

4、行×列表资料χ2检验的注意事项。

χ2检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140 时,用连续性校正χ2检验;T<=1,或n<=40 时,用Fisher 精确概率法。

2.对于R*C 表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5 的格子数不应超过全部格子的1/5;

(2)注意考察是否有有序变量存在。对于单向有序R*C 表资料,当指标分组变量是有序的时,宜用秩和检验;

对于双向有序且属性不同的R*C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R*C表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

<三>一般复习的问题:

行×列表资料所包括的设计类型及χ2检验法。

秩和检验

<一>重点复习的问题:

等级资料的秩和检验(成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)

1.检验步骤:

(1)假设:H0:两总体分布相同 H1:两总体分布不同 a = 0.05

(2)编秩:将两组原始数据分别由小到大排队,再将原始数据从小到大统一编秩。编秩时遇同组相同数据,顺次编秩,遇不同组相同数据取平均秩次。

(3)求秩和并确定检验统计量:当两样本例数不等时,以样本例数小者为n1,其秩和为T。相等时,可任取一组的秩和为T。

(4)确定P 值和作出推断结论:查T 界值表,得出P 值。若检验统计量T 值在上、下界值范围内,其P值大于表上方相应概率水平;若T 值在上、下界值上若范围外,其P值小于

表上方相应概率水平。

<二>一般复习的名词:

非参数统计:样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道

总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-free statistics )的统计分析方法,又称为无分布型式假定(assumption free statistics )的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。 <三>一般复习的问题:

1、配对比较的符号秩和检验。

2、配伍组设计的多个样本比较的秩和检验。 3、两个或多个计量样本比较的秩和检验。 4、参数统计和非参数统计的优缺点。 直线相关与回归

<一>重点复习的名词:

相关系数:相关系数又称积差相关系数(coefficient of product -moment correlat ion ),以符号r 表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 回归系数:回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用 b 表示,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位。 <二>重点复习的问题:

1、 使用电子计算器计算相关系数r、回归系数b、截距α。 2、 散点图的作用和绘制方法。

(1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier )

3、 描述直线关系的密切程度和方向时,r值的变化。

相关系数 r 没有单位,其值为-1≤r ≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。r 值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r 值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r 的绝对值等于1 为完全相关。 直线回归方程的一般形式及最小二乘法原理的内容。 回归参数的估计——最小二乘原则

原则:最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小 4、 应用直线相关与回归分析的注意事项。

1. 根据分析目的选择变量及统计方法

直线回归用于定量刻画应变量Y 对自变量X 在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X ,另一个随机变量作Y ,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。 2. 进行回归分析前应绘制散点图

(1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier ) 3. 资料的要求

直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X 可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量;

* 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同)。 4. 结果解释及正确应用

反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P 值。 P 值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。

当实际资料不能满足直线回归模型的要求而无法用最小二乘法估计回归方程时,可使用秩回归

<三>一般复习的名词:剩余标准差Sy.x <四>一般复习的问题:

1、直线相关系数的假设检验。 2、等级相关的应用条件。

3、直线相关和回归分析的联系和区别。

? (121)Y

a bX =-+

正常值范围的估计

<一>重点复习的名词:

正常人:

第X百分位数:

<二>重点复习的问题:

1、研究设计的六个方面的内容。

2、正态性检验的推断目的和正态概率纸的特点。

3、正态分布法的应用条件和估计单侧(上、下限),双侧95%正常值范围界限值的计算。

4、百分位数法的应用条件及单、双侧界限,不同百分范围时应确定的百分位数。

<三>一般复习的名词:正常值范围、假阳性错误、假阴性错误、概率单位。

<四>一般复习的问题:

1、医学正常值范围的意义

2、D检验中,查D界值表确定P值的方法。

统计表与统计图

<一>重点复习的问题:

1、根据资料正确编制统计表。

(1)标题位于表的上方,概括表的主要内容,一般需注明时间与地点。

(2)标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚。

(3)线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线。忌斜线和竖线。

(4)数字表内数据一律采用阿拉伯数字。同一指标小数点位数要一致,位次要对齐。表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“?”表示。

(5)备注不为表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。

2、对错表的评价和正确修改。

1)编制整理时,未将有联系的项目安排适当,不便说明事物之间相互的规律性。

2)分组不合理

3)有意将过高或过低的数据筛选掉或无意舍弃掉,使原始资料所提供的信息变样。

4)统计表编制不规范。

5)计算错误

3、根据资料性质和分析目的正确选用统计图类型。

<二>一般复习的问题:

1、统计表和统计图的作用。

2、各种统计图的绘制方法。

调查设计

<一>重点复习的问题:

1、搜集资料的计划内容

1)明确调查目的

2)确定调查对象和观察单位

3)确定调查方法

4)确定调查指标和变量

5)调查工具和调查表:调查工具、调查表和问卷的一般结构、问题的形式

6)确定样本含量

2、四种基本抽样调查方法的特点。

P289有表

(1) 简单随机抽样(也叫纯随机抽样)。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

(2) 等距抽样(也叫机械抽样或系统抽样)。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。

(3) 类型抽样(也叫分层抽样)。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。

(4) 整群抽样。就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。

3、样本含量估计的目的。

(1) 可以控制统计量的抽样误差,样本含量越大,标准误越小;

(2) 提高估计的精度,增大样本含量是控制可信区间的宽度的有效办法;

(3) 增大样本含量是控制统计分析中Ⅱ型错误的概率大小的有效措施;

(4) 表示抽样误差的指标(各种标准误)的抽样误差也与样本含量有关(如样本方差的方差)。

<二>一般复习的问题。

1、整理分析资料的计划内容。

2、调查表的设计。

3、样本含量估计的方法。

居民健康统计

<一>重点复习的名词:

死亡概率nqx:年龄组死亡概率(age specific probability of dying)是指X 岁尚存者在今后一年或n 年内死亡的可能性。它和年龄组死亡率不是一个概念。

生存人数lx:表示假想的同时出声的一代人中,X岁尚存者的平均人数。一般假定0~岁组的人数为l0=100000

死亡人数:指理论死亡人数记为D X。表示假象的同时出生的一代人中,X岁尚存者按死亡概率q x死于年龄组“X~X+i”的平均人数。即d x=q x×l x

预期寿命ex:这是寿命表最广泛使用的指标,是指同时出生的一代人活到X岁时,尚能生存的平均年数。ex=t x/l x

<二>一般复习的名词:寿命表、简略寿命表

<三>一般复习的问题:

1、简略寿命表的编制原理。

2、简略寿命表与去某死因寿命表的计算。

3、寿命表的分析应用。

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

(完整版)统计学期末考试试卷

2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟 一、填空题(每空1分,共15分) 1、按照统计数据的收集方法,可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密 度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为,方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、和 。 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分) 1、理论统计学与应用统计学是两类性质不同的统计学() 2、箱线图主要展示分组的数值型数据的分布。() 3、抽样极限误差可以大于、小于或等于抽样平均误差。() 4、在全国人口普查中,全国人口数是总体,每个人是总体单位。() 5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知, 仅需对分布的未知参数进行估计的问题称为参数估计。() 6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少() 7、在单因素方差分析中,SST =SSE+SSA() 8、右侧检验中,如果P值<α,则拒绝H 。() 9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量 与边际误差成正比。() 10、当原假设为假时接受原假设,称为假设检验的第一类错误。() 三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职 工家庭的年人均收入。这项研究的样本()。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时()。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值 其他 (a

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

统计学期末试题 模拟试卷一及答案

模拟试卷一:统计学期末试题 院系________姓名_________成绩________ 一.单项选择题(每小题2分,共20分) 1.对于未分组的原始数据,描述其分布特征的图形主要有() A. 直方图和折线图 B. 直方图和茎叶图 C. 茎叶图和箱线图 D. 茎叶图和雷达图 2.在对几组数据的离散程度进行比较时使用的统计量通常是() A. 异众比率 B. 平均差 C. 标准差 D. 离散系数 3.n?50的简单随机样本,样本均值的的总体中,抽出一个从均值为100、标准差为10数学期 望和方差分别为() A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2 4.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准称为() A. 无偏性 B. 有效性 C. 一致性 D. 充分性 5.根据一个具体的样本求出的总体均值95%的置信区间() A. 以95%的概率包含总体均值 B. 有5%的可能性包含总体均值 C. 一定包含总体均值 D. 可能包含也可能不包含总体均值 6.在方差分析中,检验统计量F是() A. 组间平方和除以组内平方和 B. 组间均方和除以组内均方 C. 组间平方和除以总平方和 D. 组间均方和除以组内均方 ??????y?x7.反映的是(在回归模型中,)10y x的线性变化部分的变化引起的由于A. y x的线性变化部分的变化引起的由于 B. yy x的影响C.和除的线性关系之外的随机因素对yy x的影响由于D.的线性关系对和8.在多元回归分析中,多重共线性是指模型中() A.两个或两个以上的自变量彼此相关 B.两个或两个以上的自变量彼此无关 C.因变量与一个自变量相关 D.因变量与两个或两个以上的自变量相关 9.为增长极限。描述该K若某一现象在初期增长迅速,随后增长率逐渐降低,最终则以. 类现象所采用的趋势线应为() A. 趋势直线 B. 指数曲线 C. 修正指数曲线 D. Gompertz曲线 10.消费价格指数反映了() A.商品零售价格的变动趋势和程度

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

统计学期末考试试题库和答案解析

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

统计学期末考试试题(含答案)

交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对)

相关文档
相关文档 最新文档