文档库 最新最全的文档下载
当前位置:文档库 › 生物统计学答案

生物统计学答案

生物统计学答案
生物统计学答案

第一章绪论

一、名词解释

1、总体:根据研究目的确定的研究对象的全体称为总体。

2、个体:总体中的一个研究单位称为个体。

3、样本:总体的一部分称为样本。

4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。

5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。

6、参数:由总体计算的特征数叫参数。

7、统计量:由样本计算的特征数叫统计量。

8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。

9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。

10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。

11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。

二、简答题

1、什么是生物统计?它在畜牧、水产科学研究中有何作用?

答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。

(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。

2、统计分析的两个特点是什么?

答:统计分析的两个特点是:①通过样本来推断总体。②有很大的可靠性但也有一定的错误率。

3、如何提高试验的准确性与精确性?

答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。

4、如何控制、降低随机误差,避免系统误差?

答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。系统误差是由于一些可以控制但未加控制的因素造成的,一般只要试验工作做得精细是可以消除的。避免系统误差的主要措施有:尽量保证试验动物初始条件的一致(年龄、初始重、性别、健康状况等),尽量控制饲料种类、品质、数量、饲养条件等,测量仪器要准确,标准试剂要校正,要避免观测、记载、抄录、计算中的错误。

第二章资料的整理

一、名词解释

1、数量性状资料:数量性状是指能够以量测或记数的方式表示其特征的象状,观察测定数量性状而获得的数据称为数量性状资料。

2、质量性状资料:质量性状是指能观察到而不能直接测量的性状,观察质量性状而获得的资料称为质量性状资料。

3、半定量(等级)资料:是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。

4、计数资料:指用计数方式获得的数量性状资料。

5、计量资料:指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。

6、全距(极差):是资料中最大值与最小值之差。

7、组中值:分组后每一组的中点值称为组中值,是该组的代表值。

二、简答题

1、资料可以分为哪几类?它们有何区别与联系?

答:资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中数量性状资料又包括计量资料和计数资料。区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系:三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。

2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?

答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。

(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。

②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限;每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。

3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。

4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?

答:(1)统计表用表格形式来表示数量关系;统计图用几何图形来表示数量关系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。

(2)常用的统计图有长条图、圆图、线图、直方图和折线图等。

(3)常用的统计表有简单表和复合表两大类。

(4)列统计表的注意事项:①标题要简明扼要、准确地说明表的内容,有时须注明时

间、地点。②标目分横标目和纵标目两项,横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位。③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。④表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可以省去,表的左上角一般不用斜线。

(5)绘统计图的注意事项:①标题简明扼要并列于图的下方。②纵、横两轴应有刻度,注明单位。③横轴由左至右,纵轴由上而下,数值由小到大;图形长宽比例约为5:4或6:5。④图中需用不同颜色或线条表示不同事物时应有图例说明。

第三章平均数、标准差与变异系数

一、名词解释

1、算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。

2、无偏估计:当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计。

3、几何均数:n个观测值相乘之积开n次方所得的方根称为几何均数,记为G。

4、中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值称为中位数,记为Md。

5、众数:资料中出现次数最多的那个观测值或次数最多一组的组中值称为众数,记为Mo。

6、调和平均数:资料中各观测值倒数的算术平均数的倒数称为调和平均数,记为H。

7、标准差:统计学上把样本方差S2的平方根叫做样本标准差,记做S。

8、方差:统计量Σ(x - )2/(n - 1)称为均方,又称样本方差,记为S2。

9、离均差平方和(平方和):各个观测值与平均数的离差(x - )称为离均差,各个离均差平方再求和即为离均差平方和,简称平方和,记为SS。

10、变异系数:标准差与平均数的比值称为变异系数,是衡量资料中各观测值变异程度的另一个统计量,记做C.V。

二、简答题

1、生物统计中常用的平均数有几种?各在什么情况下应用?

答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。

2、算术平均数有哪些基本性质?

答:算术平均数的两个基本性质是:①离均差之和等于零。

②离均差平方和最小。

3、标准差有哪些特性?

答:标准差的特性主要表现在四个方面:

①标准差的大小受资料中每个观测值的影响,若观测值间变异大求得的标准差也大,反

之则小。

②在计算标准差时,在各观测值加上或减去一个常数,其数值不变。

③当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。

④在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右1倍标准差( ±S)范围内;约有95.43%的观测值在平均数左右2倍标准差( ±2S)范围内;约有99.73%的观测值在平均数左右3倍标准差( ±3S)范围内。

4、为什么变异系数要与平均数、标准差配合使用?

答:变异系数是标准差与平均数的比值,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,若度量单位与平均数相同,可以直接利用标准差来比较;若单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而要用变异系数。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。

第四章常用概率分布

一、名词解释

1、必然现象:某类现象是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,这类现象称为必然现象。

2、随机现象:某类现象事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同,这类现象称为随机现象。

3、随机试验:一个试验若满足下述三个特性则称为随机试验,简称试验:①试验可以在相同条件下多次重复进行。②每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果。③每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪个结果。

4、随机事件:随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件,简称事件。

5、概率的统计定义:在相同条件下进行n次重复试验,若随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值P,那么就把P称为随机事件A的概率。这样定义的概率称为统计概率,也叫后验概率。

6、小概率原理:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,简称小概率原理。

7、随机变量:作一次试验,其结果有多种可能,每一种可能结果都可以用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用随机变量x来表示。

8、离散型随机变量:如果表示试验结果的变量x,其可能取值至多为可数个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量。

9、连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x 在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。

9、标准正态分布:μ= 0,δ2 = 1 的正态分布称为标准正态分布。

10、标准正态变量(标准正态离差):任何一个服从正态分布N(μ,δ2)的随机变量x,都可以通过标准化变换:u = (x –μ)/δ,将其变换为服从标准正态分布的随机变量u,u 称为标准正态变量。

11、双侧概率(两尾概率):随机变量x落在平均数μ加减不同倍数标准差δ区间之外的概率称为双侧概率。

12、单侧概率(一尾概率):随即变量x小于μ-kδ或大于μ+kδ的概率称为单侧概率。

13、贝努利试验:对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A 之一,在每次试验中出现A的概率是常数p(0

14、返置抽样:由总体随即抽样时,每次抽出一个个体后,这个个体还返置回原总体,则称为返置抽样。

15、不返置抽样:由总体随即抽样时,每次抽出的个体不返置回原总体,则称为不返置抽样。16标准误:即平均数抽样总体的标准差,其大小反映样本平均数的抽样误差的大小,即精确性的高低。

17、样本平均数的抽样总体:样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布,由样本平均数构成的总体称为样本平均数的抽样总体。

18、中心极限定理:若随机变量x服从正态分布N(μ,δ2),x1,x2,……,xn是由总体得来的随机样本,则统计量= Σx/n的概率分布也是正态分布,且有μ= μ,δ=δ/ n ,即服从正态分布N(μ,δ2/n);若随机变量服从平均数是μ,方差是δ2的分布(不是正态分布),x1,x2,……,xn是由总体得来的随机样本,则统计量= Σx/n的概率分布,当n相当大时逼近正态分布N(μ,δ2/n)。

二、简答题

1、事件的概率具有那些基本性质?

答:事件的概率一般具有以下三个基本性质:

①对于任何事件A,有0≤P(A) ≤1

②必然事件的概率为1,即P(Ω)=1

③不可能事件的概率为0,即P(Ф)=0

2、离散型随机变量概率分布与连续型随机变量概率分布有何区别?

答:离散型随机变量概率分布常用分布列来表示,其具有Pi ≥0和ΣPi = 1两个基本性质。连续型随机变量的概率分布不能用分布列来表示,其可能取的值是不可数的,一般用随机变量x在某个区间内取值的概率P(a ≤x )

3、标准误与标准差有何联系与区别?

答:样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是:样本标准误等于样本标准差除以根号下样本含量。二者的区别在于:样本标准差是反映样本中各观测值x1,x2,……,xn变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数1,2,……k的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。

4、样本平均数抽样总体与原始总体的两个参数间有何联系?

答:①样本平均数抽样总体的平均数等于原始总体的平均数。

②样本平均数抽样总体的标准差等于与原始总体的标准差除以根号下样本含量。

5、t分布与标准正态分布有何区别与联系?

答:t分布与标准正态分布曲线均以纵轴为对称轴,左右对称。与标准正态分布曲线相比t 分布曲线顶部略低,两尾部稍高而平;df越小这种趋势越明显。df越大,t分布越趋近于标

准正态分布,当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t分布与标准正态分布完全一致。

第五章t检验

一、名词解释

1、假设检验(显著性检验):主要包括提出无效假设和备择假设,再根据小概率实际不可能性原理来否定或接受无效假设,实际上是应用“概率性质的反证法”对试验样本所属总体所做的无效假设的统计推断。

2、无效假设:是显著性检验中被检验的假设,其意义是试验的表面效应是试验误差,处理无效,记作H0。

3、备择假设:显著性检验时在无效假设被否定时准备接受的假设,其意义是试验的表面效应是处理效应,处理有效,记做HA。

4、显著水平:显著性检验中用来确定否定或接受无效假设的概率标准叫显著水平,记做α,在生物学研究中常取α=0.05或α=0.01。

5、Ⅰ型错误:真实情况是H0成立却否定了它,犯了“弃真”错误,称为Ⅰ型错误。

6、Ⅱ型错误:真实情况是H0不成立却接受了它,犯了“纳伪”错误,称为Ⅱ型错误。

7、检验功效(检验力、把握度):犯Ⅱ型错误的概率用β表示,而1-β称为检验功效,其意义是当两总体确有差别(即HA成立)时,按α水平能发现它们有差别的能力。

8、双侧检验(双尾检验):利用两尾概率进行的检验叫双侧检验,tα为双侧检验的临界t 值。

9、单侧检验(单尾检验):利用一尾概率进行的检验叫单侧检验,此时tα为单侧检验的临界t值;显然单侧检验的tα=双侧检验的t2α。

10、非配对设计(成组设计):是指当进行只有两个处理的试验时,将试验单位完全随机地分成两组,然后对两组随机施加一个处理,两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。

11、配对设计:是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中去;配对的要求是配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差别。

12、自身配对:指同一试验单位在两个不同时间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。

13、同源配对:指将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,然后将配对的两个个体随机地实施不同处理。

14、参数估计:是统计推断的一个重要内容,就是用样本统计量来估计总体参数。

15、点估计:将样本统计量直接作为总体相应参数的估计值叫点估计。

16、区间估计:在一定概率的保证下指出总体参数的可能范围叫区间估计。

17、置信区间:区间估计时所给出的可能范围叫置信区间。

18、置信度(置信概率):区间估计时给出的概率保证称为置信度。

二、简答题

1、为什么在分析试验结果时需要进行显著性检验?检验的目的是什么?

答:通过样本来推断总体是生物统计的基本特点,即通过抽样研究用样本信息来推断总体的

特征。由一个样本平均数来估计总体平均数时,样本平均数包含抽样误差,用包含抽样误差的样本平均数来推断总体,其结论并不是绝对正确的。所以在分析试验结果时需要进行显著性检验。显著性检验的目的是通过样本对其所在的总体作出符合实际的推断,即分析试验的表面效应是由试验处理效应还是由试验误差引起的,推断试验的处理效应是否存在。

2、什么是统计假设?统计假设有哪几种?各有何含义?

答:统计假设(统计推断)是根据样本和假定模型对总体作出的以概率形式表述的推断。统计假设主要包括假设检验(显著性检验)和参数估计两个内容。假设检验(显著性检验)的含义:提出无效假设和备择假设,再根据小概率实际不可能性原理来否定或接受无效假设,实际上是应用“概率性质的反证法”对试验样本所属总体所做的无效假设的统计推断。参数估计的含义:用样本统计量来估计总体参数。

3、显著性检验的基本步骤是什么?根据什么确定显著水平?

答:1、显著性检验的基本步骤:

(1)首先对试验样本所在的总体作假设。

(2)在无效假设成立的前提下,构成合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率。

(3)根据“小概率实际不可能性原理”否定或接受无效假设。

2、确定显著水平的标准通常采用小概率事件的标准,即0.05和0.01。选择显著水平应根据试验的要求或试验结论的重要性而定。若试验中难以控制的因素较多,试验误差可能较大,则显著水平标准可选低些,即α值取大些;反之若试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平标准应高些,即α值取小些。

4、什么是统计推断?为什么统计推断的结论有可能发生错误?有哪两类错误?如何降低两类错误?

答:(1)统计推断是根据样本和假定模型对总体作出以概率形式表述的推断。

(2)统计推断是根据“小概率实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设都没有100%的把握,会发生错误。

(3)在检验无效假设H0时可能犯两种错误,其中真实情况是H0成立却否定了它,犯了“弃真”错误,称为Ⅰ型错误;真实情况是H0不成立却接受了它,犯了“纳伪”错误,称为Ⅱ型错误。

(4)犯Ⅰ型错误的概率用α表示,犯Ⅱ型错误的概率用β表示。α即是显著水平,β的大小与α值的大小有关,所以在选用检验的显著水平时应考虑犯Ⅰ、Ⅱ型错误所产生后果严重性的大小,还应考虑到试验的难以及试验结果的重要程度。降低α值可降低犯Ⅰ型错误的概率但会加大犯Ⅱ型错误的概率(在其他因素确定时,α值越小β值越大)。若一个试验耗费大,可靠性要求高,不允许反复,或试验结论的使用事关重大,容易产生严重后果,α值应取小些;对于一些试验条件不易控制、试验误差较大的试验α值取大些。同时,在提高显著水平即减小α值时,为了减小犯Ⅱ型错误的概率可适当增大样本含量。

5、双侧检验、单侧检验各在什么条件下应用?二者有何关系?

答:(1)选用双侧检验还是单侧检验应根据专业知识及问题的要求在试验设计时确定。一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的在于推断两个处理效果有无差别,则选用双侧检验;若根据理论知识或试验经验判断甲处理的效果不会比乙处理的效果差(或相反),分析的目的在于推断甲处理是否比乙处理好(或差),则用单侧检验。一般情况

下不做特殊说明均用双侧检验。

(2)二者的关系:单侧检验的tα=双侧检验的t2α,可见双侧检验显著单侧检验一定显著,单侧检验显著双侧检验未必显著。

6、进行显著性检验应注意什么问题?如何理解显著性检验结论中的“差异不显著”、“差异显著”、“差异极显著”?

答:(1)显著性检验中应注意的问题:

①为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的,并且处理要有可比性,即除比较的处理外,其他影响因素应尽可能控制相同或基本接近。

②选用的显著性检验方法应符合其应用条件。

③要正确理解差异显著或极显著的统计意义。

④合理建立统计假设,正确计算检验统计量。

⑤结论不能绝对化。

⑥报告结论时应列出,由样本算得的检验统计量值,注明是单侧检验还是双侧检验,并写出P值的确切范围,如0.01

(2)显著性检验结论中的“差异不显著”表示P>0.05,接受H0,否认HA,处理无效,记作“ns”;“差异显著”表示0.010,接受HA,处理有效,记作“*”;“差异极显著”表示P≤0.01,更加否认H0,接受HA,处理有效,嘉作“**”。

7、配对试验设计与非配对试验设计有何区别?

答:非配对设计(成组设计)是指当进行只有两个处理的试验时,将试验单位完全随机地分成两组,然后对两组随机施加一个处理,两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中去。非配对设计要求试验单位尽可能一致,配对设计要求配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差别。一般说来,相对于非配对设计,配对设计能够提高试验的精确性。

第六章方差分析

一、名词解释

1、方差分析:是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应的不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等。

2、试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。

3、试验因素:试验中所研究的影响试验指标的因素叫试验因素。

4、因素水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。

5、试验处理:事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。

6、试验单位:在试验中能接受不同试验处理的独立的试验载体叫试验单位。

7、重复:在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复。

8、多重比较:方差分析差异显著或极显著时,进行多个平均数两两间的相互比较称为多重比较。

9、主效应:由于因素水平的改变而引起的平均数的改变量称为主效应。

10、简单效应:在某因素同一水平上,另一因素不同水平对试验指标的影响称为简单效应。

11、交互作用:在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,这种现象称为该两因素存在交互作用。

二、简答题

1、多个处理平均数间的相互比较为什么不宜用t检验法?

答:主要有三方面的原因:

①检验过程烦琐。若有k个处理,则要做Ck2次检验。

②无统一的试验误差,误差估计的精确性和检验的灵敏性低。

③推断的可靠性低,检验的Ⅰ型错误率大,主要是由于没有考虑相互比较的两个平均数的秩次问题。

2、方差分析在科学研究中有何意义?

答:t检验法适用于样本平均数与总体平均数及两个样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需要进行多个平均数间的差异显著性检验,而此时采用t检验法是不适宜的。而方差分析是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应的不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等,其实质上关于观测值变异原因的数量分析,在科学研究中应用十分广泛。

3、方差分析的基本假定是什么?

答:方差分析的基本假定(前提)也是单因素方差分析的数学模型,包括效应的可加性、分布的正态性、方差的同质性;一般而言,具有了方差的同质性,同时就具有效应的可加性和分布的正态性。

4、进行方差分析的基本步骤为何?

答:(1)计算各项平方和与自由度。

(2)列出方差分析表,进行F检验。

(3)若F检验显著,则进行多重比较。

5、多个平均数相互比较时,LSD法与一般t检验法相比有何优点?还存在什么问题?如何决定选用哪种多重比较法?

答:(1)多个平均数相互比较时,LSD法与一般t检验法相比的优点:利用F检验中的误差自由度dfe查临界tα值,利用误差均方MSe计算均数差异标准误,解决了t检验法检验方法中过程烦琐、无统一的试验误差且估计误差的精确性和检验的灵敏性低的问题。

(2)存在的问题:未解决推断的可靠性低、犯Ⅰ型错误的概率变大的问题。

(3)常用的多重比较的方法有LSD法、新复极差法和q检验法,其检验尺度的关系是LSD法≤新复极差法≤q检验法。一般而言,一个试验资料究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。若否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用q检验法较为妥当;若接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法;生物试验中由于试验误差较大,常采用新复极差法;为了简便有时可采用LSD法。

6、为什么说两因素交叉分组单独观测值的试验设计是不完善的试验设计?在多因素试验时,如何选取最优水平组合?

答:(1)单因素试验只能解决一个因素各水平之间的比较问题,而科学研究中往往需要同时考察多个因素,这样才能作出更加符合客观实际的科学结论,才有更大的应用价值。两因素试验资料的方差分析就是对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素交叉分组单独观测值的试验设计只适用于两个因素间无交互作用的情况;若两因素间有交互作用,则每个水平组合只设一个试验单位的试验设计是不正确的或不完善的。

(2)以两因素为例说明在多因素试验时选取最优水平组合的原则:若A、B因素交互作用不显著,则可从A、B因素主效应检验中分别选出A、B因素的最优水平相组合,得到最优水平组合;若A、B因素交互作用显著,则应进行水平组合平均数间的多重比较,以选出最优水平组合,同时可进行简单效应的检验。

7、两因素系统分组资料的方差分析与交叉分组资料的方差分析有何区别?

答:(1)两因素交叉分组:设试验考察因素A、B两个因素,A因素分a个水平,B因素分b 个水平,A因素每个水平与B因素每个水平都要碰到,两者交叉搭配形成ab个水平组合即处理,试验因素A、B在试验中处于平等地位,试验单位分成ab个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。

(2)两因素系统分组:在安排两因素试验方案时,将A因素分为a个水平,在A因素每个水平Ai下又将B因素分成b个水平,这样得到两因素水平组合的方式称为系统分组。在系统分组中,首先划分水平的因素叫一级因素,其次划分水平的因素叫二级因素,类此还有三级因素等;在系统分组中,次级因素的各水平套在一级因素的每个水平下,它们之间是从属关系而不是平等关系,分析侧重于一级因素

第七章次数资料分析—卡方检验

一、名词解释

1、c2的连续性矫正:由c2值计算公式计算的c2 只是近似地服从连续型随机变量c2 分布,在对次数资料进行c2 检验利用连续型随机变量c2 分布计算概率时,常常偏低,特别是当自由度为1时偏差较大,此时需要将c2 值矫正为较小的c2 C值,称为c2 的连续性矫正。

2、适合性检验:判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验称为适合性检验。

3、c2 检验的再分割法:当c2 检验为差异显著或差异极显著时,有必要进一步检验确定哪样表现型的实际观察次数与理论次数不符合,此时采用c2检验的再分割法;将一张列联表的总c2 统计量,分割为数目等于该表总自由度的多个分量,每个分量的c2 值对应于由原始数据所产生的一特殊列联表,且每个分量独立于其他分量,这样各分量的c2 值之和等于总c2 值。

4、独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验称为独立性检验。

二、简答题

1、c2 检验与t检验、F检验在应用上有什么区别?

答:t检验、F检验是计量资料的统计分析方法,c2 是对次数资料和等级资料进行统计分析

的方法。

2、适合性检验和独立性检验有何区别?

答:(1)研究目的不同。

(2)独立性检验的次数资料是按两因子属性类别进行归组,而适合性检验只按某一因子的属性类别将次数资料归组。

(3)适合性检验按已知的属性分类理论或学说计算理论次数,独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。

(4)在适合性检验中确定自由度时df=k-1(k为属性类别数),独立性检验中确定自由度是df=(r-1)(c-1),其中r为横行属性类别数,c为直列属性类别数。

3、什么情况下c2 检验需作矫正?如何矫正?什么情况下先将各组合并后再作检验?

答:(1)由c2 值计算公式计算的只是近似地服从连续型随机变量c2 分布,在对次数资料进行c2 检验利用连续型随机变量c2 分布计算概率时,c2 常常偏低,特别是当自由度为1时偏差较大,此时需要将c2 值矫正。

(2)用矫正公式将c2 矫正为较小的c2 C,矫正公式为c2C=Σ(∣A-T∣-0.5)2/T

(3)主要是在用适合性检验来判断实际观测得来的资料是否服从某种理论分布(正态分布、二项分布、泊松分布)时,当组段内理论次数小于5时,必须与相邻组段进行合并,直至合并的理论次数大于5时为止。

4、在什么情况下需应用c2检验的再分割法?如何对总c2 值进行分割?

答:当c2检验为差异显著或差异极显著时,有必要进一步检验确定哪样表现型的实际观察次数与理论次数不符合,此时采用c2 检验的再分割法。再分割的方法:将一张列联表的总c2 统计量,分割为数目等于该表总自由度的多个分量,每个分量的c2 值对应于由原始数据所产生的一特殊列联表,且每个分量独立于其他分量,这样各分量的c2 值之和等于总c2 值。

第八章直线回归与相关

一、名词解释

1、相关变量:变量间的关系不存在完全的确定性关系,但都存在十分密切的关系,统计中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。

2、回归分析:相关变量间为因果关系,即一个变量的变化受另一或几个变量的影响,研究呈因果关系的相关变量间的关系称回归分析。

3、一元回归分析:回归分析中表示原因的变量称为自变量,表示结果的变量称为依变量,一个自变量与一个依变量的回归分析称为一元回归分析。

4、多元回归分析:回归分析中表示原因的变量称为自变量,表示结果的变量称为依变量,多个自变量与一个依变量间回归分析称为多元回归分析。

5、相关分析:研究呈平行关系的相关变量之间的关系称为相关分析。

6、简单相关分析(直线相关分析):对两个变量间的直线关系进行相关分析称为简单相关分析。

7、复相关分析:对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析。

8、偏相关分析:研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。

9、样本回归系数:建立直线回归方程=a + bx,其中b叫样本回归系数,表示x改变一个单位y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y 的程度。

10、样本回归截距:建立直线回归方程=a + bx,其中a叫做样本回归截距,是回归直线与y轴交点的纵坐标。

11、离回归标准误:根据使偏差平方和Σ(y - )2最小建立直线回归方程,偏差平方和

Σ(y - )2的大小表示了实测点与回归直线偏离的程度,又称为离回归平方和,离回归平方和的平方根叫离回归标准误。

12、决定系数:比值Σ(-y)2/Σ(y - y)2叫做x对y的决定系数,记做r2,决定系数的大小表示了回归方程估测可靠程度的高低,即表示了回归直线拟合度的高低。

13、相关系数:决定系数r2的平方根称为x与y的相关系数,记为r,表示了y与x的直线相关的程度与性质。

二、简答题

1、回归截距、回归系数与回归估计值的统计意义是什么?

答:建立直线回归方程=a + bx,其中a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时=a;b叫样本回归系数,表示x改变一个单位y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;回归估计值,是当x在其研究范围内取某一个值时,y值平均数取α+βx估计值。

2、决定系数、相关系数的意义是什么?如何计算?

答:(1)决定系数的大小表示了回归方程估测可靠程度的高低,即表示了回归直线拟合度的高低,记作r2,r2 =Σ(-y)2/Σ(y - y)2。

(2)相关系数表示了y与x的直线相关的程度与性质,记为r,r的计算方法是决定系数r2的平方根。

3、直线相关系数与回归系数的关系如何?直线相关系数与配合回归直线有何关系?

答:(1)直线相关系数与回归系数的关系可以表示为b=r×(sy/sx)或r=b×(sx/sy)。

(2)直线相关分析不区分自变量与依变量,侧重于揭示它们之间的联系程度和性质,即计算出相关系数;进行显著性检验时,相关系数显著则回归系数也显著,相关系数不显著则回归系数必然不显著。利用查表法对相关系数进行检验十分简便,在实际进行直线回归分析时,可用相关系数显著性检验代替直线回归关系显著性检验;即可先计算出相关系数r并对其进行显著性检验,若检验结果r不显著,则不用再建立直线回归方程;若r显著,在计算回归系数b、回归截距a,建立直线回归方程,此时所建立的直线回归方程代表的直线关系是真实的,可用来进行预测和控制。

第九章多元线性回归与多项式回归*

一、名词解释:多元回归分析、多元线性回归分析、偏回归系数、复相关系数、最优多元线性回归方程、标准偏回归系数(通径系数)

二、简答题

1、如何建立多元线性回归方程?偏回归系数有何意义?

2、多元线性回归的显著性检验包含哪些内容?如何进行?

3、在多元线性回归分析中,如何剔除不显著的自变量?怎样重新建立多元线性回归方程?第十章非参数检验

一、名词解释

1、非参数检验:是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知;主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不是对总体分布的参数如平均数、标准差等进行统计推断。

2、符号检验:是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小;每对数据之差为正值用“+”表示,负值用“-”表示,若两个总体分布位置相同,则正或负出现的次数应该相等;若不完全相等,至少不应相差过大;超过一定的临界值就认为两个样本所来自的来年各个总体差异显著,分布的位置不同。

3、秩和检验(符号秩和检验):是一种改进的符号检验,其统计效率远较符号检验高,;除了比较各对数据差值的符号外,还要比较各对数据差值大小的秩次高低;将观测值按由大到小的次序排列,编定秩次,求出秩和进行假设检验。

4、等级相关分析:是常用的分析两个变量间是否相关的非参数法,分析x、y两个变量的等级间是否相关;先按x、y两变量的大小次序,分别由于小到大编上等级(秩次),再看两个变量的等级间是否相关。

5、等级相关系数:也称为秩相关系数,样本等级相关系数记为rs,具有与相关系数r相同的特性,值介于-1和1之间,表示两个变量等级间相关的性质和程度。

二、简答题

1、参数检验与非参数检验有何区别?各有什么优缺点?

答:(1)参数检验要求总体服从一定的分布(如t检验和F检验都要求总体服从正态分布),对总体参数的检验是建立在这种分布基础上的,以推断两个或多个总体平均数是否相等。非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知;主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不是对总体分布的参数如平均数、标准差等进行统计推断。当样本所属总体分布无法肯定或明显偏态分布时常用非参数检验。

(2)参数检验的优点是充分利用样本内所有的数量信息,检验的效率高于非参数检验。非参数检验的优点是计算简便、直观、易于掌握及检验速度较快。

2、为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?

3、两样本比较的秩和检验的检验假设是否可用表示?为什么?

第十一章试验设计

一、名词解释

1、试验设计:试验设计狭义的理解是指试验单位(如动物试验的畜、禽)的选取、重复数目的确定及试验单位的分组,生物统计中的试验设计主要是指狭义的试验设计。

2、试验方案:是指根据试验目的与要求而拟定的进行比较的一组试验处理的总称,是整个试验工作的核心部分。

3、完全方案:是多因素试验方案中的一种,在列出因素水平组合(即处理)时,要求每一个因素的水平都要碰见一次,这时,水平组合数等于各个因素水平数的乘积。

4、不完全方案:也是多因素试验方案的一种,是将试验因素的某些水平组合在一起形成少数几个水平组合,其目的在于探讨试验因素中某些水平组合的综合作用,而不在于考察试验因素对试验指标的影响和交互作用;这种在全部水平中挑选部分水平组合获得的方案称为不完全方案。

5、唯一差异原则:是指在进行处理间比较时,除了试验处理不同外,其他所有条件应当尽量一致或相同,使其具有可比性,使处理间的比较结果可靠。

6、局部控制:是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非试验因素尽量一致。

7、完全随即设计:是根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不同的试验处理;当试验条件特别是试验动物的初始条件比较一致时可采用完全随机化设计,其应用了重复和随机化两个原则。

8、随机单位组设计:也叫随机区组(或窝组)设计,是根据局部控制的原则,如将同窝、同性别、体重基本相同的动物划归一个单位组,每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配到各处理组,这种设计称为随机单位组设计。

9、拉丁方:以n个拉丁字母A、B、C、…、为元素,作一个n阶方阵,若这n个拉丁字母在这n阶方阵的每一行,每一列都出现且只出现一次,则称该n阶方阵为n×n阶拉丁方。

10、标准型拉丁方:拉丁方中第一行与第一列的拉丁字母按自然顺序排列的拉丁方称为标准型拉丁方。

11、拉丁方设计:是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组,是比随机单位组设计多一个单位组的设计,在此设计中试验处理数=横行单位组数=直列单位组数。

13、系统抽样(机械抽样):也称为顺序抽样,先将有限总体内的每个个体按其自然状态编号,然后根据调查所需的数量,按一定间隔顺序抽样,此法简便易行,适合于个体分布均匀的总体。

14、分等按比例随机抽样:又称分层按比例随机抽样,先按某些特征或变异原因将抽样总体分成若干等次(层次),在各等次(层次)内按其占总体的比例随机抽得各等次(层次)的样本,然后将各等次(层次)抽取的样本合并在一起即为整个调查样本。

15、随机群组抽样:此种抽样是把总体划分成若干个群组,然后以组群为单位随机抽样,即每次抽样的不是一个个体,而是一群动物,每次抽取的群体可大小不等,但应对被抽取群体的每一个个体逐一进行调查。

16、多级随机抽样:当调查的总体很大、并可以系统分组时,常采用多级随机抽样的方法,可分为初级抽样单位、二级抽样单位、三级抽样单位等,多级抽样可以估计各级的抽样误差和探讨合理的抽样方案。

二、简答题

1、动物试验的任务是什么?动物试验计划包括哪些内容?

答:(1)动物试验的主要任务在于研究、揭示和掌握动物生长发育规律以及这些规律与饲养管理、环境条件等的关系。通过试验,鉴定新的动物品种(系),探索新的饲料配方,饲养管理方法和技术措施,找出其中的规律,并将这些规律应用到生产实践中去,以解决畜牧业、水产业等生产中存在的问题,进一步提高产品的质量和数量,取得更大上午经济效益和社会效益,从而推动畜牧业、水产业等事业的发展。

(2)动物试验计划的内容一般包括:1、课题名称与试验目的。2、研究依据、内容及预期达到的经济技术指标。3、试验方案和试验设计方法。4、供试动物的数量及要求。5、试验记录的项目与要求。6、试验结果分析与效益估算。7、已具备的条件和研究进度的安排。

8、试验所需的条件。9、研究人员分工。10、试验的时间、地点和工作人员。11、成果鉴定及撰写学术论文。

2、如何拟定一个正确的试验方案?

答:拟定一个正确的、切实可行的试验方案应主要考虑:1、根据试验的目的、任务和条件挑选试验因素。2、根据各试验因素的性质分清水平间差异。主要包括(1)水平的数目要适当。(2)水平间的差异要合理。(3)试验方案中各因素水平的排列要灵活掌握。3、试验方案中必须设立作为比较标准的对照。4、试验处理(包括对照)之间应遵循惟一差异原则。5、有的试验要设置预试期。

3、产生试验误差的主要原因是什么?如何避免系统误差、降低随机误差?

答:产生试验误差主要原因包括:1、供试动物固有的差异。2、饲养管理不一致所引起的差异。3、环境条件的差异。4、由一些随机因素引起的偶然差异。

4、试验设计应遵循哪三条基本原则?这三条基本原则的相互关系与作用为何?

5、常用的试验设计方法有哪几种?各有何优缺点?各在什么情况下应用?

6、调查研究中常用的抽样方法有哪几种?各适用于什么情况?

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

相关文档
相关文档 最新文档