文档库 最新最全的文档下载
当前位置:文档库 › SPSS17.0在生物统计学中的应用-实验五、方差分析报告 六、简单相关与回归分析报告

SPSS17.0在生物统计学中的应用-实验五、方差分析报告 六、简单相关与回归分析报告

SPSS17.0在生物统计学中的应用-实验五、方差分析报告   六、简单相关与回归分析报告
SPSS17.0在生物统计学中的应用-实验五、方差分析报告   六、简单相关与回归分析报告

SPSS在生物统计学中的应用

——实验指导手册

实验五:方差分析

一、实验目标与要求

1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理

2.掌握方差分析的过程。

3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。

二、实验原理

在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。

方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。

方差分析有3个基本的概念:观测变量、因素和水平。

●观测变量是进行方差分析所研究的对象;

●因素是影响观测变量变化的客观或人为条件;

●因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销

量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。

?根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;

?根据因素个数,可分为单因素方差分析和多因素方差分析。

在SPSS中,有One-way ANOV A(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单变量方差分析。

三、实验演示内容与步骤

㈠单变量-单因素方差分析

单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way ANOV A过程。

采用One-way ANOV A过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。

【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。试利用这些数据对4种饲料对仔猪

增重效果的差异进行检验。

x 饲料日增重(g)均值i

A 57 37 54 42 60 50

B 13 39 41 33 19 29

C 13 15 13 29 20 18

D 18 24 38 22 13 23

合计600 μ= x=30

打开数据文件“单因素方差分析数据-1.xls”。在SPSS中实验该检验的步骤如下:

?步骤1:选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。

图 5.1 One-Way ANOV A 对话框

?单击两两比较按钮,如图5.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。

方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。

图 5.2 两两比较对话框

假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。

?LSD。使用t 检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。

?Bonferroni。使用t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的

错误率除以检验总数来控制总体误差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。

?Sidak。基于t 统计量的成对多重比较检验。Sidak 调整多重比较的显著性水平,并提供比Bonferroni

更严密的边界。

?Scheffe。为均值的所有可能的成对组合执行并发的联合成对比较。使用F 取样分布。可用来检查组

均值的所有可能的线性组合,而非仅限于成对组合。

?R-E-G-W F。基于F 检验的Ryan-Einot-Gabriel-Welsch 多步进过程。

?R-E-G-W Q。基于学生化范围的Ryan-Einot-Gabriel-Welsch 多步进过程。

?S-N-K.使用学生化的范围分布在均值之间进行所有成对比较。它还使用步进式过程比较具有相同样

本大小的同类子集内的均值对。均值按从高到低排序,首先检验极端差分。

?Tukey。使用学生化的范围统计量进行组间所有成对比较。将试验误差率设置为所有成对比较的集合

的误差率。

?Tukey's b。使用学生化的范围分布在组之间进行成对比较。临界值是Tukey's 真实显著性差异检验

的对应值与Student-Newman-Keuls 的平均数。

?Duncan。使用与Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较,但要为检验

的集合的错误率设置保护水平,而不是为单个检验的错误率设置保护水平。使用学生化的范围统计量。

?Hochberg's GT2。使用学生化最大模数的多重比较和范围检验。与Tukey's 真实显著性差异检验相似。

?Gabriel。使用学生化最大模数的成对比较检验,并且当单元格大小不相等时,它通常比Hochberg's

GT2 更为强大。当单元大小变化过大时,Gabriel 检验可能会变得随意。

?Waller-Duncan。基于t 统计的多比较检验;使用Bayesian 方法。

?Dunnett。将一组处理与单个控制均值进行比较的成对多重比较t 检验。最后一类是缺省的控制类

别。另外,您还可以选择第一个类别。双面检验任何水平(除了控制类别外)的因子的均值是否不

等于控制类别的均值。<控制检验任何水平的因子的均值是否小于控制类别的均值。>控制检验任何水平的因子的均值是否大于控制类别的均值。

这里选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。

未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。

?Tamhane's T2。基于t 检验的保守成对比较。当方差不相等时,适合使用此检验。

?Dunnett's T3。基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。

?Games-Howell。有时会变得随意的成对比较检验。当方差不相等时,适合使用此检验。

?Dunnett's C。基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。

这里选择Tamhane’s T2检验法、Dunnett's T3检验法。

Significance level输入框中用于输入多重比较检验的显示性水平,默认为5%。

?单击【选项】按钮,弹出options子对话框,如图所示。在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。

图 5.3 “选项”子对话框

?统计量。

描述性。计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最小值、最大值和95% 置信区间。

固定和随机效果。显示固定效应模型的标准差、标准误和95% 置信区间,以及随机效应模型的标准误、95% 置信区间和成分间方差估计。

方差同质性检验。计算Levene 统计量以检验组方差是否相等。该检验独立于正态的假设。

Brown-Forsythe。计算Brown-Forsythe 统计量以检验组均值是否相等。当方差相等的假设不成立时,这种统计量优于 F 统计量。

Welch。计算Welch 统计量以检验组均值是否相等。当方差相等的假设不成立时,这种统计量

优于 F 统计量。

?均值图。显示一个绘制子组均值的图表(每组的均值由因子变量的值定义)。

?缺失值。控制对缺失值的处理。

按分析顺序排除个案。给定分析中的因变量或因子变量有缺失值的个案不用于该分析。而且,也不使用超出为因子变量指定的范围的个案。

按列表排除个案。因子变量有缺失值的个案,或包括在主对话框中的因变量列表上的任何因变量的值缺失的个案都排除在所有分析之外。如果尚未指定多个因变量,那么这个选项不起作用。?在主对话框(单因素方差分析对话框)中点击ok按钮,可以得到单因素分析的结果。

实验结果分析:

表5.1 资料描述性统计表

表5.2 方差齐性检验表

Tamhane、Dunnett T3

表5.5 多重比较检验结果- Student-Newman-Keuls a法、Duncan a法

㈡单变量-多因素方差分析

例7.1 为了比较3种不同饲料配方对4种不同品种的增重效果,从每个品种猪中随机抽取了3头体重相同的仔猪,分别随机饲喂不同的饲料,3个月后的增重效果(kg/头)如下。试分析不同饲

打开数据文件“两因素方差分析数据-无重复数据.xls”。在SPSS中实验该检验的步骤如下:

?步骤1:选择菜单【分析】→【一般线性模型】→【单变量...】,弹出“单变量”对话框

图 5.5 “单变量”对话框

依次将观测变量“增重”销量移入因变量列表框,将因素变量“品种”、“饲料”移入固定因子列表框。 单击【模型】按钮,弹出“模型”对话框,如图5.6

图 5.6 “模型”对话框

●指定模型:

全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。它不包含协变量交互。

选择定制可以仅指定其中一部分的交互或指定因子协变量交互。必须指定要包含在模型中的所有项。

●因子与协变量。列出因子与协变量。

●模型:模型取决于数据的性质。选择定制之后,您可以选择分析中感兴趣的主效应和交互效应。

●平方和:计算平方和的方法。对于没有缺失单元的平衡或非平衡模型,类型III 平方和方法最常用。

●在模型中包含截距:模型中通常包含截距。如果您可以假设数据穿过原点,则可以排除截距。

●构建项:对于选定因子和协变量:

交互。创建所有选定变量的最高级交互项。这是缺省值。

主效应。为每个选定的变量创建主效应项。

所有二阶。创建选定变量的所有可能的二阶交互。

所有三阶。创建选定变量的所有可能的三阶交互。

所有四阶。创建选定变量的所有可能的四阶交互。

所有五阶。创建选定变量的所有可能的五阶交互。

●平方和: 对于该模型,您可以选择平方和类型。类型III 最常用,并且是缺省类型。

类型I:此方法也称为平方和分级解构法。在模型中,每一项只针对它前面的那项进行调整。类型

I 平方和常用于:

平衡ANOV A 模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效应在任何

二阶交互效应之前指定,依此类推。

多项式回归模型,其中任何低阶项在任何高阶项之前指定。

纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应嵌套在第

三个指定的效应中,依此类推。(此嵌套形式只能通过使用语法来指定。) 类型II:此方法在为所有其它“相应的”效应进行调节的模型中计算某个效应的平方和。相应的效应是指,与所有效应(不包含正被检查的效应)相对应的效应。类型II 平方和方法常用于:

平衡ANOV A 模型。

任何只有主要因子效应的模型。

任何回归模型。

纯嵌套设计。(此嵌套形式能通过使用语法来指定。)

类型III:缺省类型。此方法在设计中通过以下形式计算某个效应的平方和:为任何不包含该效应的其他效应,以及任何与包含该效应正交的效应(如果存在)调整的平方和。类型III 平方和具有一个主要优点,那就是只要可估计性的一般形式保持不变,平方和对于单元频率就保持不变。因此,我们常认为此类平方和对于不带缺失单元格的不平衡模型有用。在不带缺失单元的因子设计中,此方法等同于Yates 加权均值平方方法。类型III 平方和法常用于:

任何在类型I 和类型II 中列出的模型。

任何不带空白单元的平衡或非平衡模型。

类型IV:此方法针对存在缺失单元的情况设计。对于设计中的任何效应F,如果任何其它效应中不包含F,则类型IV = 类型III = 类型II。当F 包含在其它效应中时,则类型IV 将F 中的参数中正在进行的对比相等地分配到所有较高水平的效应。类型IV 平方和法常用于:

任何在类型I 和类型II 中列出的模型。

任何带有空白单元的平衡或非平衡模型。

◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【对比】按钮,弹出“单变量:对比”对

话框,可对指定的因子变量不同水平进行多种方式的比较,

图 5.7 “单变量:对比”对话框

由于生物统计学的分析,主要是对每个影响因子的不同水平进行多重比较,及交互作用检验,在“模型”、“两两对比”、“选项”三项中进行选择设置即可满足需要,故此项通常保持默认设置,即不做相关对比。

◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【绘制】按钮,弹出“单变量:轮廓图”对

话框,可对指定的因子变量之间是否存在交互作用进行直观分析。

可任选一个因子作为水平轴取值,对另一个因子的不同水平取值的线性变化进行显示,若呈现“平行”相,则说明两个因子没有交互作用,若呈现“交叉相”,则说明两个因子有交互作用。

将“品种”选入水平轴框,将“饲料”选入单图框,点击“添加”,将所做选择确定。

图 5.8 “单变量:轮廓图”对话框

◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【两两比较】按钮,弹出“单变量:观测

均值的两两比较”对话框,可对指定的因子变量各水平之间因变量均值的显著差异性进行检验,只有在方差分析表明该变量的不同水平间的差异主要是处理效应的前提下,此项比较才有意义。

图 5.9 “单变量:观测均值的两两比较”对话框

选择最常用的LSD检验法、S-N-K检验法、Duncan检验法。

◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【保存】按钮,弹出“单变量:保存”对

话框,可以在数据编辑器中将模型预测的值、残差和相关测量另存为新变量。这些变量中有许多可用于检查关于数据的假设。要保存供另一SPSS Statistics 会话中使用的值,您必须保存当前数据文件。

图 5.10 “单变量:保存”对话框

由于生物统计学的分析,通常不对此项做选择,保持默认设置。

点击【继续】按钮,返回主对话框(“单变量”对话框),点击【选项】按钮,弹出“单变量:选项”对话框。此对话框中有一些可选统计量。统计量是使用固定效应模型计算的。

图 5.11 “单变量:选项”对话框

估计边际均值:选择您需要的单元中的总体边际均值估计的因子和交互作用。为协变量(如果存在)调整这些均值。

比较主效应。对于主体间和主体内因子,为模型中的任何主效应提供估计边际均值未修正的成对比较。

只有在“显示以下项的均值”列表中选择了主效应的情况下,此项才可用。

置信区间调节。选择最小显著性差异(LSD)、Bonferroni 或对置信区间和显著性的Sidak 调整。此项只有在选择了比较主作用的情况下才可用。

输出:

描述统计:以生成所有单元中的所有因变量的观察到的均值、标准差和计数。

功效估计:给出了每个作用和每个参数估计值的偏eta 方值。eta 方统计量描述总变异性中可归因于某个因子的部分。

检验效能:当基于观察到的值设置备用假设时,选择检验效能可获取检验的效能。

参数估计:选择参数估计可为每个检验生成参数估计值、标准误、t 检验、置信区间和检验效能。

对比系数矩阵:选择对比系数矩阵可获取L 矩阵。

齐性检验:为跨主体间因子所有水平组合的每个因变量生成Levene 的方差齐性检验(仅对于主体间因子)。

分布-水平图和残差图:选项对于检查关于数据的假设很有用。如果不存在任何因子,则禁用此项。

残差图:选择残差图可为每个因变量生成观察-预测-标准化残差图。这些图对于调查方差相等的假设很有用。

失拟:选择失拟可检查因变量和自变量之间的关系是否能由模型充分地描述。常规可估计函数允许您基于常规可估计函数构造定制的假设检验。任何对比系数矩阵中的行均是常规可估计函数的线性组合。显著性水平。您可能想要调整用在两两比较检验中的显著性水平,以及用于构造置信区间的置信度。指定的值还用于计算检验的检验效能。如果指定了显著性水平,则相关联的置信区间度会显示在对话框中。

生物统计学的分析,主要是对每个影响因子的不同水平进行多重比较,及交互作用检验,在“选项”中选择“描述统计”、“齐性检验”即可满足需要,故此项通常保持默认设置,即不做相关对比。

◆点击【继续】按钮,返回主对话框(“单变量”对话框),点击【确定】按钮后,结果输出窗口看分析结

果。

表5.6 方差分析表

表5.6可知,品种各水平间效应值的变异主要是处理效应造成的,可进行多重比较;饲料各水平间效应值的变异主要是处理效应造成的,也可进行多重比较。

从表5.7可知,增重效果由大到小依次是2号、1号、3号、4号,各品种之间增重效果均达到了显著性差异。

从表5.8可知,增重效果由大到小依次是2号、3号、1号,各饲料之间增重效果差异,2号和1号之间达到了显著性。

从图5.8可知,品种与饲料间存在着一定的交互作用。

实验六:简单相关与回归分析

一、实验目标与要求

1.帮助学生深入了解线性及回归的基本概念,掌握线性相关与回归分析的基本思想和原理

2.掌握线性相关与回归分析的过程。

二、实验原理

1.相关分析的统计学原理

相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Pearson简单相关系数。

2.回归分析的统计学原理

相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。

三、实验演示内容与步骤

㈠两个变量间的简单相分析

【课本例】现有10头动物体重与饲料消耗量的数据如下,试建立饲料消耗量对体重的回归方

打开数据文件“线性相关与回归分析数据.xls”,依次选择“【分析】→【相关】→【双变量】”打开“双变量”对话框如图,将待分析的2个指标移入右边的变量列表框内。其他均可选择默认项。

图 6.1 “双变量”对话框

选择两个或更多数值型变量。还可以使用以下选项:

相关系数。对于正态分布的定量变量,请选择Pearson 相关系数。如果您的数据不是正态分布的,或具有已排序的类别,请选择Kendall 的tau-b 或Spearman,后两者度量秩次之间的相关性。相关系数的值范围为–1(完全负相关)到+1(完全正相关)。0 值表示没有线性关系。在解释结果时请小心谨慎,不要因显著的相关性而得出任何因果结论。

显著性检验。您可以选择双尾概率或单尾概率。如果预先已知关联的方向,请选择单尾。否则,请选择双尾。

标记显著性相关。用一个星号来标识显著性水平为0.05 的相关系数,用两个星号来标识显著性水平为

0.01 的相关系数。

单击【选项】按钮,弹出“双变量相关性:选项”对话框,选择“均值和标准差”,

图 6.2 “双变量相关性:选项”对话框

统计量。对于Pearson 相关性,您可以选择以下一项或两项:

均值和标准差。为每个变量显示。还显示具有非缺失值的个案数。无论缺失值设置如何,都将逐变量处理缺失值。

叉积偏差和协方差。为每对变量显示。偏差的叉积等于校正均值变量的乘积之和。这是Pearson 相关系数的分子。协方差是有关两个变量之间关系的一种非标准化度量,等于叉积偏差除以N–1。

缺失值。您可以选择以下选项之一:

按对排除个案。会从分析中排除对其计算相关系数的一对变量中一个或两个含有缺失值的个案。由于每个系数均基于对特定变量对具有有效代码的所有个案,因此在每次计算中会使用可用的最大信息量。这可能因为个案数不同而产生一组系数。

按列表排除个案。从所有相关性中排除对任意变量有缺失值的个案。

点击【继续】按钮,返回主对话框(“单变量”对话框),点击【确定】按钮后,结果输出窗口看分析结果。

表6.1 双变量相关性分析基本统计量表

表6.2 双变量相关性分析表

㈡两个变量间的线性回归分析

打开数据文件“线性相关与回归分析数据.xls”,依次选择“【分析】→【回归】→【线性】”打开“线性回归”对话框如图,将待分析的2个指标移入右边的变量列表框内。其他均可选择默认项。

图 6.3 “线性回归”对话框

在“线性回归”对话框中,选择一个数值型因变量。

选择一个或多个数值型自变量。

根据需要,您可以:

将自变量分组成块,并对不同的变量子集指定不同的进入方法。

选择一个选择变量,将分析限于包含此变量特定值的个案子集。

选择个案标识变量,用于标识图上的点。

选择数值型WLS 权重变量以进行加权最小平方分析。

WLS:允许您获取加权最小平方模型。以数据点方差的倒数对数据点进行加权。这意味着

方差较大的观察值对分析的影响比方差较小的观察值要小。如果加权变量的值为0、负

数或缺失,则将该个案从分析中排除。

本题中,因只有一个自变量,故只需选择自变量和因变量即可,点击【统计量】按钮,弹出“线性回归:统计量”对话框,可选择需要输出的基本统计量,

图 6.4 “线性回归:统计量”对话框

我们选择默认的“估计”、“模型拟合度”和“描述性”。点击继续返回主对话框(“线性回归”对话框),点击【绘制】按钮,弹出“线性回归:图”对话框,

图 6.5 “线性回归:图”对话框

可以帮助验证正态性、线性和方差相等的假设。对于检测离群值、异常观察值和有影响的个案,图也是有用的。在将它们保存为新变量之后,在数据编辑器中可以使用预测值、残差和其他诊断以使用自变量构造图。以下图是可用的:

散点图:您可以绘制以下各项中的任意两种:因变量、标准化预测值、标准化残差、剔除残差、调整预测值、Student 化的残差或Student 化的已删除残差。针对标准化预测值绘制标准化残差,以检查线性关系和等方差性。

源变量列表:列出因变量(DEPENDNT) 及以下预测变量和残差变量:标准化预测值(*ZPRED)、标准化残差(*ZRESID)、剔除残差(*DRESID)、调整的预测值(*ADJPRED)、学生化的残差(*SRESID) 以及学生化的

已删除残差(*SDRESID)。

生成所有部分图:当根据其余自变量分别对两个变量进行回归时,显示每个自变量残差和因变量残差的散点图。要生成部分图,方程中必须至少有两个自变量。

标准化残差图:您可以获取标准化残差的直方图和正态概率图,将标准化残差的分布与正态分布进行比较。

如果请求了任意图,则将显示标准化预测值和标准化残差(*ZPRED 和*ZRESID)的摘要统计。

本题中,不需要此项,故保持默认。点击继续返回主对话框(“线性回归”对话框),点击【保存】按钮,弹出“线性回归:保存”对话框,本题中,不需要此项,故保持默认。点击继续返回主对话框(“线性回归”对话框),点击【选项】按钮,弹出“线性回归:选项”对话框,

图 6.6 “线性回归:选项”对话框

可用选项有:

步进方法标准:这些选项在已指定向前、向后或逐步式变量选择法的情况下适用。变量可以进入到模型中,或者从模型中移去,这取决于F 值的显著性(概率)或者F 值本身。

使用F 的概率。如果变量的F 值的显著性水平小于“输入”值,则将该变量选入到模型中,如果该显著性水平大于“剔除”值,则将该变量从模型中移去。“输入”值必须小于“剔除”值,且两者均必须为正数。要将更多的变量选入到模型中,请增加“输入”值。要将更多的变量从模型中移去,请降低“剔除”值。

使用F 的值。如果变量的F 值大于“输入”值,则该变量输入模型,如果F 值小于“剔除”值,则该变量从模型中移去。“输入”值必须大于“剔除”值,且两者均必须为正数。要将更多的变量选入到模型中,请降低“输入”值。要将更多的变量从模型中移去,请增大“剔除”值。

在等式中包含常量:缺省情况下,回归模型包含常数项。取消选择此选项可强制使回归通过原点,实际上很少这样做。某些通过原点的回归结果无法与包含常数的回归结果相比较。例如,不能以通常的方式解释R2。缺失值:您可以选择以下选项之一:

按列表排除个案。只有所有变量均取有效值的个案才包含在分析中。

按对排除个案。使用正被相关的变量对具有完整数据的个案来计算回归分析所基于的相关系数。自由度基于最小成对N。

使用均值替换。将所有个案用于计算,用变量的均值替换缺失观察值。

生物统计学简答题

1. 什么是生物统计学?生物统计学的主要内容和作用是什么?生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下 4 个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。 2.判断试验结果的可靠性。 3.提供由样本推断总体的方法。 4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别?准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平; ②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:① 离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的 标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的 68.26% ,X-+2s 内的观测值个数占总个数的95.49% ,x-+3s 内的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差; ④进行平均数区间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点?卩和c 对正态分布曲线有何影响? 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学答案 第三章 几种常见的概率分布律

第三章 几种常见的概率分布律 3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少? 答:代入二项分布概率函数,这里φ=1/2。 ()75218.02565621562121!5!3!838 3 5 == ??? ??=??? ????? ??=p 结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.218 75。 3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1) 5 4322345 5 414143541431041431041435434143??? ??+??? ????? ??+??? ????? ??+??? ????? ??+??? ????? ??+??? ??=?? ? ??+ 表型共有1+5+10+10+5+1 = 32种。 (2) ()()()()()()6 976000.0024114165 014.0024 1354143589 087.002419 104143107 263.0024127 104143105 395.0024181 5414353 237.002412434355 43 2 2 3 4 5 541322314==??? ??==?=??? ????? ??==?=??? ????? ??==?=??? ????? ??==?=??? ????? ??===??? ??=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。 3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大? 答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为: ()()() ()()φφφ--= -=--=-1lg 1lg 1lg 1lg 11a a a n P n P n P

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

《生物统计学》复习题及答案

《生物统计学》复习题 一、填空题(每空1分,共10分) 1.变量之间的相关关系主要有两大类:( 因果关系),(平行关系 ) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数 )、(调和平均数) 3.样本标准差的计算公式( 1)(2--= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生 ) 5.在标准正态分布中,P (-1≤u ≤1)=(0。6826 ) (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(依变量) 二、单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 原假设 D 、有效假设 10、抽取样本的基本首要原则是

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.wendangku.net/doc/388672237.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.wendangku.net/doc/388672237.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序

李春喜生物统计学第三版课后作业答案

《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编着) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下四个方面:①提 供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性; ④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。 (7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随 机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因素所造成的实验 结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所产生的倾 向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接 近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程 度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映 多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。 习题1.3 误差与错误有何区别? 答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。 第二章实验资料的整理与特征数的计算(P22、P23)

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

相关文档