习题答案
1.设用三种方法测定某溶液时,得到三组数据,其平均值如下:
试求它们的加权平均值。
解:根据数据的绝对误差计算权重:
,,
因为
所以
2.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。
答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。如3.测得某种奶制品中蛋白质的含量为,试求其相对误差。
解:
4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有18.2mg维生素C,已知测量的相对误差为0.1%,试求每100g菠萝中含有维生素C的质量范围。
解:,所以
所以m的范围为
或依据公式
5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)1.5级,量程0.2MPa 的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。
求最大绝对误差和相对误差。
解:1)压力表的精度为1.5级,量程为0.2MPa,
则
2)1mm汞柱代表的大气压为0.133KPa,
所以
3)1mm水柱代表的大气压:,其中,通常取
则
6.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。样本测定值为3.48,3.37,3.47,3.38,3.40,3.43,求该组数据的算术平均值、几何平均值、调和平均值、标准差s、标准差、样本方差、总体方差、算术平均误差和极差。
解:
7.A与B两人用同一种分析方法测定金属钠中的铁,测得铁含量()分别为:
分析人员A:8.0,8.0,10.0,10.0,6.0,6.0,4.0,6.0,6.0,8.0
分析人员B:7.5,7.5,4.5,4.0,5.5,8.0,7.5,7.5,5.5,8.0
试问A与B两人测定铁的精密度是否有显著性差异?()
解:依题意,检验A与B两人测定铁的精密度是否有显著性差异,采用F双侧检验。根据试验值计算出两种方法的方差以及F值:
,
根据显著性水平,,查F分布表得,,,。所以,,,A与B两人测定铁的方差没有显著差异,即两人测定铁的精密度没有显著性差异。
8.用新旧两种工艺冶炼某种金属材料,分别从两种冶炼工艺生产的产品中抽样,测定产品中的杂质含量(%),结果如下:
旧工艺(1):2.69,2.28,2.57,2.30,2.23,2.42,2.61,2.64,2.72,3.02,2.45,2.95,2.51;
新工艺(2):2.26,2.25,2.06,2.35,2.43,2.19,2.06,2.32,2.34
试问新冶炼工艺是否比旧工艺生产更稳定,并检验两种工艺之间是否存在系统误差?()
解:工艺的稳定性可用精密度来表征,而精密度可由极差、标准差或方差等表征,这里依据方差来计算。,,由于,所以新的冶炼工艺比旧工艺生产更稳定。
(依据极差:,,同样可以得到上述结论)(依据标准差,)
检验两种工艺之间是否存在系统误差,采用t检验法。
1)先判断两组数据的方差是否有显著性差异。根据试验数据计算出各自的平均值和方差:
,
,
故
已知n1=13,n2=9,则,,根据显著性水平,查F分布表得,,
2)进行异方差t检验
根据显著性水平,查单侧t分布表得,所以,则两种工艺的平均值存在差异,即两种工艺之间存在系统误差。
备注:
实验方差分析是单侧检验:因为方差分析不像差异显著检验,方差分析中关心的只是组间均方是否显著大于组内均方或误差均方。目的是为了区分组间差异是否比组内差异大的多,因为只有大得多,才能证明实验的控制条件是否造成了显著的差异,
方差齐性中F检验要用到双侧检验,因为要看的是否有显著性差异,而没有说是要看有差异时到底是谁大于谁,所以没有方向性。
9.用新旧两种方法测得某种液体的黏度()如下:
新方法:0.73,0.91,0.84,0.77,0.98,0.81,0.79,0.87,0.85
旧方法:0.76,0.92,0.86,0.74,0.96,0.83,0.79,0.80,0.75
其中旧方法无系统误差。试在显著性水平()时,检验新方法是否可行。
解:检验新方法是否可行,即检验新方法是否有系统误差,这里采用秩和检验。
先求出各数据的秩,如表所示。
此时,n1=9,n2=9,n=18,
对于,查秩和临界值表,得,,由于,故,两组数据无显著差异,新方法无系统误差,可行。
T
对于,查表,所以,即两组数据无显著差异,新方法无系统误差,可行。
10.对同一铜合金,有10个分析人员分析进行分析,测得其中铜含量(%)的数据为:62.20,69.49,70.30,70.65,70.82,71.03,71.22,71.25,71.33,71.38(%)。问这些数据中哪个(些)数据应被舍去,试检验?()
解:1)拉依达(P aǔta)检验法
○1检验62.20
计算包括62.20在内的平均值及标准偏差
计算
比较和,,依据拉依达检验法,当时,62.20应该舍去。
○2检验69.49
计算包括69.49在内的平均值及标准偏差
计算
比较和,,依据拉依达检验法,当时,69.49应该舍去。
○3检验70.30
计算包括70.30在内的平均值及标准偏差
计算
比较和,,依据拉依达检验法,当时,69.49不应该舍去。○4检验71.38
计算包括71.38在内的平均值及标准偏差
计算
比较和,,依据拉依达检验法,当时,71.38不应该舍去。
2)格拉布斯(Grubbs)检验法
○1检验62.20
计算包括62.20在内的平均值及标准偏差,查表得
计算
所以62.20应该舍去。
○2检验69.49
计算包括69.49在内的平均值及标准偏差,查表得
,
计算
所以69.49应该舍去。
○3检验70.30
计算包括70.30在内的平均值及标准偏差,查表得
计算
计算
69.49不应该舍去。
○4检验71.38
计算包括71.38在内的平均值及标准偏差,查表得
计算
计算
当时,71.38不应该舍去。
3)狄克逊(Dixon)检验法
应用狄克逊双侧情形检验:
○1对于62.20和71.38,,计算
当,对于双侧检验,查出临界值,由于,且,故最小值62.20应该被舍去。
○2舍去62.20后,对剩余的9个数据(n=9)进行狄克逊双侧检验:
当,对于双侧检验,查出临界值,由于,且,没有异常值。
单侧检验时,查表得到临界值,,没有异常值。
11.将下列数据保留4位有效数字:3.1459,136653,2.33050,2.7500,2.77447
解:3.146、1367×102、2.330、2.750、2.774
12.在容量分析中,计算组分含量的公式为,其中V是滴定时消耗滴定液的体积,c是滴定液的浓度。今用浓度为(1.000±0.001)mg/mL的标准溶液滴定某试液,滴定时消耗滴定液的体积为(20.00±0.02)mL,试求滴定结果的绝对误差和相对误差。
解:根据组分含量计算公式,各变量的误差传递系数分别为
,
所以组分含量的绝对误差为
(mg)
(mg)
最大相对误差为
13.在测定某溶液的密度ρ的试验中,需要测定液体的体积和质量,已知质量测定的相对误差≤0.02%,预使测定结果的相对误差≤0.1%,测量液体体积所允许的最大相对误差为多大?解:由公式,误差传递系数为
,
则绝对误差
相对误差
由于质量的相对误差,预使得,需要,即测量液体体积所允许的最大相对误差为0.08%。
实验设计与数据处理心得体会 刚开始选这门课的时候,我觉得这门课应该就是很难懂的课程,首先我们做过不少的实验了,当然任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药等)中的概念、原理与规律大多由实验推导与论证的,但我觉得每次到处理数据的时候都很困难,所以我觉得这就是门难懂的课程,却也就是很有必要去学的一门课程,它对于我们工科生来说也就是很有用途的,在以后我们实验的数据处理上有很重要的意义。 如何科学的设计实验,对实验所观测的数据进行分析与处理,获得研究观测对象的变化规律,就是每个需要进行实验的人员需要解决的问题。“实验设计与数据处理”课程就就是就是以概率论数理统计、专业技术知识与实践经验为基础,经济、科学地安排试验,并对试验数据进行计算分析,最终达到减少试验次数、缩短试验周期、迅速找到优化方案的一种科学计算方法。它主要应用于工农业生产与科学研究过程中的科学试验,就是产品设计、质量管理与科学研究的重要工具与方法,也就是一门关于科学实验中实验前的实验设计的理论、知识、方法、技能,以及实验后获得了实验结果,对实验数据进行科学处理的理论、知识、方法与技能的课程。 通过本课程的学习,我掌握了试验数据统计分析的基本原理,并能针对实际问题正确地运用,为将来从事专业科学的研究打下基础。这门课的安排很合理,由简单到复杂、由浅入深的思维发展规律,先讲单因素试验、双因素试验、正交试验、均匀试验设计等常用试验设计
方法及其常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识,最后将得出的方差分析、回归分析等结论与处理方法直接应用到试验设计方法。 比如我对误差理论与误差分析的学习:在实验中,每次针对实验数据总会有误差分析,误差就是进行实验设计与数据评价最关键的一个概念,就是测量结果与真值的接近程度。任何物理量不可能测量的绝对准确,必然存在着测定误差。通过学习,我知道误差分为过失误差,系统误差与随机误差,并理解了她们的定义。另外还有对准确度与精密度的学习,了解了她们之间的关系以及提高准确度的方法等。对误差的学习更有意义的应该就是如何消除误差,首先消除系统误差,可以通过对照试验,空白试验,校准仪器以及对分析结果的校正等方法来消除;其次要减小随机误差,就就是要在消除系统误差的前提下,增加平行测定次数,可以提高平均值的精密度。 比如我对方差分析的理解:方差分析就是实验设计中的重要分析方法,应用非常广泛,它就是将不同因素、不同水平组合下试验数据作为不同总体的样本数据,进行统计分析,找出对实验指标影响大的因素及其影响程度。对于单因素实验的方差分析,主要步骤如下:建立线性统计模型,提出需要检验的假设;总离差平方与的分析与计算;统计分析,列出方差分析表。对于双因素实验的方差分析,分为两种,一种就是无交互作用的方差分析,另一种就是有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但就是总体步骤都与单因素实验的方差分析一样。
数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系
上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。
2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。
习题答案 1.设用三种方法测定某溶液时,得到三组数据,其平均值如下: 试求它们的加权平均值。 解:根据数据的绝对误差计算权重: 因为 所以 2.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。 答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。如3.测得某种奶制品中蛋白质的含量为,试求其相对误差。 解: 4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有18.2mg维生素C,已知测量的相对误差为0.1%,试求每100g菠萝中含有维生素C的质量范围。 解:,所以 所以m的范围为 或依据公式 5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)1.5级,量程0.2MPa 的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。 求最大绝对误差和相对误差。 解:1)压力表的精度为1.5级,量程为0.2MPa,
则 2)1mm汞柱代表的大气压为0.133KPa, 所以 3)1mm水柱代表的大气压:,其中,通常取 则 6.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。样本测定值为3.48,3.37,3.47,3.38,3.40,3.43,求该组数据的算术平均值、几何平均值、调和平均值、标准差s、标准差、样本方差、总体方差、算术平均误差和极差。 解: 数据计算公式计算结果 3.48 算术平均值 3.421667 3.37 几何平均值 3.421407 3.47 调和平均值 或 3.421148 3.38 标准样本差 0.046224
3.40 0.042197 总体标准差
《实验设计与数据处理》大作业 班级:环境17研 姓名: 学号: 1、 用Excel (或Origin )做出下表数据带数据点的折线散点图 余浊(N T U ) 加量药(mL) 总氮T N (m g /L ) 加量药(mL ) 图1 加药量与剩余浊度变化关系图 图2 加药量与总氮TN 变化关系图 总磷T P (m g /L ) 加量药(mL) C O D C r (m g /L ) 加量药(mL) 图3 加药量与总磷TN 变化关系图 图4 加药量与COD Cr 变化关系图 去除率(%) 加药量(mL)
图5 加药量与各指标去除率变化关系图
2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H 和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式(要求作双Y 轴图)。 η H (m ) Q v (m 3 /h) 图6 离心泵特性曲线 扬程曲线方程为:H=效率曲线方程为:η=+、列出一元线性回归方程,求出相关系数,并绘制出工作曲线图。 (1) 表1 相关系数的计算 Y 吸光度(A ) X X-3B 浓度(mg/L ) i x x - i y y - l xy l xx l yy R 10 -30 2800 20 -20 30 -10 40 ()() i i x x y y l R --= = ∑
50 10 60 20 70 30 平均值 40 吸光度 X-3B浓度(mg/L) 图7 水中染料活性艳红(X-3B )工作曲线 一元线性回归方程为:y=+ 相关系数为:R 2= (2) 代入数据可知: 样品一:x=样品二:x=、试找出某伴生金属c 与含量距离x 之间的关系(要求有分析过程、计算表格以及回归图形)。 表2 某伴生金属c 与含量距离x 之间的关系分析计算表 序号 x c lgx 1/x 1/c 1 2 2 3 3 4 4 5 5 7 6 8 7 10 1
第0章 1 试验数据处理的主要作用 试验设计合理的规划试验,以通过较高效的试验方案获得更具代表性的数据 数据处理对试验数据进行分析研究,从而获得研究对象的变化规律,为生产和科研提供指导。 数据处理的具体作用: 第一章 2 真值的概念和特点 真值 某时刻和某一状态下,某量的可观值或实际值。 真值很多是位置的,但部分又是已知的。 3 平均值,尤其是算数平均值,加权平均值的概念。 平均值 科学实验中,经常将多次试验值得平均值作为真值的近似值。 (1) 算数平均值(arithmetic mean ) 同样试验条件下,如多次试验值服从正态分布,则算数平均值是这组等精度试验值中最佳或最可信赖的值。 (2) 加权平均值(weighted mean ) 若一组试验数据的精度或可靠度不一致,为了突出可靠性高的数值,可以采用加权平均值 权值的确定方法:①取试验值出现的频率ni/n ②若xi 为每组试验值的平均值,则权值为每组试验的次数 ③根据权与绝对误差的平方成反比确定 ④根据试验者的经验确定 4 误差的概念,包括绝对误差与相对误差。 判断影响结果的因素主次 优化试验或生产方案 确定试验因素与试验结果之间的近似函数关系 判断试验数据的可靠性 预测试验结果 控制试验结果 n n x i n ===121n x x x x i n ==+++= 121
5 误差的类型及产生的原因。 随机误差 系统误差 过失误差 6 精密度、正确度和准确度的概念。 1精密度定义:一定条件下多次试验值得彼此符合程度或一致程度。 正确度定义:大量试验结果的算数平均值与真值的一致程度。 准确度定义:反映系统误差与随机误差的综合 正确度:大量试验结果的算数平均值与真值的一致程度。 反映试验系统随机误差的大小 准确度:反映系统误差与随机误差的综合 7随机误差的检验法F 检验法。 1)检验两组实验数据精密度是否一致—双侧检验 (2)检验两组实验数据精密度优劣—单侧检验 a. 左侧检验 ① 取统计量为: ②给定显著性水平α ③查表确定临界值: ④ 判断:若 且 结论:S12相对S12两无显著减小。 b. 右侧检验 8 系统误差的t 检验法。 2122S F S = ① 取统计量为: ②给定显著性水平α ③查表确定临界值: 1212 (1,1) F n n α - --122(1,1) F n n α--④ 判断:若 121212 2 (1,1)F (1,1) F n n F n n αα- --<<--结论:则两组数据方差无显著差异。 2 122 S F S =112(1,1)F n n α---F 1<12F (1 ,1)F n n α<--12(1,1)F n n α--12F (1 ,1)F n n α<--