文档库 最新最全的文档下载
当前位置:文档库 › 第8章 正交试验设计的方差分析

第8章 正交试验设计的方差分析

第8章 正交试验设计的方差分析
第8章 正交试验设计的方差分析

第8章正交试验设计的方差分析

前面我们讨论了如何安排正交试验以及用极差分析法(即直观分析法)对试验结果进行计算分析.极差分析法简单明了,通俗易懂,计算工作量少,便于普及推广.但这种方法不能把试验中由于试验条件的改变引起的数据波动,同试验误差引起的数据波动区分开来.也就是说,不能区分因素各水平对应的试验结果间的差异,究竟是由于因素水平不同引起的,还是由于试验误差引起的,即不知道试验的精度.同时,对影响试验结果的各个因素的重要程度,既不能给出精确的定量估计,也不能提供一个标准,用来判断所考察的因素的作用是否显著.

为了弥补极差分析法的不足,对试验结果的分析可采用方差分析法.

8.1 正交试验方差分析的基本步骤

在第2章中我们已经介绍过,方差分析的基本思想是将数据的总偏差平方和(S T)分解为因素的偏差平方和(S A、S B)和误差的偏差平方和(S e),然后将偏差平方和除以相对应的自由度(f)得到方差(V A、V B),最后利用因素方差与误差方差之比(V A/V e,V B/V e),作F检验,即可判断因素的作用是否显著.正交试验设计的方差分析也是按这样的步骤进行的,所不同的是这是考虑的是多因素试验的方差分析,而第2章中只考虑单因素和双因素试验的方差分析.

一、计算

1.偏差平方和与自由度的计算

方差分析的关键是偏差平方和的分解,现在以最简单的L 4(23)正交表上安排的试验为例来说明(见表8-1,板书).不考虑哪些因素安排在哪些列上(即表头设计时),设试验结果为x 1、x 2、x 3和x 4. 总的偏差平方和:

4

)(2

4

1

221

212

_T x n T x x x S i i n

i i

n

i i T -

=-

=-=∑∑∑=== T=∑=n

i i x 1

=(x 21+x 22+x 23+x 24)-4

1

(x 4321x x x +++)2 整理后可得 43

=

(24232221x x x x +++) 2

1

- (434232413121x x x x x x x x x x x x +++++) 第1列各水平偏差平方和为

S 1=22

_

21_

2

_11_

)(2)(x K x K -+-

=2[221211)4

2()42(

T

K T K -+-] =2[T K T K T K T K 2111222122114

1

41164164--+++] =22

2121141)(21T K K -+ )(211141

K K x T i i +==∑= =24321243221)(41])()[(21x x x x x x x x +++-+++

=)(2

1)(414321423241312

42322

21x x x x x x x x x x x x x x x x --+++-+++

表8-1 L 4(23)正交表及计算表

注: K ij 表示第j 列第i 水平的指标值之和;ij K __

表示第j 列第i 水平

的平均指标值;T 表示指标值总和;__

x 表示平均指标值. 同理,第2、3列各水平的偏差平方和S 2、S 3为

)(21)(4141)(21)()(232414342312124

23222122232132

__

23__

2

__

13__

3x x x x x x x x x x x x x x x x T K K x K x K S --+++-+++=-+=

-+-= 由此可得

S T =S 1+S 2+S 3 (8-1)

式(8-1)是正交表L 4(23)的总偏差平方和的分解公式,即L 4(23)的总偏差平方和等于各列偏差平方和之和.

若在L 4(23)正交表的第1列和第2列分别安排二水平因素A 、B ,在不考虑A 、B 因素间交互作用的情况下,则第3列(空列)是误差列.

)(21)(4141)(21)(2)(24231433241212423222122

222122

__

22__2

__

12__2x x x x x x x x x x x x x x x x T K K x K x K S --+++-+++=-+=

-+-=

同样也可以证明

S T =S A +S B +S e (8-2)

上式也是总偏差平方和的分解公式,即总偏差平方和等于各列因素的偏差平方和与误差的偏差平方和之和.

我们可以把上例推广到一般情况:

用饱和正交表L n (m k )安排试验(见表8-2,p160),总的试验次数为n ,每个因素的水平数为m ,则每个水平作r 次试验,r=m

n

. 试验结果为x 1,x 2,x 3,…,x n .令

∑∑∑=======n

i i T n

i i n

i i x Q x n x n

T CT x T 1

21

__

2

1,

1,

,

则总偏差平方和为

CT Q n T x x x S T n

i i

n

i i T -=-=-=∑∑==2

1

2

12

__

)( (8-3)

列偏差平方和为

)

,,2,1(1)(2

121

2

__

k i CT Q n T K r x K r S j m i ij m

i ij j =-=-

=-=∑∑== (8-4) 其中∑==m i ij j K r Q 1

2

1

特别地, 当m=2(即二水平)时, 式(8-4)可表示成:

2212212221221222122

221)(1

)(1)(2)(1)()(1j j j j j j j

j j j j j j K K n

K K n K K n K K n K K n m n T K K r S -=+-+=+-+=-

+= (8-5) 列偏差平方和S j 是第j 列中各水平对应的试验数据平均值与总平均值的偏差平方和,它反映了该列水平变动所引起的试验数据的波动.若该列安排的是因素,就称S j 为该因素的偏差平方和;若该列安排的是交互作用,就称S j 为该交互作用的偏差平方和;若该列为空列,则S j 表示由于试验误差和未被考察的某些交互作用或某些条件因素所引起的波动.在正交试验设计中,通常把空列的偏差平方和作为试验误差的偏差平方和,虽然它属于模型误差,一般比试验误差大(当作安全系数考虑),但用它作为试验误差进行显著性检验,可使检验结果更可靠些。

总偏差平方和的自由度: f T =n-1 第j 列偏差平方和的自由度: f j =m j -1 (m j :第j 列水平数) 此外,可以证明:

S T =∑=k

j j S 1=∑因k j S +∑交k j S +∑空

k j S (8-6)

f T =∑=k j j f 1

=∑因k j f +∑交k j f +∑空

k j f (8-7)

式中k 因、k 交和k 空分别为试验因素、试验考察的交互作用和空列在正交表中所占的列数。并且 k=k 因+k 交+k 空

注意:

(1)当某个交互作用占有正交表的某几列时,该交互作用的偏差平方和就等于所占各列偏差平方之和,其自由度也等于所占各列的自由度之和;

(2)误差的偏差平方和(S e )等于所占有空列的偏差平方和之和, 其自由度等于所有空列的自由度之和,即:

e k j

S S

=∑空

, e k j f f =∑空

(3)上面讨论的虽然是等水平饱和正交表L n (m k )的情况,但是对于饱和的混合型正交表L n (m 1k1×m 2k2)也适用,不过要换上相应的m 和k 值。(有关“饱和正交表”与“不饱和正交表”的概念,请参见第6节(p191)!)

2、方差的计算(V 因,V 交,V e )

方差等于各偏差平方和除以相应的自由度,即平均偏差平方和。

V 因=

因f S V 交=

交f S

V e =e

e

f S

二、显著性检验

数学上可以证明:在“假设H 0:某因素或某交互作用对试验结果影响不显著”成立时,统计量F ][e e

f f f F V V V F ),(或~)

(或交因交因α=

(8-9) 服从第一自由度为f 因(或f 交),第二自由度为f e 的F 分布。

对于给定的显著性水平α,查F 分布表得临界值F α,若计算出的F 值F 0>F α 则拒绝原假设,认为该因素或该交互作用对试验的结

果有显著影响;若计算出的F 值F 0≤F α,则接受原假设,认为该因素或该交互作用对试验结果无显著影响。

经显著性检验后,可把检验结果列出方差分析表,如表8-3所示

表8-3 正交试验方差分析表

在进行正交试验方差分析时,应注意以下几点: (1)进行F 检验时,要用到S e 和f e ,而

S e =∑空

k j S , f e =∑空

k j f

所以,为进行方差分析,选正交表时应留出一定的空列。当无空列时,则应进行重复试验,以便求得S e2的值(见p181第5节)。 (2)误差自由度f e 一般不应小于2,即f e ≥2,否则F 检验的灵敏度很低,有时即使因素对试验指标有影响,用F 检验也判断不出来。 (3)如果f e =1,为了增大f e ,提高F 检验的灵敏度, 在进行显著性检验之前,先比较V 因和V 交与V e 之间的差异程度。如果与误差方差V e 的大小相近,说明该因素或该交互作用对试验结果的影响微乎其微,其偏差平方和是由于随机误差引起的。因此,可并入误差偏差平方和S e 中.通常把满足 V 因(或V 交)<2V e 的那些因素或交互作用的偏

差平方和,并入误差的偏差平方和S e 中,从而得到新的误差偏差平方

和S ?e ,相应的自由度也并入f e 中,从而得到f ?e ,然后用

] [ ),(或~)

(或交因交因??

=e e

f f f F V V V F α (8-10) 其中,校正后的误差方差为

??

?=e

e e

f S V

对其他因素或交互作用进行检验,这样使自由度f e 扩大到f ?

e , 故

可以提高F 检验的灵敏度.

三、最优条件的确定

根据显著性检验结果,可以确定各因素对试验指标影响的主次顺序(通常根据F 的大小判断),对于显著性因素,若不考虑交互作用或交互作用不显著,则可通过比较该因素各水平对应的数据和(K ij )的大小,确定最优水平,各因素的优水平组合即为该试验的最佳水平组合,即最优条件;对于交互作用显著的某二个因素,必须先通过比较这二个因素各水平组合下试验数据之和的大小(即相当于极差分析中的二元表或搭配表),然后再确定其最佳水平组合.

最后,在最优工艺条件下进行验证实验。

8.2 不考虑交互作用的等水平正交试验方差分析

8.2.1 二水平正交试验的方差分析(因学时有限,不讲解!只讲解三水平情况,因为三水平会,二水平自然就会!)

例8-1在双歧杆菌酸奶研制中,为选择最佳发酵条件,用L8(27)正交表安排了正交试验,试验因素与水平表见表8-4,试验方案及结果见表8-5。试对试验结果进行方差分析。

表8-4 试验因素水平表

∵是六因素二水平试验,且不考虑交互作用,∴用L8(27)最好!

表8-5 试验方案及结果分析

一、计算

1、计算各列各水平的K ij 值(K 1j 和K 2j )

各列各水平的试验数据(即指标值)之和K 1j 、K 2j 以及(K 1j -K 2j )

的值,填入表8-5中, 如

K 1c =7.580+2.477+6.602+2.000=18.659

K 2c =2.699+7.568+2.477+7.531=20.275 2、计算各列的偏差平方和S j 及其自由度f j

由式(8-5)知,S j =n 1 (K 1j -K 2j )2

S A =S 1=81

×1.7142=0.367

S B =S 2=81

×1.1962=0.179

S C =S 3=81

×(-1.616)2=0.326

S e =S 4=8

1

×(-0.218)2=0.00594

…… f j =m-1=2-1=1 f T =n-1=8-1=7 fe=∑空

k f j =f 4=1

将求得的S j 值也填入表8-5中。为了判断是否计算有误,进行以

下验算: ① S T 的验算 T=∑=8

1

i i x =38.934,CT=n T 2

=81×38.9342=189.482

Q T =∑=8

1

2i i x =57.456+6.136+……+4.000=238.589

S T =Q T -CT=238.589-189.482=49.107

另外 S T =∑=k

j j S 1

=S A +S B ……+S e

=0.367+0.179+…+0.00594=49.107

② f T 的验算

f T =∑=k

j j f 1 =f A +f B +……+f e =1+1+……+1=7

另外 f T =n-1=8-1=7 ∴S T 和f T 均计算无误。 3、计算方差

V A =S A /f A =0.367/1=0.367 V B =S B /f B =0.179/1=0.179

……

V e =S e /f e =0.00594/1=0.00594

注意:

∵ f e =1<2, F 检验的灵敏度低!

∴ 需要校正f e --→ f ?e 、S e --→S ?e 、V e --→V ?

e

二、显著性检验

根据上述计算结果,进行显著性检验,列出方差分析表,如表8-6所示.

∵ V E =0.0125最小, V E /V e =0.0125/0.00594=2.10

∴因素E 对试验指标的影响可忽略,故将其偏差平方和S E 并入误差平方和S e 中,即

S?

e =S e+S E=0.00594+0.0125=0.01844,f?

e

=f e+f E=1+1=2

V?

e =S?

e

/f?

e

=0.01844/2=0.00922

1.计算F j

F A=V A/V?

e

=0.367/0.00922=39.8,

F B=V B/V?

e

=0.179/0.00922=19.4

F C=V C/V?

e

=0.326/0.00922=35.4,

F D=V D/V?

e

=0.0588/0.00922=6.38

F F=V F/V?

e

=48.157/0.00922=5223.1

2. 查F

α

F

α(f,f?e)= Fα(1,2)

当α=0.05时,查F分布表(p324)得F0.05(1,2)=18.51 当α=0.01时,查F分布表(p326)得F0.01(1,2)=98.50 3. 显著性检验

∵ F F>F0.01(1,2)

∴ F因素高度显著(用**表示);

又∵ F0.05(1,2)<F A<F0.01(1,2),

F0.05(1,2)<F B<F0.01(1,2),

F0.05(1,2)<F C<F0.01(1,2),

∴因素A、B、C均为显著(用*表示);

又∵ F D< F0.05(1,2),

∴ D因素不显著(不用记号表示).

由 F值大小可知,各因素对试验指标影响的主次顺序为:

F A C B D E

4.列出方差分析表

表8-6 方差分析表

三、最佳条件的确定.

本例中,指标值越大越好,由K1j和K2j的大小,按各因素的主次顺序选优水平如下:F 选F1 ,A 选A1,C 选C2,B 选B1.对于不显著因素D 和E,可视具体情况而定,D 选D2(即不充气)为好,E选E1(10%)可降低成本。所以,最优工艺条件为A1 B1 C2 D2 E1 F1 (或 A1 B1 C2 E1 F1),即……

最后,在最优工艺条件下进行验证实验。

8.2.2 三水平正交试验的方差分析(重点讲解!三水平掌握了,二水平自然就会!)

例8-2自溶酵母提取物是一种多用途食品配料。为探讨外加中性蛋白酶方法中啤酒酵母的最适合自溶条件,安排了三因素三水平试验。

试验指标是自溶液中蛋白质含量(%)。试验因素水平表见表8-7,试验方案及试验结果见表8-8。试对试验结果进行方差分析。

表8-7 因素水平表

本例是三因素三水平试验(见表8-7),且不考虑因素间的交互作用,所以用L9(3 4)正交表安排试验最合适.试验方案和试验结果分析见表8-8.

表8-8 试验方案及结果分析

一、 计算

1. 计算各列各水平的K ij 值(K 1j 、K 2j 和K 3j )

各列各水平对应的试验指标之和K 1j 、K 1j 和K 1j 及其平方K 21j 、K 22j 和

K 2

3j

,列8-8中。

例如:

K 1C =6.25+5.50+10.9=22.65, K 1C 2=22.652=513.02 K 2C =4.97+7.53+8.95=21.45, K 2C 2=21.452=460.10 K 3C =4.54+5.54+11.4=21.48, K 3C 2=21.482=461.39 2. 计算各列的偏差平方和S j 及其自由度f j

根据式(8-4)可知, S j =

r

1

∑=m

i ij

K

1

2-CT , r=n/m=9/3=3

CT=T 2/n=65.582/9=477.86

S A =S 1=(K 211+ K 221+ K 2

31)/r-CT

=(248.38+344.84+976.56)/3-477.84=45.4 同理可知,S B =S 2=6.49, S C =S 3=0.31,S e =S 4=0.83 ∵f j =m-1, ∴f A =f B =f C =f e =3-1=2 验算:

1. Q T =∑=n

i i x 12=6.252+4.972+……+8.952=530.89

S T = Q T -CT=530.89-477.86=53.03 另外, S T =∑=k

j j S 1 =S A + S B + S C + S e

=45.4+6.49+0.31+0.83=53.03

f T =n-1=9-1=8

另外, f T =∑=k

j j f 1 =f A +f B + f C +f e =2×4=8

∴计算正确无误。 3. 计算方差

V A = S A /f A =45.4/2=22.7, V B = S B /f B =6.49/2=3.25,

V C = S C /f C =0.31/2=0.155, V e = S e /f e =0.83/2=0.415,

∵ V C <2 V e

∴ 因素C 的偏差平方和S C 是由于随机误差引起的,说明因素C 对试验结果的影响可忽略,故将S C 并入S e 中,得 S e △=S e +S c =0.83+0.31=1.14 f e △=f e +f c =2+2=4, V e △= S e △/f e △=1.14/4=0.285

二、显著性检验 1.计算F j

==?e A A V V F / 22.7/0.285=79.6

==?e B B V V F / 3.25/0.285=11.4

2.查F α

当α=0.05时,查F分布表得F

α(f因,f e)=F0.05(2,4)=6.94 当α=0.01时,同理查得F0.01(2,4)=18.00.

3.显著性检验

∵F A>F0.01;∴因素A高度显著,用**表示之。

又∵F0.05<F B<F0.01;∴因素B显著,用*表示之。

当然,因素C是不显著的。

因素作用的主次顺序为:A B C

4.方差分析表

表8-9 方差分析表

三、最优工艺条件

本例试验的指标值越大越好。对因素A和B,通过比较K ij可知,优水平为 A3和B1,对因素C,取C1有利于节省原料。故最优水平组合为A3B1C1,即……

最后,在最优工艺条件下进行验证实验。

因为因素 C对试验指标几乎无影响,且因素C为加酶量,而酶的价格通常较高。所以最好在加酶量更低时,再次进行正交试验,以便确定最经济合理的加酶量。

8.3 考虑交互作用的正交试验设计的方差分析

8.3.1 考虑交互作用的二水平正交试验的方差分析(重点讲解!二水平掌握了,三水平自然也会!)

如前所述,因素间的交互作用在多因素试验设计中是经常碰到的,在一般试验中,在采取一些措施后,多数交互作用可略去。但为了使试验做得更精确,表头设计得更合理,收到更好的效果,在正交试验设计的方差分析中也要考虑因素间的交互作用。现在实例说明之。

例8-3 试对例7-4(p150~154)的试验结果进行方差分析。

表8-10 试验方案及结果分析

一、计算

书上为了便于计算,将试验数据x 。放大10倍,即令x i `=10x i ,变换后的数据如表8-10所示。(这种变换实际上是没有必要的,因为大家现在都用计算器或是计算机进行计算,而不是用对数计算尺进行计算!)

1.计算各列各水平的K ij 值(K 1j ,K 2j )

各列各水平对应的试验数据之和 K 1j 和K 2j ,以及(K 1j -K 2j )列于表8-10中

2.计算各列的偏差平方和(S j )和自由度(f j ) 对于二水平正交试验,由式(8-5)可知

S j =Q j -CT=

r

1

∑=m

i ij

K 1

2

-n T 2

或S j =n

1(K 1j -K 2j )2 ,

r=n/m=8/2=4,

S A =S 1==-

+8

21.20)31.109.9(4122

20.021; 同理 S B =S 2=0.235; S A ×B =S 3=0.00551 S C =S 4=0.00781 S A ×C =S 5=0.00911, S B ×C =S 6=0.000113, S e =S 7=0.00361 f j =m-1=2-1=1 即f A =f B =f A ×B =f C =f A ×C =f B ×C =f e =2-1=1 验算: ① S T 的验算

CT=n T 2=8

1

×20.212=51.056

Q T =∑=8

1

2i i x =2.422+2.242+…+2.762=51.337

S T =Q T -CT=51.337-51.056=0.281

另外S T =∑=7

1j j S =0.021+0.235+…+0.00361=0.281

② f T 的验算 f T =n-1=8-1=7

另外f T =∑f j =7×1=7 ∴计算无误。 3.计算方差

V A =S A /f A =0.021/1=0.021, V B =S B /f B =0.235/1=0.235,

V A ×B =S A ×B /f A ×B =0.00551/1=0.00551, V C =S C /f C =0.00781, V A ×C =S A ×B /f A ×C =0.00911, V B ×C =S B ×C /f B ×C =0.00013, V e =S e /f e =0.00361,

f e =1<2,F 检验的灵敏度低! V A ×B /V e =0.00551/0.00361=1.53, V C /V e =0.00781/0.00361=2.16 V A ×C /V e =0.00911/0.00361=2.52, V B ×C /V e =0.000113/0.000361=0.0313 ∵V A ×B <2V e , V B ×C <2V e

∴交互作用A ×B 和B ×C 对试验指标的影响可以忽略, S A ×B 和S B ×C 主要是由于随机误差而引起的。因此,将S A ×B 和S B ×C 并入S e 中,得

正交试验方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4(23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4(23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,

正交实验_方差分析法

正交实验 1. 选择正交表 根据上面的水平表,由于水平数2,所以要选用L n (2 )型正交表,本例中有3个因素,且考虑因素间的交互作用,所以要选一张5 m 的表,而L 8(27)是满足条件的最小L n (2m )型正交表。 2. 表头设计 3. 数据的填写与试验结果 4. 计算K1、K2、R 由于计算K1、K2、R ,数据量小,且数据所在列不规则,可以直接在要求和单元格里直接输入=单元格+单元格 的简单公式如下图 水平 (A)碱含量/% (B)操作温度/°C ?填料种类 1 5 40 甲 2 10 20 乙 试验号 A B A ×B C 空列 B ×C 空列 SO 2摩尔分率×100 1 2 3 4 5 6 7

同理用这个方法可以求得K2、R ,如下图 5. 计算离差平方和 利用Excel 内置函数SUMSQ ()该函数返回所选数的平方和,如计算A 2+B 2可以输入=SUMSQ(A,B),可得到结果,与平时所用求和函数SUM ()类似。 由于n T K K n SS A 22 2)21(2-+= ;其中∑== n i i y T 1 =97,可用SUM 求得

其中,P=T2/n可在单元格B24中输入“=B23*B23/8”求得。 而SS A的计算可在B20单元格中输入“=SUMSQ(B16:B17)/4-$B$24”; 其中$代表绝对引用。复制公式到C20,D20,E20,F20,G20,G20,可得到各自的离散和。6.方差分析 下图为所填写好的方差分析表: 差异源SS df MS F 显著性 A 6.125 1 6.125 B 136.125 1 136.125 14.91781 * C 3.125 1 3.125 A×B 171.125 1 171.125 18.75342 * B×C 105.125 1 105.125 11.52055 * 误差e 27.25 2 13.625 误差e△36.5 4 9.125 (1,4) 7.708647421 F 0.05 F (1,4) 21.19768958 0.01 其中A,B,C的自由度是为m(水平数)-1,A×B,B×C的自由度为dfA×df B, df B× df C 误差e是空列SS之和,自由度也是空列个数之和。 误差e△是合并A,B两因素离散平方和后的结果,因为SS A,SS B都小于误差项e,故将其并入误差e△中去。 对于显著性水平α=0.05,0.01,的F0.05(1,4),与F0.01(1,4),可通过函数FINV()求得。7.主次顺序分析 从离散和可以直接看出主次顺序:A×B , B ,B×C 由于存在交互项的影响较在,故应该在通过因子的搭配来确定最优方案。

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。 例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。 正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

利用SPSS 进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料得方差分析 在实际工作中,常常需要同时考察3个或3个以上得试验因素,若进行全面试验,则试验得规模将很大,往往因试验条件得限制而难于实施。 正交设计就是安排多因素试验、寻求最优水平组合得一种高效率试验设计方法. 第一节、正交设计原理与方法 (一)正交设计得基本概念 正交设计就是利用正交表来安排多因素试验、分析试验结果得一种设计方法。它从多因素试验得全部水平组合中挑选部分有代表性得水平组合进行试验,通过对这部分试验结果得分析了解全面试验得情况,找出最优水平组合. 例如,研究氮、磷、钾肥施用量对某小麦品种产量得影响: A因素就是氮肥施用量,设A1、A2、A3 3个水平; B因素就是磷肥施用量,设B1、B2、B3 3个水平; C因素就是钾肥施用量,设C1、C2、C3 3个水平。 这就是一个3因素每个因素3水平得试验,各因素得水平之间全部可能得组合有27种。 如果进行全面试验,可以分析各因素得效应,交互作用,也可选出最优水平组合。 但全面试验包含得水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验得主要目得就是寻求最优水平组合,则可利用正交设计来安排试验. 正交设计得基本特点就是:用部分试验来代替全面试验,通过对部分试验结果得分析,了解全面试验得情况。 正交试验就是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用得混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合得全面试验得情况,找出最佳得生产条件。 一、正交设计得基本原理 表11-1 33试验得全面试验方案

#正交试验结果的方差分析方法

正交试验结果的方差分析方法 计算公式和项目 试验指标的加和值= , 试验指标的平均值和表4-13一样,第j列的 (1) I j”水平所对应的试验指标的数值之和 (2) II j——“ 2”水平所对应的试验指标的数值之和 (3)…… (4) k j——同一水平出现的次数。等于试验的次数除以第j列的水平数. (5)I j/k j——“水平所对应的试验指标的平均” (6)II j/k j——“2”水平所对应的试验指标的平均值 (7)……以上各项的计算方法,和“极差法”同,见4.1.7节 (8)偏差平方和 (4-1) (9) f j ——自由度.f j 第j列的水平数-1. (10)V j ——方差. Vj =S j /f j (4-2) (11)V e ——误差列的方差。 (4-3) (12)F j ——方差之比 (4-4)

(13)查F分布数值表(见附录6),做显著性检验。显著性检验结果的具体表示方法和第3章相同。 (14)总的偏差平方和 (4-5) (15)总的偏差平方和等于各列的偏差平方和之和。即 (4-6) 式中,m为正交表的列数。 若误差列由5个单列组成,则误差列的偏差平方和S e等于5个单列的偏差平方和之和,即:S e=S e1+S e2+S e3+S e4+S e5;也可用S e= S总-S’来计算,其中:S’为安排有因素或交互作用的各列的偏差平方和之和 应引出的结论。 和极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验误差在分析每列对指标影响中所起的作用。如果某列对指标的影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值也在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列和原来的“误差列”合并起来,组成新的“误差列”,重新检验各列的显著性。 方差分析方法使用举例 例4-6为了提高猪发酵饲料的营养和猪爱吃的程度,选择了四个因素进行正交试验,其因素水平见表4-18。 表4-18例4-6的因素水平表 因素发酵温度/℃发酵时间/h 初始的PH值投曲量/ % 符号x1x2x3x4 水平 1 10 1 2 7 5 2 20 24 6 10 3 30 48 5

正交试验方差分析(通俗易懂)复习过程

正交试验方差分析(通 俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。

正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表 L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

第8章 正交试验设计的方差分析例题

8.3.2 考虑交互作用的三水平正交试验的方差分析(因学时有限和正交表太大L27(313),不讲解!只讲解二水平情况,因为二水平会,三水平自然也会!) 例8-4 运动发酵单细胞菌是一种酒精生产菌。为了确定其发酵培养基的最佳配方,进行了四因素三水平正交试验,试验指标为酒精浓度(g/ml)。表8-12给出了因素水平表,要求考察交互作用A×B、A×C和A×D。查附表7可得,本试验应选用L27(313)正交表,表头设计应按照“L27(313)二列间的交互作用表”进行。本例只考虑一级交互作用(p=1),所以每个三水平交互作用应占(m-1)P=(3-1)1=2列,即A ×B、A×C,和A×D在L27(313)正交表中各占二列。 表8-12 因素水平表 表头设计时应避免混杂,试验方案及试验结果见表8-13。 由交互作用表可知,将因素A、B安排在第1、2列之后,第3、4列为A×B交互作用列;再将C安排在第5列后,A×C交互作用在第6、7列;最后将D安排在第9列,则A×D交互作用类落在第8、10列(当然也可将D安排在第8列,则第9、10列为A×D交互作用列)。 表8-13 试验方案及结果分析 L27(313)

一、计算(计算过程省略) 1.计算各列各水平的K ij 值(K 1j ,K 2j ,K 3j )和K 2 ij (K 21j ,K 22j ,K 23j ) 各列各水平对应的试验数据之和K 1j ,K 2j ,K 3j ,及其平方和K 21j , K 22j , K 23j ,列于表8-13中,例如 K 1A = ∑=9 1 i i X =0.20+0.50*2+1.50+1.10+1.20*2+1.60*2=9.40=K 11 , K 2 11= 88.36 K 2A =∑=9 1i i X =0.40+0.50+……+6.15=33.05= K 21 , K 221=1092.30 K 3A =∑=9 1 i i X =0.40+0.30+……+2.80=25.80= K 31 , K 231 =665.64 表示A ×B 的有两列,即第3,4列,计算后可知 K 13 =32.75, K 23 =17.90; K 33 =17.60 K 14 =26.40; K 24 =24.55, K 34 =17.30 2.计算各列的偏差平方和(S j )及其自由度(f j ) 由式(8-4),可知: S j =CT Q n T K r j m i ij -=-∑=2 2 11 r=n/m=27/3=9; CT=T 2/n=1/27×68.252=172.52

第8章 正交试验设计的方差分析

第8章正交试验设计的方差分析 前面我们讨论了如何安排正交试验以及用极差分析法(即直观分析法)对试验结果进行计算分析.极差分析法简单明了,通俗易懂,计算工作量少,便于普及推广.但这种方法不能把试验中由于试验条件的改变引起的数据波动,同试验误差引起的数据波动区分开来.也就是说,不能区分因素各水平对应的试验结果间的差异,究竟是由于因素水平不同引起的,还是由于试验误差引起的,即不知道试验的精度.同时,对影响试验结果的各个因素的重要程度,既不能给出精确的定量估计,也不能提供一个标准,用来判断所考察的因素的作用是否显著. 为了弥补极差分析法的不足,对试验结果的分析可采用方差分析法. 8.1 正交试验方差分析的基本步骤 在第2章中我们已经介绍过,方差分析的基本思想是将数据的总偏差平方和(S T)分解为因素的偏差平方和(S A、S B)和误差的偏差平方和(S e),然后将偏差平方和除以相对应的自由度(f)得到方差(V A、V B),最后利用因素方差与误差方差之比(V A/V e,V B/V e),作F检验,即可判断因素的作用是否显著.正交试验设计的方差分析也是按这样的步骤进行的,所不同的是这是考虑的是多因素试验的方差分析,而第2章中只考虑单因素和双因素试验的方差分析. 一、计算 1.偏差平方和与自由度的计算

方差分析的关键是偏差平方和的分解,现在以最简单的L 4(23)正交表上安排的试验为例来说明(见表8-1,板书).不考虑哪些因素安排在哪些列上(即表头设计时),设试验结果为x 1、x 2、x 3和x 4. 总的偏差平方和: 4 )(2 4 1 221 212 _T x n T x x x S i i n i i n i i T - =- =-=∑∑∑=== T=∑=n i i x 1 =(x 21+x 22+x 23+x 24)-4 1 (x 4321x x x +++)2 整理后可得 43 = (24232221x x x x +++) 2 1 - (434232413121x x x x x x x x x x x x +++++) 第1列各水平偏差平方和为 S 1=22 _ 21_ 2 _11_ )(2)(x K x K -+- =2[221211)4 2()42( T K T K -+-] =2[T K T K T K T K 2111222122114 1 41164164--+++] =22 2121141)(21T K K -+ )(211141 K K x T i i +==∑= =24321243221)(41])()[(21x x x x x x x x +++-+++ =)(2 1)(414321423241312 42322 21x x x x x x x x x x x x x x x x --+++-+++ 表8-1 L 4(23)正交表及计算表

相关文档
相关文档 最新文档