文档库 最新最全的文档下载
当前位置:文档库 › 正交试验设计及其统计分析

正交试验设计及其统计分析

正交试验设计及其统计分析
正交试验设计及其统计分析

第三章正交试验设计及其统计分析

§3-1 正交试验设计

利用正交表解决多因素的试验问题:(1)参数和交互作用对指标影响的显著性;(2)参数较优化组合;(3)指标的预测。

一、正交表的特点

正交表代号La(bc)的含义:a—正交表行数,即试验点数;

b—各因素水平数,c—正交表列数,每一列可安排一个因素。

L4(23)正交表

试验号列号

1 2 3

1 1 1 1

2 1 2 2

3 2 1 2

4 2 2 1

正交的含意:若将表中2换成-1,则任一列之和为0,任两列乘积的和为0。若将列看作向量,则两向量垂直相交,即正交。

从试验点的空间分布可知,L4(23)正交表为1/2实施。

(1)均衡搭配:即任一因素的任一水平与其它因素的每一水平相遇的次数均等。(2)综合可比:即任一因素的各水平出现的次数相等。

二、交互作用表(挂一张L8(27)正交表)

1、交互列的位置:要查交互列表。

2、混杂:若在交互两因素的交互列上,安排其它因素或其它因素的交互,则在此列将出现混杂现象。

3、如何对待混杂

①若不想用较多的试验,则就可能有混杂,此时要用专业经验来判断。

②若不研究规律,只找出参数较优组合,则可不考虑混杂。

三、试验方案设计

1、列因素水平表(挂豇豆脱水试验表)

因素水平A B C D

参数名称

(单位)

参数名称

(单位)

参数名称

(单位)

参数名称

(单位)

1 A1 B1 C1 D1

2 A2 B2 C2 D2 2、选正交表

原则:正交表的列数应≥要考察的因素和交互作用个数的最小正交表。 3、表头设计 即因素放在哪一列。其原则如下:

①若不考虑交互作用,则因素随机放各列,但若有余列时,因素最好不要放在其它因素的交互列上,一则避免混杂,二则可看出交互作用的大小。

②若要考虑交互作用,则应先排要交互的因素,其它因素按不混杂的原则随机排列。

4、列出试验方案

将表中字码换成对应的水平值。每一行的因素水平组合即为一个试验点。(挂清选机试验方案) 四、试验

注意以下几点:

(1)各因素的水平组合方案不能变。

(2)试验点的实施顺序是随机的,即可根据水平改变的难易来安排。

(3)严格控制试验条件,减少试验误差。 §3-2正交试验数据的直观分析法 一、单指标试验数据的极差分析

1、分析的内容

①找出因素对指标影响的主次。

②找出各因素的较优水平,即取哪个水平最好。

③找出参数的较优组合:即各因素取何水平搭配起来最好,考虑了交互作用。 2、分析的步骤(挂豇豆脱水试验表) ①算出各因素同一水平的指标和m K 与均值

b a K k m

m /=

,b m ~1=

②由各水平的均值算出极差 min max k k R -=

③找出各因素的较优水平:指标好的水平为较优水平,事先要知道指标是越高越好还是越近越好。

④根据极差R 的大小确定因素的主次,即对指标影响的大小,R 越大影响越显著。 ⑤若考察交互作用时,要找出优搭配(水平搭配)

⑥找出因素水平的较优组合:即参数的较优组合(在试验中可能出现,也可能不出现)。 3、注意事项

①若交互作用比其中某一因素的影响大时,应先从交互中找出因素主次和较优水平。

②对于空列,反映了试验误差,若恰为某两因素的交互作用列,且该列极差很大,则该交互作用不能忽略。

[例题]豇豆脱水正交试验设计。以干制品中Vc 含量为指标,Vc 含量越高越好。研究3个因素,每因素取2水平。因素水平编码见下表。 豇豆脱水正交试验因素水平编码表

因素

水平

A B C 介质温度(℃) 介质速度(m/s ) 漂烫时间(min )

1 70 0.5 5

2 60 0.7 7

试验中,除考察因素A、B、C的单独作用外,还要考察任两个因素的交互作用。

因此,试验选用L8(27)正交表。试验结果和极差分析见下表。

豇豆脱水正交试验结果和极差分析表

列号

1 2 3 4 5 6 7 Vc含量

试验号

___A________B_______AXB_______C_______AXC______BXC_______________(mg/

kg)

1 1 1 1 1 1 1 1 23.627

2 1 1 1 2 2 2 2 20.250

3 1 2 2 1 1 2 2 28.300

4 1 2 2 2 2 1 1 23.433

5 2 1 2 1 2 1 2 30.276

6 2 1 2 2 1 2 1 32.498

7 2 2 1 1 2 2 1 25.435

8 2 2 1 2 1 1 2 24.863

_____________________________________________________________________

__________

K1 95.610 106.651 94.175 107.638 109.288 102.199 104.993

T=208.682

K2 113.072 102.031 114.507 101.044 99.394 106.483 103.689

k1 23.903 26.663 23.544 26.910 27.322 25.550 26.248

k2 28.268 25.508 28.627 25.261 24.848 26.621 25.922

Rj 4.365 1.155 5.083 1.649 2.474 1.071 .326

jysp A2 B1 (AXB)2 C1 (AXC)1 (BXC)2

_____________________________________________________________________

_________

因素主次:AXB,A,AXC,C,B,BXC

较优搭配:A2XB1,A2XC2

较优组合:A2B1C2

_____________________________________________________________________

_________

[课堂练习]做一正交试验,研究A、B、C、D及AXB、BXC对指标的影响。各因素

取2水平,指标越高越好。请安排正交试验并进行极差分析。

[步骤]:

选正交表;

表头设计;

计算K1、K2、k1、k2、R;

选较优水平;

判断因素主次;

判断较优搭配;

判断较优组合。

结果如下表。

正交试验结果和极差分析表

列号

1 2 3 4 5 6 7 指标-m

试验号___A________B_______AXB_______C_______

______BXC_______D_______

1 1 1 1 1 1 1 1 -5

2 1 1 1 2 2 2 2 4

3 1 2 2 1 1 2 2 0

4 1 2 2 2 2 1 1 3

5 2 1 2 1 2 1 2 0

6 2 1 2 2 1 2 1 5

7 2 2 1 1 2 2 1 -8

8 2 2 1 2 1 1 2 -3

_____________________________________________________________________

__________

K1 2.000 4.000 -12.000 -13.000 -3.000 -5.000 -5.000

T=-4

K2 -6.000 -8.000 8.000 9.000 -1.000 1.000 1.000

k1 .500 1.000 -3.000 -3.250 -.750 -1.250 -1.250

k2 -1.500 -2.000 2.000 2.250 -.250 .250 .250

Rj 2.000 3.000 5.000 5.500 .500 1.500 1.500

jysp A1 B1 (AXB)2 C2 (BXC)2 D2

_____________________________________________________________________

_________

因素主次:C,AXB,B,A,BXC,D

较优搭配:A2XB1

较优组合:A2B1C2D2

_____________________________________________________________________

_________

[作业]有一正交试验,其试验方案与结果如下表,指标越低越好,请进行极差分

析。

[答案]

正交试验结果和极差分析表

列号

1 2 3 4 5 6 7 指标-m

试验号

___A________B_______AXB_______C_______AXC______BXC_______D_______

1 1 1 1 1 1 1 1 0

2 1 1 1 2 2 2 2 6

3 1 2 2 1 1 2 2 2

4 1 2 2 2 2 1 1 5

5 2 1 2 1 2 1 2 2

6 2 1 2 2 1 2 1 1

7 2 2 1 1 2 2 1 -6

8 2 2 1 2 1 1 2 -1

_____________________________________________________________________

__________

K1 13.000 9.000 -1.000 -2.000 2.000 6.000 .000

T=9

K2 -4.000 .000 10.000 11.000 7.000 3.000 9.000

k1 3.250 2.250 -.250 -.500 .500 1.500 .000

k2 -1.000 .000 2.500 2.750 1.750 .750 2.250

Rj 4.250 2.250 2.750 3.250 1.250 .750 2.250

jysp A2 B2 (AXB)1 C1 (AXC)1 (BXC)2 D1

_____________________________________________________________________

_________

因素主次:A,C,AXB,B,D,AXC,BXC

较优搭配:A2XB2

较优组合:A2B2C1D1

_____________________________________________________________________

_________

二、多指标试验数据的极差分析

1、综合平衡法(挂铁水的极差分析)

指标要有主次,对每一指标都作单指标极差分析。若某因素水平对绝大部分指标均优(要考虑指标的主次),则该因素水平为优。 2、加权综合评分法(挂清选机的极差分析)

原理:用 2211i i i y w y w y +=*算综合指标,再按单指标进行极差分析。wj 为各指

标的加权系数。其步骤如下: ①定各指标的加权值

j

w ,1

=∑

j w (根据各指标的重要程度而定)。

②消除各指标的量纲,使试验值处在同一数量级上。 计算各指标观测值的评分值'

ij

y :

100max =j y 分, 分

0min =j y

100

min

max min '

?--=j j j ij ij

ij y y y y y

③计算加权综合评分值'

ij

j i y w y ?=∑*

注意!对越小越好的指标前为“-”号,综合指标越大越好。

④以*i y 为指标值再按单指标进行极差分析。

§3-3正交试验的统计分析

极差分析的缺陷:①不能解决因素对指标影响的显著性问题;②若较优参数组合不是试验点,则其较优值无法知道。因此,要进行方差分析。 一、正交试验数据的分析 1、数据结构

①数学模型:i i i y εμ+=

②i μ的分解:μμ=i +各因素效应+各因素间的交互效应

真值:

∑=

i n μμ1

因素效应:设Am μ为A 取第m 水平的真值,m a 为其效应

则μμ-=Am m a ,0

=∑m a

交互效应:设AmBl μ为A 取m 水平、B 取l 水平的真值,()ml ab 为其效应,(由双因素的数据结构知,

()ij

j i ij αββαμμ+++=)

()l m Am Bl m l b a ab ---=μμ,()()0==∑∑l ml m ml ab ab

引入估计值:

μ??=i y +各因素效应的估计值+各因素间交互效应的估计值

2、计算工程平均值

即利用效应定量地估计各主要因素不同水平组合下可期望达到的指标值。

设y =μ?,y y a A -=11?,1

11111??b a y y ab B A ---=??? ??∧

若较优参数组合为212C B A ,则

122221212???????? ??+??? ??+??? ??++++=∧

∧∧bc ac ab c b a y

μ优

为较优参数组合的预测值。 二、正交试验数据的方差分析

1、方差分析的内容

①判断哪些因素对指标的影响是显著的,哪些是不显著的。 ②找出参数水平的较优组合。 ③较优组合方案指标的预测。

2、方差分析的步骤(挂豇豆脱水试验表) ①计算各类平方和:

对()

c

a b L 正交表有∑=i y T ,N T C T 2

=,a N =

总体平方和:

T

i T C y SS -=∑2,自由度1-=N f T

各列平方和:计算各列同一水平的指标和m K ,b m ~1=

T

b

m jm

j C k

N

b

SS -=

∑=1

2,

1

-=b f j

(对任一列,同一水平试验的次数看作是该水平下的重复)

误差平方和:∑∑∑∑+=--=不显著空交因SS SS SS SS SS SS T e

误差自由度:∑∑∑∑+=--=不显著

空交因f f f f f f T e

注意:(1)

∑=j T SS SS ,

∑=j

T f f 。

(2)当某交互作用同时占几列时,其平方和及自由度等于所占各列之和。 ②因素及交互作用的显著性检验:

计算均方差:因素及交互作用

因因f SS MS =

,如

A A A f SS MS =

误差

e e e

f SS MS = F 检验:

e A

A MS MS F =

然后查F 表,判断因素A 的显著性水平。不显著的因素和交互作用应并入误差项重新进行显著性检验(注意:要逐项并入)。若并入一项后,原来显著的变得不显著,则不并入。 ③选取较优组合:

根据m K 找出较优水平,根据F 确定因素主次,确定交互作用的优搭配。 显著因素选较优水平,显著交互选较优搭配,若有矛盾且交互作用比单一因素显著,则以优搭配为主。

不显著因素若无显著的交互作用,则选合适水平,在以后的研究中作固定参数。 不显著交互作用忽略。

确定较优组合:显著因素选较优水平,不显著因素选合适水平。 ④较优参数组合方案指标的预测:

先根据数据结构算优y ?

(只考虑显著因素和交互作用)

()e

e e

e n

f SS f F y y

y ?±=+=,1??ααε优优优

其中

显著列自由度之和+=

1N

n e ,α为最低的显著性水平。[例题]豇豆脱水试验

的方差分析如下表

豇豆脱水正交试验结果和方差分析表 列号

1 2 3 4 5 6 7 Vc 含量 试验号___A________B_______AXB_______C_______AXC______BXC_______________(mg/

kg)

1 1 1 1 1 1 1 1 23.627

2 1 1 1 2 2 2 2 20.250

3 1 2 2 1 1 2 2 28.300

4 1 2 2 2 2 1 1 23.433

5 2 1 2 1 2 1 2 30.276

6 2 1 2 2 1 2 1 32.498

7 2 2 1 1 2 2 1 25.435

8 2 2 1 2 1 1 2 24.863

_______________________________________________________________________________

K1 95.610 106.651 94.175 107.638 109.288 102.199 104.993 T=208.682

K2 113.072 102.031 114.507 101.044 99.394 106.483 103.689 SS 38.115 2.667 51.673 5.435 12.236 2.294 .212 MS 38.115 2.667 51.673 5.435 12.236 2.294 .212 F 值 179.79 12.58 243.74 25.64 57.72 10.82 α= 0.05 0.25 0.05 0.25 0.1 0.25

______________________________________________________________________________ vy= 26.085

SSZ= 112.6348 SSe2= .0000 fe2= 0

SSe=SSe1+SSe2=.212 fe=fe1+fe2=1 MSe=SSe/fe=.212/1=.212 较优组合方案A2B1C2指标值的预测:

()e

e e

e n

f SS f F y y

y ?±=+=,1??ααε优优优

因各因素和交互作用均显著,故

122221212???????? ??+??? ??+??? ??++++=∧

∧∧bc ac ab c b a y

μ优

085.268682

.208?====N T y μ

824.0?,578.0?,183.2?221122-=-==-==-=y k c y k b y k a C B A

541.2??2??1

265121221

=---+=---=??? ??∧b a y y y b a y y ab B A 236.1??2??22862

22222

=---+=---=??? ??∧c a y y y c a y y ac C A 535.0??2??21

62212112

=---+=---=??? ??∧c b y y y c b y y bc C B

334.32535.0236.1541.2824.0578.0183.2085.26?=+++-++=优y

()

042.18

6

11212.083.51,125.025.0±=+??±=?±=e e e n f SS F ε

042.1334.32?±=+=αε优优y y

[课堂练习]做一正交试验,研究A 、B 、C 、D 及AXB 、BXC 对指标的影响。各因素

取2水平,指标越高越好。试验方案和结果如下表,请进行方差分析并预测较优组合方案下的指标值。 [步骤]:

计算y SS TT C T T T ,,,,;

计算SS,MS ; 计算MSe ; 计算F 值;

进行显著性检验; 重算MSe ; 重算F 值;

重新进行显著性检验;

写出较优组合方案下指标预测的结构式;

计算优y ?

; 计算αε。

结果如下:

正交试验结果和方差分析表 列号

1 2 3 4 5 6 7 指标-m 试验号___A________B_______AXB_______C_______ ______BXC_______D_______

1 1 1 1 1 1 1 1 -5

2 1 1 1 2 2 2 2

4

3 1 2 2 1 1 2 2 0

4 1 2 2 2 2 1 1 3

5 2 1 2 1 2 1 2 0

6 2 1 2 2 1 2 1 5

7 2 2 1 1 2 2 1 -8

8 2 2 1 2 1 1 2 -3

_______________________________________________________________________________

K1 2.000 4.000 -12.000 -13.000 -3.000 -5.000 -5.000 T=-4

K2 -6.000 -8.000 8.000 9.000 -1.000 1.000 1.000 SS 8.000 18.000 50.000 60.500 .500 4.500 4.500 MS 8.000 18.000 50.000 60.500 .500 4.500 4.500 F 值 16.00 36.00 100.00 121.00 9.00 9.00 α= 0.1 0.1 F 值 2.52 5.68 15.77 19.09 α= 0.1 0.05 0.05 F 值 4.11 11.43 13.83 α= 0.1 0.05 0.05 ______________________________________________________________________________ vy= -.500

SSZ= 146.0000 SSe2= .0000 fe2= 0

SSe=SSe1+SSe2=0.5 fe=fe1+fe2=1+0=1 MSe=SSe/fe=0.5/1=0.5 重算:将第6列、第7列并入误差列。

SSe=SSe1+SSe2=9.5 fe=fe1+fe2=3+0=3 MSe=SSe/fe=9.5/3=3.167 再算:将第1列并入误差列。

SSe=SSe1+SSe2=17.5 fe=fe1+fe2=4+0=4 MSe=SSe/fe=17.5/4=4.375 已知较优组合为:A2B1C2D2

显著因素和交互作用有:B1、C2、A2XB1。

2121??????? ??+++=∧

ab c b y

μ优

5.084

?-=-===N T y μ

75.2?,5.1?,1?221122=-==-=-=-=y k c y k b y k a C B A

5.2??2??1

265121221

=---+=---=??? ??∧b a y y y b a y y ab B A

m y +=+++-=25.65.275.25.15.0?优

()

15.38

3

145.1754.44,11.01.0±=+??±=?±=e e e n f SS F ε

15.325.6?±+=+=m y y αε优优 三、有重复的正交试验数据的方差分析 1、有下列情况之一即会出现重复试验

①表无空列,又不想换大表; ②为提高试验精度;

③用重复取样代替重复试验。

2、有重复试验的方差分析(挂重复试验)

设每个试验点重复r 次,令it y 为第i 号、第t 次试验的观测值,则

∑==r t it i y y 1,∑==a i i y T 1,∑∑===a i r

t it

y TT 112

r a T C T ?=

2 T T C TT SS -=,1-?=r a f T

T b m jm j C K r a b SS -?=∑=1

2

,1-=b f j

21e e T e f f f f f f +=--=∑∑交因

其中

∑∑+=不显著

空SS SS SS e 1,

∑∑+=不显著

空f f f e 1

∑=-=a i i

e y r TT SS 12

21,()12-=r a f e

以下的分析同前。没有空列时有2e SS 也可进行方差分析。

[作业]有一正交试验,考察3因素3水平,每个试验点重复2次,试验结果如下表,指标越高越好,请进行极差分析和方差分析。 [答案]

正交试验结果和统计分析 列号

21e e T e SS SS SS SS SS SS +=--=∑∑交因

1 2 3 4 指标

试验号___A________B________C______________ _1____2_

1 1 1 1 1 3.05 3.20

2 1 2 2 2 2.27 2.70

3 1 3 3 3 2.40 2.14

4 2 1 2 3 3.90 3.63

5 2 2 3 1 2.64 2.90

6 2 3 1 2 2.90 2.60

7 3 1 3 2 5.90 5.50

8 3 2 1 3 5.00 5.90

9 3 3 2 1 4.95 4.00

________________________________________________________

K1 15.760 25.180 22.650 20.740

K2 18.570 21.410 21.450 21.870

K3 31.250 18.990 21.480 22.970

k1 2.627 4.197 3.775 3.457

k2 3.095 3.568 3.575 3.645

k3 5.208 3.165 3.580 3.828

Rj 2.582 1.032 .200 .372

jysp A3 B1 C1

________________________________________________________

因素主次:A,B,C

较优组合:A3B1C1

SS 22.701 3.244 .156 .414

MS 11.351 1.622 .078 .207

F值 84.08 12.01

α= 0.01 0.01

________________________________________________________

vy= 3.643

SSZ= 27.7042 SSe2= 1.1891 fe2= 9

SSe=SSe1+SSe2=.156+.414+1.189=1.759

fe=fe1+fe2=2+2+9=13 MSe=1.759/13=0.135

§3-4不等水平的正交试验设计

一、问题的提出与解决问题的原则

1、问题的提出

在实际工作中,有时会遇到各因素水平数不同的情况,这种情况需要考虑不同水平数的多因素试验。为使各因素仍具有综合可比性,也借用正交表进行试验设计,称为混合水平的正交试验设计。

2、解决问题的原则

①直接构造各种具有混合水平的正交表,选用合适的正交表即可。

②不要求表仍具有正交性——即均衡搭配。因为水平数不同的因素要达到均衡搭配,试验次数就会增多,因此,应尽量利用原有的正交表,适当进行改造,使之成为具有部分均衡搭配的表,来解决混合水平的试验。

二、不等水平的正交试验设计方法

1、并列法与混合水平正交表

将正交表的某两列合并到交互列,即用其交互列构造成专门的混合水平正交表(见附表)。这类正交表仍然是综合可比和均衡搭配的,根据不同的问题选用合适的混合水平正交表即可进行试验设计。利用此法进行混合水平正交试验设计时的统计分析与前相同,只不过几个水平就按几个水平统计即可。(注意:各因素隐含重复数不同,自由度不同)

2、拟水平法(挂拟水平法表)

若某一因素的水平数少于其它因素时,可将其中的一个水平排在两个水平的位置上,而虚拟一个水平,然后按正常的正交表进行试验设计。统计分析与前相同,只不过虚拟水平的隐含重复数和自由度是其它水平的两倍即可。

3、部分追加法(挂部分追加法表)

在正常的正交试验设计并进行试验后,若发现某一因素对试验指标的影响有某种显著的趋向,需进一步考察时,可对该因素根据影响趋势,添加若干新水平,追加几个试验,来进一步考察它的影响,称为部分追加法。

使用部分追加法时,将新的水平取代差的水平,与其相搭配的其它因素的水平不变,组成新的试验点进行试验。

进行统计分析时,可把原做试验与追加试验合在一起进行统计分析,这样可提高试验精度(其它因素水平的隐含重复数增加)。统计分析与前相同,但要注意各因素水平的隐含重复数和自由度不同。

三、进行不等水平正交试验的注意事项

1、三种方法的选用

若有相应的混合水平正交表,则直接选用。

若因素中,水平数少的因素占少数则采用拟水平法。

若原试验结果某一因素的影响趋势特别明显,需做进一步考察,则采用部分追加法。

2、用不等水平正交试验设计进行方差分析时,应注意各水平的隐含重复数与各因素的自由度。

3、不等水平的各因素不能判断交互作用。

正交试验设计数据处理的程序设计:

4个文件:(1)源程序ZJSY.FOR;(2)数据文件ZJSY.TXT;(3)执行文件ZJSY.EXE;(4)输出文件ZJSYSC.TXT

输入:在数据文件ZJSY.TXT 中输入正交表的a、b、c,正交表(按行输入),重复次数r,指标i y输出:极差分析和方差分析

正交试验设计及其方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4 (23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4 (23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.

试验设计方法

对试验设计方法的一些探究 试验设计概述: 试验研究可分为试验设计、试验的实施、收集整理和分析试验数据等步骤。而实验设计是影响研究成功与否最关键的一个环节,是提高试验质量的重要基础。试验设计是在试验开始之前,根据某项研究的目的和要求,制定试验研究进程计划和具体的试验实施方案。其主要内容是研究如何安排试验、取得数据,然后进行综合的科学分析,从而达到尽快获得最优方案的目的。如果试验安排得合理,就能用较少的试验次数,在较短的时间内达到预期的试验目的;反之,试验次数既多,其结果还往往不能令人满意。试验次数过多,不仅浪费大量的人力和物力,有时还会由于时间拖得太长,使试验条件发生变化而导致试验失败。因此,如何合理安排试验方案是值得研究的一个重要课题。 目前,已建立起许多试验设计方法。如我们大家比较熟悉的,常用单因素实验设计方法的有黄金分割法、分数法、交替法、等比法、对分法和随机法等,这些方法为多因素试验水平范围的选取提供了重要的依据,并在生产中取得了显著成效。而多因素试验设计方法有正交试验设计、均匀实验设计、稳健试验设计、完全随机化设计、随机区组试验设计、回归正交试验设计、回归正交旋转试验设计等。下面通过以下几种方法进行探究。 一、单因素试验设计 在其他因素相对一致的条件下,只研究某一个因素效应的试验,就叫单因素试验。常用的单因素试验设计方法有黄金分割法、分数法、交替法、等比法、对分法和随机法等。单因素试验不仅简单易行,而且能对被试验因素作深入研究,是研究某个因素具体规律时常用而有效的手段。同时还可结合生产中出现的问题随时布置试验,求得迅速解决。单因素试验由于没有考虑各因素之间的相互关系,试验结果往往具有一定的局限性。 单因素试验只研究一个因素的效应,制定试验方案时,根据研究的目的要求及试验条件,把要研究的因素分成若干水平,每个水平就是一个处理,再加上对照(有时就是该因素的零水平)就可以了。 例如硫酸铵加量对微生物生长的影响试验,硫酸铵的用量分、、、四个水平。 在设计单因素试验方案时,应注意数量水平的级差不能过细。过细,试验因素不同水平的效应差异不明显,甚至会被试验误差所掩盖,

试验设计与统计分析

广东药学院自编教材试验设计与统计分析 卫生统计学教研室 2014.8

第一章绪论 在医药卫生、食品等专业研究领域,常需要开展大量的试验来确定或验证研究者在科研过程中提出的科学假设,例如临床上研究某种新的降糖药的疗效时,研究者需要将研究对象(如糖尿病患者)随机地分组,使其中一组患者服用研究中的该降糖药,另一组患者服用传统的降糖药,进而比较两组药物的疗效。但在具体的试验实施之前,研究者需要面对很多问题,如试验中试验对象应如何选择和分组?如何在试验过程中避免服用不同试验药物对试验对象心理产生影响,继而影响到最终疗效的判断?选择什么样的指标可更好的反映药物疗效?样本量需要多少?试验数据应如何收集以及运用何种统计方法进行分析等等问题。因为研究过程中研究结果会受到诸多因素影响,如研究对象的年龄、性别和病情可能影响药物疗效,如果不采取科学的方法使这些因素在比较组间分布均衡,就不能得到令人信服的结论。因此为使科学研究在消耗最少人力和物力的情况下,最大限度地减少误差,获得科学可靠的结论,需要在研究开始之前对整个试验过程做出精心安排,制定详细具体的试验实施方案,即进行试验设计(experimental design)。一个科学合理的试验设计,可以达到事半功倍的效果,是试验获得成功的关键。 一、试验设计的基本要素 医学试验包括三个基本要素:即处理因素、试验对象和试验效应。如研究某降糖新药的疗效,处理因素为降糖新药及比较的传统降糖药;研究者需用糖尿病患者作为试验对象;试验效应是能反映药物疗效的指标,如患者空腹血糖或餐后血糖的下降。处理因素作用于试验对象后产生试验效应(图1),三个要素缺一不可,因此试验设计时要先明确三个基本要素,再制定详细的研究计划。 1. 处理因素 处理因素(treatment)是指研究者根据研究目的施加于试验对象,以考察其试验效应的因素。如临床上研究降糖药的疗效,降糖药即为处理因素。在试验过程中处理因素的状态称为水平(level),如比较降糖新药和传统降糖药的疗效,

第7章 正交试验设计的极差分析

第7章 正交试验设计的极差分析 正交试验设计和分析方法大致分为二种:一种是极差分析法(又称直观分析法),另一种是方差分析法(又称统计分析法)。本章介绍极差分析法,它简单易懂,实用性强,在工农业生产中广泛应用。 7.1 单指标正交试验设计及其极差分析 极差分析法简称R 法。它包括计算和判断两个步骤,其内容如图7-1所示。 图7-1 R 法示意图 图中,K jm 为第j 列因素m 水平所对应的试验指标和,K jm 为K jm 的平均值。由K jm 的大小可以判断j 因素的优水平和各因素的水平组合,即最优组合。R j 为第j 列因素的极差,即第j 列因素各水平下平均指标值的最大值与最小值之差: R j =max(jm j j K K K ,,,21 )-min(jm j j K K K ,,,21 ) R j 反映了第j 列因素的水平变动时,试验指标的变动幅度。R j 越大,说明该因素对试验指标的影响越大,因此也就越重要。于是依据

R j的大小,就可以判断因素的主次。 极差分析法的计算与判断,可直接在试验结果分析表上进行,现以例6-2来说明单指标正交试验结果的极差分析方法。 一、确定因素的优水平和最优水平组合 例6-2 为提高山楂原料的利用率,某研究组研究了酶法液化工艺制造山楂精汁。拟通过正交试验寻找酶法液化工艺的最佳工艺条件。 在例6-2中,不考虑因素间的交互作用(因例6-2是四因素三水平试验,故选用L9(34)正交表),表头设计如表6-5所示,试验方案则示于表6-6中。试验结果的极差分析过程,如表7-1所示. 表6-4 因素水平表 表6-6 试验方案及结果

正交设计助手II 3.1 软件介绍及使用实例说明

正交设计助手II 3.1 软件介绍及使用实例说明 一、软件各模块介绍 1.软件简介 正交设计助手II 3.1 是一款针对正交实验设计及结果分析而制作的专业软件。正交设计方法是我们常用的实验设计方法,它让我们以较少的实验次数得到科学的实验结论。但是我们经常不得不重复一些机械的工作,比如填实验安排表,计算各个水平的均值等等。正交设计助手可以帮助您完成这些繁琐的工作。此款软件支持混合水平实验,支持结果输出到RTF、CVS、HTML页面和直接打印。 2.创建与管理工程 打开软件后,在文件菜单项下可以“新建工程”或“打开工程”,工程文件以lat作为扩展名。如下图所示 注意:在"实验项目树"区域,右键点击当前的工程名,可修改工程名称。 3.设计实验 新建实验:在当前工程文件中新增一个实验项目,一个工程可包含多个实验项目。 每个实验项目包括有 (1)实验名称、实验描述(实验编号及简要说明)、选用的正交表类型(是标准正交表还是混合水平表) (2)选用的正交表(如L27_3_13或x_L2-3_8等) (3)表头设计结果(每个实验因素的名称、所在列及各水平的描述)。 单击实验—新建实验,如下图所示

该软件支持混合水平实验设计,你将可以选择一个更为合适您的实验的混合水平表(使用工具blend.exe - 混合水平表编辑器 - 改造系统提供的标准正交表)。如果是混合水平实验,要注意每列所能支持的最大水平数。 注意:右键点击当前的实验名称,可以修改实验信息或删除当前实验。 4.分析实验结果 (1)直观分析:根据所选用的正交表对当前实验数据作出基本的直观分析表。 (2)因素指标:以直观分析表的结果,作出当前的因素指标图(即效应曲线图)。 (3)交互作用:选择两个因素进行交互作用分析,作出交互作用表。 (4)方差分析:设定数据中的误差所在列,并选择所要采用的F检验临界值表。计算出偏差平方和(S值)和F比。并给出显著性指标。 注意:如果实验数据未正确输入,系统不能进行分析操作。

实验设计与统计分析练习题

1. 研究变量间的关系用什么方法。回归相关 2. 比较多个平均数的差异用什么方法。方差分析 3. 方差组分估计解决的问题. 4.协方差分析能够解决的问题。 5. 聚类分析能够解决的问题。 7. 规划求解能够解决的问题。 8. PB 试验要解决的问题。 9.主成分分析要解决的问题。 10.随机单位组试验设计允许试验单元有差异,要求是什么,它的模型是什么. 11.相关系数的意义. 12.12,x x 与 y 二元三次回归方程?y . 13通径分析中谁反映两变量间的综合作用,反映变量间的直接作用。 14.有1、2、3、4四个处理,要比较它们的总体平均数的差异是否显著,试验单元情况如下图,请进行试验设计: 变化方向 15.SPSS 运算得树状图如下,现要聚成二类、三类、四类,分别写出各类所含地块号。 16.因素A 有4个水平,因素B 有3个水平,共有11、…、43个不同搭配 (1) 要研究搭配的不同平均数一致否,请说明试验数据在SPSS 中的数据格式 (2) 要研究A 、B 有无交互作用,请说明试验数据在SPSS 中数据格式。 17. 为求1 2,,x x y 的的二元二次回归方程,请说明数据在SPSS 中数据格式。能够 根据运算结果给出统计结论. 18.混料试验设计题(10分) y 与x 1、x 2、x 3有关系,x 1∈[0.2,1],x 2∈[0.1,1],x 3∈[0.1,1],现采用单纯形重心设计,请给出试验设计(每个试验x 1、x 2、x 3用实值)。 19.响应面分析试验设计题,y 与x 1、x 2有关系,x 1∈[3,11],x 2∈[6,10],现采用通用旋转组合设计,请给试验方案(每个试验x 1、x 2用实值)。

常见的实验设计与计算举例

常见的实验设计与举例 一、单因素实验设计 单因素完全随机设计、单因素随机区组设计、单因素拉丁方实验设计和单因素重复测量实验设计是四种基本的实验设计,复杂的实验设计大多都是在这四种形式上的组合。研究者根据不同的研究假设、实验目的与条件使用不同的实验设计,但无论哪种实验设计都有一个共同的目标,即控制无关变异,使误差变异最小。 1.完全随机设计研究中有一个自变量,自变量有两个或多个水平,采用随机化方法,通过随机分配被试给各个实验处理,以期实现各个处理的被试之间在统计上无差异,这种设计每个(组)被试只接受一个水平的处理。完全随机实验的方差分析中,所有不能由处理效应解释的变异全部被归为误差变异,因此,处理效应不够敏感。 例:研究阅读理解随着文章中的生字密度的增加而下降。自变量为生字密度,共有四个水平:5:1、10:1、15:1、20:1,因变量是被试的阅读理解测验分数。实验实施时,研究者将32名被试随机分为四个组,每组被试阅读一种生字密度的文章,并回答阅读理解测验中有关文章内容的问题。 完全随机实验设计实施简单,接受每个处理水平的被试数量可以不等,但需要被试的数量较大,且被试个体差异带来的无关变异混杂在组内变异中,从而使实验较为不敏感。完全随机实验数据的统计分析,如果是单因素两组设计,采用独立样本t检验;如果是单因素完全随机多组设计则采用一元方差分析(One -Way ANOV A)。 2.随机区组设计研究中有一个自变量,自变量有两个或多个水平,研究中还有一个无关变量,也有两个或多个水平,并且自变量的水平与无关变量的水平之间没有交互作用。当无关变量是被试变量时,一般首先将被试在这个无关变量上进行匹配,然后将他们随机分配给不同的实验处理。 例:仍以文章的生字密度对阅读理解影响的研究为例,但由于考虑到学生的智力可能对阅读理解测验分数产生影响,但它又不是该实验感兴趣的因素,于是研究者采用单因素随机区组设计,在实验实施前,研究者首先给32个学生做了智力测验,并按智力测验分数将学生分为8个区组,然后随机分配每个区组内的4个同质被试分别阅读一种生字密度的文章。

临床药代动力学试验的常见设计类型与统计分析

发布日期 20140327 化药药物评价 >> 临床安全性和有效性评价 临床药代动力学试验的常见设计类型与统计分析 张学辉,卓宏,王骏 化药临床二部 一、临床药代动力学试验的统计分析问题现状 临床药代动力学试验在新药上市注册申请中占有重要地位。 与大样本量的 临床试验相比,这类试验样本数少、 观测指标少,其统计分析问题要简单很多, 未引起申请人或研究者的重视,一般较少邀请统计专业人员参与。甚至一些人 认为这类试验是描述性试验,不需要进行专业的统计分析。其实正是因为这类 试验的样本数少,才要更加重视其试验设计和统计分析的规范性,才能得出相 对可靠的专业结论。从目前申报资料看,存在较多问题: 1 )研究设计时未充 分考虑三要素”(受试者、试验因素、观察指标),无法满足研究目标的专业 需要;2)研究设计不符合 四原则”(随机、对照、重复和均衡),不采用常见 的设计类型,设计出一些不同寻常的异型试验; 3)资料整理和统计分析方法 选用不当,与研究设计类型不匹配,尤其是滥用 t 检验和单因素多水平设计资 料的方差分析方法。 临床药代动力学试验的一般要求参见技术指导原则 ⑴。本文拟介绍这类试 验的常见研栏目 标题 作者 部门 正文内容

究设计类型与统计分析方法,供大家参考。 二、创新药物临床药代动力学试验 这里的创新药物是指新化学实体。这类药物通常在健康受试者中进行多项 的临床药代动力学试验,包括单次给药、多次给药、食物影响、药代动力学相互作用等药代动力学试验。后续还要进行目标适应症患者和特殊人群的药代动力学试验。 2.1创新药物单次给药药代动力学试验 创新药物的健康受试者单次给药药代动力学试验通常在I期耐受性试验结 束后进行。受试者例数一般要求每个剂量组8?12例,男女各半。药物剂量, 一般选用低、中、高三种剂量,有时会选用更多剂量。剂量的确定主要根据I 期临床耐受性试验的结果,并参考动物药效学、药代动力学及毒理学试验的结果,以及经讨论后确定的拟在∏期临床试验时采用的治疗剂量推算。高剂量组剂量必须接近或等于人最大耐受的剂量。 由于该类药物初上人体试验,出于安全性和伦理的考虑,每位受试者只给药一次,最常采用多剂量组平行设计。一般设计为在健康受试者(男女各半)中、随机、开放、多剂量组平行、单次给药的药代动力学试验。整理这类试验的药代动力学参数时,可以归类为两因素(剂量、性别)析因设计。各剂量组内性别间差异无统计学意义或者不考虑性别因素时,可以将该试验简化为单因素(剂量)的平行组设计。 安全性好的药物,在伦理允许情况下,也可采用多剂量组、多周期的交叉设计。交叉设计的优点是节省样本量、自身对照、减少个体间变异,缺点是多周期时间长、重复测量次数多、受试者依从性差易脱落、统计分析方法复杂。 当选用低、中、高三个剂量组时,通常采用随机、开放、单次给药、三剂量组

正交实验设计方法--非常有用

L9(34) 序号 1 2 3 4 1 1 1 1 1 2 1 2 2 2 3 1 3 3 3 4 2 1 2 3 5 2 2 3 1 6 2 3 1 2 7 3 1 3 2 8 3 2 1 3 9 3 3 2 1 回首页 正交试验设计法 正交试验设计法的基本思想 正交表 正交表试验方案的设计 试验数据的直观分析 正交试验的方差分析 常用正交表 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。

试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C 也都取三个水平: A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法: (Ⅰ)取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,共有 33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 图1 全面试验法取点.......... (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。

第八章常用试验设计的方差分析

第八章 常用试验设计的方差分析 8.1 多因素随机区组试验和单因素随机区组试验的分析方法有何异同?多因素随机区组试验处理项的自由度和平方和如何分解?怎样计算和测验因素效应和互作的显著性,正确地进行水平选优和组合选优? 8.2 裂区试验和多因素随机区组试验的统计分析方法有何异同?在裂区试验中误差E a 和E b 是如何计算的,各具什么意义?如何估计裂区试验中的缺区?裂区试验的线性模型是什么? 8.3 有一大豆试验,A 因素为品种,有A 1、A 2、A 3、A 4 4个水平,B 因素为播期,有B 1、B 2、B 3 3个水平,随机区组设计,重复3次,小区计产面积25平方米,其田间排列和产量(kg )如下图,试作分析。 区组Ⅰ 区组Ⅱ 区组Ⅲ [答案: e MS 0.31,F 测验:品种、播期极显著,品种×播期不显著] 8.4 有一小麦裂区试验,主区因素A ,分A1(深耕)、A2(浅)两水平,副区因素B ,分B1(多肥)、B2(少肥)两水平,重复3次,小区计产面积15平方米,其田间排列和产量(假设数字)如下图,试作分析。 区组Ⅰ 区组Ⅱ 区组Ⅲ [答案: a E MS =0.58, b E MS =2.50,F 测验:A 和B 皆显著,A ×B 不显著] 8.5 设若上题小麦耕深与施肥量试验为条区设计,田间排列和产量将相应如下图,试作分

析,并与裂区设计结果相比较)。 B 1 B 1B 2 B 2 B 2B 1 [答案: A E MS =0.58, B E MS =1.75, c E MS =3.25,F 测验A 、B 均显著,A ×B 不显著] 8.6 江苏省淮南地区夏大豆区域试验部分资料摘录如下: 试点 年份 区组 CK 19—15 31—15 4—1 21—16 试点1 1977年 Ⅰ 134 160 168 226 196 Ⅱ 146 180 156 170 190 Ⅲ 148 206 188 216 200 1978年 Ⅰ 220 264 280 212 168 Ⅱ 228 260 276 208 156 Ⅲ 208 220 300 260 148 试点2 1977年 Ⅰ 137 236 197 196 155 Ⅱ 173 207 178 192 179 Ⅲ 110 171 223 208 125 1978年 Ⅰ 179 201 150 195 186 Ⅱ 182 224 189 203 191 Ⅲ 207 262 187 210 183 各年各点均为随机区组设计,试分析此试验结果。 [答案: 2 =3.67,e MS =406.06,Fv=12.89,Fvs=1.88,Fvy=5.18,Fvsy=10.35] 8.7 在药物处理大豆种子试验中,使用了大中小三种类型种子,分别用五种浓度、两种处理时间进行试验处理,播种后45天对每种各取两个样本,每个样本取10株测定其干物重,求其平均数,结果如下表。试进行方差分析。 处理时间A 种子类型C 浓度B B 1(0×10-6) B 2(10×10-6) B 3(20×10-6) B 4(30×10-6) B 5(40×10-6) A 1(12小时) C 1(小粒) 7.0 12.8 22.0 21.3 24.4 6.5 11.4 21.8 20.3 23.2 C 2(中粒) 13.5 13.2 20.4 19.0 24.6 13.8 14.2 21.4 19.6 23.8 C 3(大粒) 10.7 12.4 22.6 21.3 24.5 10.3 13.2 21.8 22.4 24.2 A 2(24小时) C 1(小粒) 3.6 10.7 4.7 12.4 13.6 1.5 8.8 3.4 10.5 13.7

田间试验设计与统计分析期末复习试题

一、判断题 1. 在采用分层随机抽样时,若各区层所包含的抽样单位数不同,则从各区层抽取单位数应根据其所包含的抽样单位数按比例配置。(√) 2.二项分布属于连续型概率分布(×) 3.一般情况下,长方形尤其是狭长形小区的试验误差比正方形小区的大(×) 4.准确性是指在试验中某一试验指标或性状的观测值与其真值接近的程度(√) 5.调和平均数主要用于反映研究对象不同阶段的平均速率(√) 6.在计算植物生长率时,用调和平均数比用算术平均数更能代表其平均水平(×) 7.就同一资料而言,调和平均>数几何平均数>算术平均数(×) 8.通常将样本容量n30的样本称为大样本,将样本容量n30的样本称为小样本(√) 9.正态分布属于离散型概率分布(×) 10.统计分析的试验误差主要指随机误差。这种误差越小,试验的准确性越高(×) 二、填空题 1. 正交试验设计表的主要性质有正交性、代表性、综合可比性。 2. 两个变量数据依据确定性关系可分为函数关系和相关关系2种类型。 3. 常用统计图的绘制方法主要有直方图、多边形图、条形图、圆图这4种图形。 4.在田间试验中,由观察、测量所得的资料,一般可分为数量性状资料和质量性状资料两大类。 5. 小样本抽样分布主要包括三类分布:t分布、 X2分布和F分布。 6. 随机事件可分为:必然事件、不可能事件和基本事件3种类型 7. 常用的田间试验设计方法主要有随机区组试验、随机裂区试验、拉丁方试验。 8. 正交试验设计表的主要类型有两种分别相同水平正交表和混合水平正交表 9. 田间试验常用的随机抽样方法有简单随机抽样、分层随机抽样、整群随机抽样和多级随机抽样 10. 试验地土壤差异测量的方法有目测法和肥力测定法 12. 试验处理重复的作用分别是估计试验误差和降低试验误差。 13. 试验地土壤肥力差异的表现形式大致可分为肥力梯度的变化和斑块状变化。 14. 在研究玉米种植密度和产量的相关关系中,其中种植密度是自变数,产量是依变数 15. 小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30 和4.5(厘米),根据 CV A 大于_ CV B _,品种_ A _ 的该性状变异大于品种_ B _。 16. 田间试验常用的随机抽样方法有、、和等 17.根据试验的内容将田间试验分为:品种试验、栽培试验、品种和栽培相结合的试验3种类型。 18. 统计学中,一般来说常见抽样的方法有典型抽样、随机抽样和顺序抽样3种方法。 19. 在Excel表格中计算正态分布概率值和反正态分布随机变量的函数分别是NORMDIST 和NORMINV

实验设计与统计分析

填空题 1.数据资料按其性质不同各分为资料和资料两种。 2.有共同性质的个体所组成的集团称为。从总体中抽取部分个体进行观测,用以估计总 体的一般特性,这部分被观测的个体总称为。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为;由样本的全部观察 值求得的用以估计总体参数的特征数叫。 4..试验误差可以分为误差和误差两种类型。 5.从总体中抽取的样本要具有代表性,必须是抽取的样本。 6.样本根据样本容量的多少可以分为和。 8.小麦品种A穗长的平均数和标准差值为12cm和3cm,品种B为18cm和3.5cm,根据__________,判断品种______的 该性状变异大。 9.某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取抽取50绳测其毛重,结果如下所示: 平均数X(kg)极差R(kg)标准差S(kg)变异系数CV% 贻贝单养42.70307.0816.58贻贝与海带混养52.1030 6.3412.16根据和,判断的效果好。 10.在统计学中,常见平均数主要有和。 11. 12. 13. 14. 15. 16. 17. 简答题 1.如何控制、降低随机误差,避免系统误差? 2.什么是准确性,精确性?如何提高试验的正确性? 3.统计表与统计图有何用途?常用统计图、统计表有哪些? 4.生物统计学中常用的平均数有几种?各在什么情况下应用? 5.为什么变异系数要与平均数、标准差配合使用? 多选题 1.下列总体中属于有限总体的是()。 A 保定地区棉田中棉铃虫的头数 B 20m2的试验小区中鲁玉4号玉米的株高 C 66.7万公顷鲁玉4号玉米的株高 D 320株水稻中糯稻的株数 2.下列数据资料中属于连续型变数资料。

《食品试验设计与统计分析》教学大纲

《食品试验设计与统计分析》教学大纲 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

《食品试验设计与统计分析》教学大纲 课程编号:2200054 学时:32 学分:2 授课学院:农业与生物工程学院 适用专业:食品科学与工程 教材:王钦德,杨坚主编. 食品试验设计与统计分析(第一版).中国农业大学出版社,2003 主要参考资料: 1.李云雁,胡传荣.试验设计与数据处理.化学工业出版社,2005 2.明道绪.生物统计附试验设计(第三版).中国农业出版社,2002 3.袁志发,周静芋主编.试验设计与分析.高等教育出版社,2000 一.课程的性质、目的及任务 本课程的性质是专业选修课。 食品质量保持、贮藏方法、货架寿命、营养价值,安全性和经济特性的研究及卫生标准的制定等都离不开调查和试验,都必须通过试验设计与统计分析获得可靠的数据。 试验设计是以数理统计为理论基础,对科学研究中拟通过试验解决的具体问题提出科学而合理的试验方案,指导和保证试验环节的正确实施,力求以最经济的试验投入获得尽可能多的数据信息,然后用科学的统计方法进行数据处理,得出可靠的结论,从而进一步指导生产以及科研工作。食品试验设计与统计分析是试验设计在食品科学领域的具体应用,为食品科学工作者所必备的专业知识。学习本课程的主要目的是让学生掌握试验设计的基本原理和方法,培养学生分析问题和解决问题的能力,使学生能够独立设计试验和实施试验,正确制定试验方案,并能对试验结果进行正确的统计处理,培养学生成为具有一定试验设计水平的高级专业人才。针对食品数据的特点,巧妙地选用恰当高效的统计分析方法,解决实践中遇到的问题,得到可靠的结果和科学的结论。二.教学基本要求 了解基本原理;熟练掌握所介绍的几种试验设计方法,能独立进行试验设计;熟练掌握所介绍的几种数理统计方法,能独立地对试验结果进行合理的统计分析;掌握常用数据处理软件的使用。 通过学习本课程,应具备以下能力:

食品试验设计与统计分析复习题.doc

食品试验设计与统计分析基础 一、名词解释 1.总体:具有共同性质的个体所组成的集团。 2.样本:从总体中随机抽取一定数量,并且能代表总体的单元组 成的这类资料称为样本。 3.参数:由总体里所有观察值算得用以说明总体的数据特征,常 用希腊字母表示。一般有总体平均数μ,总体方差δ2,总体标准差δ等几种参数恒定不变。 4.统计数:有样本里全部观察值算得说明样本特征的数据。包 括样本平局数,标准差 S,样本方差 S2. 5.准确性:试验结果真是结果相接近的程序。 6.精确性:在相对相同的条件下,重复进行同一试验,其结果 相接近的程度。 7.系统误差:认为因素造成的差异。 8.随机误差:各种偶然的或人为无法控制的因素造成的差异。 9.数量性状的资料:能够称量、测量和计数的方法所表示出来 的资料。可分连续性 .数量性状的资料和间断 .数量性状的资料。 10.连续性资料:用计量的方法得到的数据性资料。 11.间断性资料:用计数的方法得到的数据性资料。 12.质量性状的资料:只能观察、分类或用文字表述而不能测量 的一类资料。 13.两尾检验:具有两个否定域的假设试验。 14.一尾检验:具有单个否定域的月统计假设试验。 15.参数估计:又叫抽样估计,是样本统计数估计总体参数的 一种方法。

16.点估计:用样本统计数直接估计相应总体参数的方法。 17.区间估计:在一定的概率保证下,用样本统计参数去估计 相应总体参数所在范围。 18.置信区间:估计出参数可能出现的一个区间,使绝大多数该 参数的点估计值都包含在这个区间内,所给出的这个区间称为置信区间。 19.α错误:把试验误差判断为真实差异,否定了正确的H(措施: 降低显著水平)。 20.β错误:把真实差异判断为试验误差,接受了错误的H(措施: 科学的试验设计,提高样本容量)。 21.置信度:保证参数出现在置信区间内的概率称为置信度。 22.直线回归:研究 x、y 变量间因果依存的方法。 23.直线相关:研究两个变量间直线关系的相关分析。 24.试验指标:根据研究的目的而选定的用来衡量或考核试验 效果的质量特性。 25.试验因素:试验中所研究的试验指标的因素。 26.因素水平:试验因素所处的某种特定状态或数量等级。 27.试验处理:事先设计好的实施在试验单位上的一种具体措 施或项目称为试验处理。 28.试验单位:施加试验材料的单位。 29.重复:指在一个处理有 2 个或 2 个以上的试验单位。 30.随机化:将各个试验单位完全随机的分配在试验的各个处理 中。 31.局部控制:指当非试验因素,对试验指标的干扰不能从试验中排除时,通过采取一定的技术措施或方法来控制,从而降低或纠正它 们的影响,提高统计推断的可靠性。

7正交试验设计

正交试验设计 1正交试验的引入 在实际的生产实践当中,由于需要考虑的因素(对结果产生影响的变量)通常比较多,同时,每个因素的水平个数(每个变量的可取值个数)也不止一两个。如果对每个因素的每个水平交互搭配全部进行试验,例如:对于5因素4水平的 实验,全部次数为:541024 ,需要用相当长的时间进行统计分析计算,同时耗费了大量的人力物力。 而如果采用正交试验设计,试验的次数将大大减少,同时对统计结果的分析也变得简单。正交试验设计是利用正交表科学的安排与分析多因素试验的方法,是最常用的试验设计之一。 2正交表的分类及优势 正交表分为:等水平正交表和混合水平正交表。等水平代表各因素所取的水平数相同,混合水平表示各因素的水平数不一定相同。 正交表的优点:(1)能够在所有方案中均匀的选出具有代表性的方案; (2)通过对少数试验的分析,可以推得较优的方案,并且较优方案往往不包含在少数进行试验了的方案中。 (3)通过对结果分析,可以得到更多有用的信息。包括各因素的重要性等。 3正交试验设计的步骤 总的来说包括两部分:一是试验设计,二是数据处理。归纳为: (1)明确试验目的,确定评价指标; (2)挑选因素,确定水平; (3)选正交表,进行表头设计:一般要求为因素数≤正交表列数 (4)明确试验方案,进行试验得到结果; (5)对结果进行统计分析:采用直观分析法或方差分析法,得到因素的主词以及优方案等信息; (6)进行验证试验,做进一步的分析。 4有交互作用的正交试验设计 在许多试验中,不仅要考虑各个因素对试验指标起作用,还有考虑因素间的交互作用对试验解结果的影响。在这种正交试验的设计当中,要把交互作用也作为因素考虑进去。可以查对应的正交表来进行表头设计。 5举例 下面通过举例来说明如何设计正交表以及对用不同的方法对试验结果进行分析。例1(三水平三因素正交表设计以及直观分析法)以下试验考虑的两个指标全部是越大越好,试验因素和水平如下表,试推出两项指标都高的试验方案。

重磅正交试验设计典型案例

正交实验设计案例分析 45120611戴杰 摘要:正交实验设计法在工业生产中具有广阔的应用领域,但由 于推广不够,在实践少有应用,除了观念上的影响外,对操作方 法的疑惑和不熟悉,也是重要因素。我们小组选取了两个典型案 例,对正交实验设计法的操作方法和步骤进行了介绍。 正交实验设计法在工业生产中具有广阔的应用领域。作为一种科学的实验方法,它以投资少、易操作见效快的特点而为人们所关注,在已经试点过的单位都不同程度地取得了明显效果,受到企业的普遍欢迎。正交实验设计法虽然已经取得了骄人的业绩,但它的推广并不普遍。原因主要是许多企业科学意识差,对正交法缺乏正确认识,不懂操作程序,甚至怕麻烦。鉴于此,我们选择了两个典型案例,对正交法的应用程序和方法做出了说明。 一、双氰胺生产工艺的优化研究 1.1 立项背景 山西省双氰胺厂。1989年引进技术,设计能力为年产双氰胺500t,1990年投产,1991年全年生产双氰胺300t。虽然当时双氰胺出厂价为15000元/t,市场供不应求,但由于该企业产量达不到设计能力,成本很高,年亏损30多万元,企业处于非常困难的境地。 1.2 经诊断发现的问题 (1)双氰胺的主要原材料质量差,有效含氮量低。调查结果:石灰氮最好是一级品占一半,其余为二级品以下。石灰氮产品的行业标准(有效含氮量)是:优级品>=20%,一级品>18%,二级品>17%,次品<17%。经过对比,该厂石灰氮有效含氮量低,是双氰胺消耗高、成本高、产量低的主要原因。 (2)石灰窑CO2气体浓度太低且很不稳定,是制约双氰胺生产的关键因素。经调查发现,CO2气体浓度一般在17%以下,有时12%左右,致使双氰胺车间第一道工序(即水解工序)脱钙速度慢、时间长,是制约双氰胺产量的关键。 (3)双氰胺的生产工艺影响因素多,优化潜力大。经分析认为:水解投料量、水解pH 值、聚合工序的聚合温度、聚合pH值、结晶温度等因素,均对产品质量和消耗有影响。多因素影响正好适用正交法。 1.3 正交法在各生产车间的应用及效果 (1)提高白灰窑CO2气体浓度的正交实验。经调查,投入的煤和石头的比例是由人工估计的,并不计量,每天加料总量和分配的层次随意性很大。由于没有固定的工艺标准,CO2气体浓度既不可能稳定,生产效果也不可能提高。故采取了以下措施:一是安装地磅,投入的煤和石头要求过磅计量;二是实施正交优化。 经计算,石灰窑优化方案的因素水平及实验结果(选用L9(3^4)正交表安排实验)分别如表1、表2所示。 表1 因素水平表

利用SPSS_进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

常用几种实验设计统计分析方法的正确选择一完全随机设计资料的统计分析方法

读者作者编者 常用几种实验设计统计分析方法的正确选择&一’ 完全随机设计资料的统计分析方法 闫丽娜e杨海涛e高霞 河北医科大学流行病与卫生统计教研室河北石家庄050017> 关键词:统计学e医学;方法;数据收集 中图分类号:R195.1 文献标识码:A 文章编号:1004-583X(2013)03-N-02 d o i:10.3969/.i s s n.1004-583X.2013.03.045 在医学科学研究中要实现完整而准确的统计分析首先要确定实验设计的类型详见本刊2013年28卷第2期医学科研中常用实验设计方法其次分清资料的类型根据数据资料类型分为定量资料和定性资料两种定量资料是通过一定的度量衡方法对观察单位测得的数据有度量衡单位医学上常见的各种生理学生化学指标如血压脉搏血红蛋白白细胞血清胆固醇等都为定量资料进行统计描述时若为正态分布常用平均值标准差I S>表示若为非正态分布常用[中位数四分位数距>][M G R>]表示定性资料是将观察单位按某种属性或类别分组然后清点各组的观察单位数如性别血型某病的治愈未愈人数等都为定性资料进行统计描述时常用例>构成比相对比表示再者应该考虑各种统计方法的适用条件现将完全随机设计资料中常用的统计分析方法介绍如下 1数据资料为定量资料 1.1两样本之间进行比较一般应用统计软件先对其正态性和方差齐性进行检验检验水准常取0.10如果两资料满足正态分布同时方差齐选择两独立样本I检验[1]如果只满足正态分布而方差不齐则应用I H检验如果不服从正态分布或既不是正态分布又不能满足方差齐性应选用两独立样本比较的秩和检验W i l c o x o n秩和检验>[2]常见错误=不考虑I 检验和检验的适用条件一律采用I检验 1.2多样本之间比较首先也要考虑是否满足正态性和方差齐性方法同前如满足选用完全随机设计方差分析若P> 0.05认为多个总体均值之间无差别若P<0.05认为多个总体均值总的来说有差别还需进一步做两两比较常用 S N K检验G检验>L S D-I检验B o n f e r r o n i检验[3]S N K 检验G检验>适用于所有各组两两间的比较即探索性研究例如3种抗癌药物的治疗效果两两之间是否有差别事先未知任何信息需要用S N K检验去探索性分析到底哪两组有差别L S D-I检验适用于证实性研究中事先计划好的某几对均值间的比较例如两个试验组如某新药不同的两个剂量组>与对照组比较是否有差异可采用L S D-I检验分别对两剂量组与安慰剂进行检验B o n f e r r o n i检验是多重比较中应用最多的方法该方法优点是简单适用范围广但结果较为保守例如3组间两两比较共需比较3次初始检验水准为0.05调整后的检验水准为0.05/3=0.017两两比较所得P 值要与0.017比较从而得出结论如不满足则选用多个样本 比较的秩和检验K r u s k a l-W a l l i s~检验>当P<0.05时常采用扩展的I检验进行两两比较常见错误=不考虑方差分析后两两比较的适用范围方差分析后一律采用S N K检验 2数据资料为无序定性资料 2.1两样本之间进行比较t若为两分组结局变量为两水平即普通2X2四格表见表1结局变量为有效和无效当n j40且四个格子理论频数T>j5时选用四格表检验;当n j40但存在有格子的理论频数1<T t5时选用校正o2检验;当n t40或存在理论频数T t1时不宜采用o2检验选用F i s h e r确切概率法;当P。a时选用四格表资料的F i s h e r确切概率法@若仍为两分组结局变量为三水平及以上即2X C表见表2结局变量为A型B型A B型O型>要比较两者的构成比是否有差别时若不存在超过1/5以上的格子理论频数1<T t5或不存在任何一个格子的理论频数T t 1选用RXC表o2检验的方法否则选用F i s h e r确切概率法常见错误=四格表资料不考虑例数和理论频数等适用条件一律采用四格表o2检验;2XC表资料不计算各个格子的理论频数导致不考虑是否有1/5以上的格子理论频数1<T t5或有任何一个格子的理论频数一律采用RXC表o2检验 表1两种药物治疗脑动脉硬化的疗效[例>] 组别例数有效无效新药组444193.2>36.8> 传统药物组241875.0>625.0> 表2患者与健康输血员血型分布例> 组别例数A型B型A B型O型合计 疾病组239476********* 健康组18752541962187 2.2多样本之间进行比较如果比较多组之间率或构成比有无差别或推断两种分类变量有无关联性适用条件同2X C表选用RXC表o2检验RXC表o2检验如果有差异还需采用率的多重比较进一步推断哪两个总体率间有差别一般选用S c h e f f e'可信区间法及B o n f e r r o n i检验水准调整法[4] 3数据资料为有序定性资料 3.1两样本之间进行比较即单向有序资料如分组变量为两药物组结局变量为显效有效无效>选用两独立样本 W i l c o x o n秩和检验常见错误=不考虑结局变量是否有序一律选用RXC表o2检验 3.2多样本之间进行比较t若分组变量如年龄各阶段>有序而结局变量无序可视为双向无序采用RXC表检验; (下转正文第244页) N<临床荟萃>2013年3月5日第28卷第3期C l i n i c a l F o c u s M a r c h52013V o l28N o.3万方数据

相关文档
相关文档 最新文档