文档库 最新最全的文档下载
当前位置:文档库 › 6 统计推断

6 统计推断

6 统计推断
6 统计推断

第六章统计推断

第四章研究了随机变量的几种分布律,总体如何配合样本,第五章讲的是样本统计量的分布规律,这些都属于总体与样本之间关系的第一个方面。本章讨论第二个方面,即如何通过样本来推断总体。由样本推断总体是以各种样本统计量的抽样分布为基础的。

所谓统计推断是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概率形式表述的

推断,它主要包括假设检验和参数估计两个内容。

对所估计的总体提出一个假设,例如假设这个总体的平均数μ等于某个值μ0(μ= μ0),然后通过样本数据去推断这个假设是否可以接受。如果可以接受,样本很可能抽自这个总体;否则,很可能不是抽自这个总体。这一统计推断过程就是所谓的统计假设检验。

第一节单个样本的统计假设检验

一、一般原理及两种类型的错误二、单个样本显著性检验的程序

三、在σ已知的情况下,单个平均数的显著性检验—U 检验

四、在σ未知时平均数的显著性检验——t 检验五、变异显著性的检验—x 2检验

一、一般原理及两种类型的错误

例1 用实验动物做实验材料,要求动物平均体重μ=10.00g ,若

μ<10.00g,则需再饲养,若μ>10.00g则应淘汰。动物体重是服从正态分布N (μ,σ2)的随机变量。已知总体标准差σ= 0.40g ,但总体平均数μ是未知的。为了得出对总体平均数μ的推断,从动物群体中,随机抽取含量为n的样本,通过样本平均数推断总体平均数μ。

(一)基本概念

x 零假设是被检验的假设,通过检验可能被接受,也可能被否定。本例中如果接受H 0:μ=10.00g , 表示该实验条件下饲养的实验动物可供实验用。

这里假设μ=μ0或μ-μ0=0, 称为零假设(null hypothesis),记作H 0:μ=μ0或H 0:μ-μ0=0。

1.假设

提出零假设的同时,相应地有一对应假设,称为备择假设(alternative hypothesis),记作H A :μ>μ0, μ<μ0,μ≠μ0。

备择假设是在零假设被拒绝时准备接受的假设。本例的备择假设若已知μ不可能大于μ0,则

H 。g H A A 继续饲养表示动物需接受00:)00.10(:μμμμ<<

H 。g H ,g A A 表示动物应被淘汰接受则不可能小于若已知000:)00.10(:)00.10(μμμμμμ>>。

g H ,,A )00.10(:,000000μμμμμμμμμμμμ≠<>这里的不可能小于或是可能大于不或者并不知道还是心究竟是并不关是否等于若考查的目的只是判断若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,因此拒绝假设。

2. 小概率事件实际不可能性原理

当一事件发生的概率很小(例如小于0.05或0.01)时,在一次试验中可认为其实际上不可能发生,这叫小概率事件实际不可能性原理。

x g ,n

N x ,n N ,标准化后服从的样本从中随机抽取含量为动物体重服从本例中,40.000.10),,

(),,(02

2===σμμσ

μσμQ ).1,0(40

.000

.100

N n

x n

x U 服从得?=

?=

σμ。

,,,,,。x ,。x ,,u U p u U p 假设拒绝零假设而接受备择即的条件不正确说明假设但实际上它发生了会发生的在一次试验中几乎是不它根据小概率原理概率事件的总体的事件是一个小数为抽自平均则如果得到的概率很小的总体的概率平均数为抽自可能得到或者说的值或可以得到αα000)()(μμμμ≠><显著性检验:假设检验也叫显著性检验,是根据小

概率原理建立起来的检验方法。

检验统计量:作为统计假设检验使用的统计量。如u 、t 、F 和χ2等。

显著水平(Significance level )

在显著性检验中,否定或接受零假设的依据是“小概率事件实际不可能性原理”。用来确定拒绝或接受零假设的概率标准叫显著水平,记作α。在生物学研究中常取α=0.05 或α=0.01。

显著性检验的基本步骤:

n 首先对试验样本所在的总体作假设(零假设和备择假设)。

o 在零假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布。(得出零假设成立的概率)

p 根据“小概率事件实际不可能性原理”否定或接受零假设。(在一定的概率保证下,对零假设是否成立作出判断)

3、双侧检验与单侧检验

在显著性检验中,零假设为H 0:μ=μ0, 备择假设为H A :μ≠μ0。此时备择假设包括μ>μ0或μ<μ0两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。

(1)双侧检验(two-sided test)

?此时,在α水平上拒绝域为(-∞,-μα/2)和(+μα/2,+∞),对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如下图所示。?这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,μα为双侧检验的临界u值。

g 。

x ,n ,23.1010:2==并已计算出样本平均数

的样本抽取含量为从上例的动物群体中例g

H g H A 00.10:,00.10:0≠=μμ82

.110

40

.000

.1023.10=?=

?=

n

x u σ

μ

96

.1,05.02

==ααu ,

u u u 落在接受域内即82.1,2

2

αα<

00.10:0g H =μ结论是接受g 。

00.10数等于即抽出样本的总体平均(2)单侧检验(one-sided test)

但在有些情况下,双侧检验不一定符合实际情况。若已知实验动物体重不可能小于10.00g。零假设应为H 0:μ=μ0或H 0:μ-μ0=0,备择假设应为H A :μ>μ0。

这时的否定拒绝域在u 分布曲线的右尾,在α水平上,H 0的拒绝域为(μα,+∞),右侧的概率为α,如下图所示。

若零假设为H 0:μ=μ0,备择假设为H A :μ<μ0,此时的否定域在u 分布曲线的左尾。在α水平上H 0的否定域为(-∞,-μα),左侧的概率为α。

这种利用一尾概率进行的检验叫单侧检验也叫单尾检验。此时μα为单侧检验的临界u 值。

g 。

x ,n ,23.1010:2==并已计算出样本平均数的样本抽取含量为从上例的动物群体中例,

g H 养的时间长得多比根据以往经验所需饲的时间已知这批动物实际饲养,00.10:0=μg

H A 00.10:>μ82

.110

40

.000

.1023.10=?=

?=

n

x u σμ

645.1,05.0==ααu ,

u u 落在否定域内即82.1,α>g

H ,H A 00.10:0>μ接受结论是拒绝。

g g ,的某个值于未知总体的平均数是大数并不等于即抽出样本的总体平均00.1000.10(3)单侧检验与双侧检验的关系

单侧检验的u α=双侧检验的u 2α

若对同一资料进行双侧检验也进行单侧检验,那么在α水平上单侧检验显著,只相当于双侧检验在2α水平上显著。

所以,同一资料双侧检验与单侧检验所得的结论不一定相同。双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。尽可能选择单侧检验。

4.两种类型的错误

因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定零假设,都没有100%的把握。也就是说,在检验一个假设时可能犯两类错误。

n 第一类错误是真实情况为H 0成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(type I error)

?犯Ⅰ型错误的概率不会超过α,Ⅰ型错误也叫α错误,在医学上还称为假阳性错误。

00)(μμα==Ι=,H H p p 是正确的拒绝型错误o 第二类错误是H 0实际不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(type Ⅱerror)。

?犯Ⅱ型错误的概率记为β。Ⅱ型错误又叫β错误,在医学上还称为假阴性错误。

1

00)(μμβ==Π=,H H p p 是错误的接受型错误

两类错误间的关系如图所示,图中左边曲线是H 0:μ=μ0为真时,样本平均数的分布密度曲线;右边曲线是H 0:μ=μ1为真时,样本平均数的分布密度曲线。

两类错误示意图

由图不难看出,当α值变小时,β值变大;反之,α值变大时,β值变小。也就是说Ⅰ型错误α的降低必然伴随着Ⅱ型错误β的升高

)

30.10(),00.10(10g g μμμμ=≠实际上645

.1,05.0==ααU 10

40

.000.10645.10?=

x 208

.100=x 2327

.0)73.0()10

40

.030

.10()208.10(=?<=?<=<=U p x U p x p β:

从图中可知越大

时愈接近于βμμ,01)1;,的概率而错误地接受表示实际上有关与01

11μμμμβμβμ==;

,,n 、必增大降低一定时βαμ)2n 。

、必须增加样本含量同时降低,)3βα?因此,在检验选用显著水平时,应考虑到这两种错误推断后果的严重性大小,还应考虑到试验的难易,试验结果的重要程度。?若一个试验耗费大,可靠性要求高,不允许反复,那么α值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。?对于一些试验条件不易控制,试验误差较大的试验,可将α值放宽到0.1,甚至放宽到0.25。?在提高显著水平,即减小α值时,为了减小犯Ⅱ型错误的概率,可适当增大样本含量。增大样本含量可以同时降低犯两类错误的可能性。

两类错误的关系

Ⅱ型错误(β)

推断正确(1-β)

不成立

推断正确(1-α) Ⅰ型错误(α) 成立

接受拒绝客观实际0H 0H 0H 0

H

(1)要正确理解差异显著或极显著的统计意义。

差异显著指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。

5.显著性检验中应注意的问题

显著水平的高低只表示下结论的可靠程度的高低,即在0.01 水平下拒绝零假设的可靠程度为99%,而在0.05水平下拒绝零假设的可靠程度为95%。

“差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。下“差异不显著”的结论时,客观上存在两种可能:

?一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;

?二是可能确无本质上差异。显著性检验只是用来确定零假设能否被推翻,而不能证明零假设是正确的。

(2)结论不能绝对化。

经过显著性检验最终是否拒绝零假设则由被研究事物有无本质差异、试验误差的大小及选用显著水平的高低决定的。同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。拒绝H 0时可能犯Ⅰ型错误,接受H 0时可能犯Ⅱ型错误。尤其在P 接近α时,下结论应慎重,有时应用重复试验来证明。

二、单个样本显著性检验的程序

第一步建立假设。H 0:μ=μ0

H A :μ≠μ0或μ>μ0或μ<μ0第二步确定显著水平α。

通常α=0.05或0.01第三步确定检验方法,计算检验统计量。

?σ2 已知时用u 检验,σ2 未知时用t检验,标准差用x 2检验

第四步建立在α水平上H 0的拒绝域。第五步对推断的解释。

检验的基本程序

三、在σ已知的情况下,单个平均数的显著性验

—U 检验

1)σ已知的正态总体或近正态总体,随机抽样,样本容量为n 2)提出假设

H 0:μ=μ0; H A :μ≠μ0n

x u σ

μ0

)4?=

3)α=0.05; α=0.01

6) 推断并作出生物学的解释

5)拒绝域

①u>u α; ②uu α/2例: 某药厂长期生产八珍益母丸,规定标准为每丸重9克。现有一台新购联合制丸机,设该机生产的丸重X へN(μ,σ2),σ2(经验)=0.25。为检验该机工作是否正常,随机抽取100丸,丸重均数为9.1克,问制丸机工作正常?解:

1)XへN(μ,0.25)

2)提出假设H 0:μ=9,H A :μ≠93)α=0.05

2

100

25.091.9)4=?=

?=

n

x u σ

μ

5)建立拒绝域

查表u 0.05/2=1.96,∵│u│>u 0.05/2

∴P<0.05

6)拒绝H 0,接受H A ,即制丸机工作不正常

四、σ未知时平均数的显著性检验—t 测验

(一)建立假设H 0:μ=μ0

H A :μ≠μ0或μ>μ0或μ<μ0

其中μ为样本所在总体平均数,μ0为已知总体平均数;

(二)确定检验水平α(α=0.05或0.01 )

检验程序(三)计算检验统计量计算公式为:

x

S x t 0μ?=

1?=n df 式中,n 为样本含量,为样本标准误。

x S (四)查临界t 值,由查附表4得临界值t 0.05,t 0.01将计算所得的t 值的绝对值与其比较:或计算概率p

1?=n df -t 0.01 -t 0.05

t 0.05

t 0.01

|t |<t 0.05时,接受H 0,不显著;

当t 0.05≤|t |<t 0.01时,否定H 0,推断差异显著,记*;

|t |≥t 0.01时,否定H 0,极显著,记**。(五)推断并作出生物学解释

例: 已知健康人红血球直径服从均数为7.2μm 的正态分布。今从一患者血液中随机测得9个红血球的直径如下:7.1,7.3,7.7,7.8,8.0,8.1,8.5,9.0,7.6,问患者红血球平均直径与健康人有无显著差异?(α=0.05)

解:

1)红血球直径X へN (μ0,σ2),σ未知,μ0=7.22)提出假设H 0:μ=μ0,H A :μ≠μ03)α=0.05

5)拒绝域

t 0.05/2=2.306,df=9-1=8,∵│t│>t 0.05/2,∴P<0.05

6)拒绝H 0,接受H A ,即该患者红血球平均直径与健康人有显著差异。

9

.79

6

.73.71.7)4=+++=

K x 1

)

(

2

2

2??

=

∑n n

x x s 345

.01

99)6.73.71.7(6.73.71.72

222=?+++?

+++=

 K K 587

.0=s 58.39

587.02

.79.7≈?=?=

n s x t μ

五、变异性的显著性检验

—x 2检验

虽然在实际工作中,经常遇到的是对假设的总体平均数做检验,但是对假设的总体标准差做检验的情况也很多。对单个标准差做检验使用x 2检验,x 2检验是建立在x 2分布基础上的。

设X是服从正态分布N(μ,σ2)的随机变量,并从中获得含量为n的随机样本,计算出样本方差S 2,则服从n-l 自由

度的x 2分布。

()2

2

1σS n ?()2

22

1σS n x df

?=

X 2检验的原理与U检验基本相同,求出含量为n的样本标准差S,根据S判断抽出该样本的总体,其标准差σ是否等于某一给定值σ0。X 2检验的基本程序概述如下:(1)假定从正态总体N(μ,σ2)中随机地抽取含量为n的样本,并计算出样本方差S 2。

(2)零假设H 0:σ=σ0

备择假设可能是以下三种情况中的任一种①H A :σ>σ0,若已知σ不可能小于σ0②H A :σ<σ0,若已知σ不可能大于σ0③H A :σ≠σ0,包括σ>σ0和σ<σ0

(4)检验统计量:

df=n-1

()2

02

21σS n x df

?=

(3)显著性水平α=0.05和α=0.01(5)相应于2中各备择假设的H 0的拒绝域为

①X 2>X α2②x 2<X 1-α2

③x 2<X 1-α/22和X 2>X α/22

(6)做出结论并给予解释。

例: 某药厂生产中成药,其日产药长期以来服从方差σ2=5000(盒2)的N (μ,σ2)。近阶段抽查了26天的产量,s 2=7200(盒2)。问近阶段总体方差是否正常?(α=0.05)解:

1)XへN(μ,σ2),样本容量n=26,s 2=72002)提出假设H 0:σ2=σ20,HA:σ2≠σ203)α=0.05

4)χ2df =(n-1)s 2/σ2

=(26-1)×7200/5000=36df=n-1=26-1=255)拒绝域

df=25,χ2α/2=χ20.05/2=40.646,χ21-α/2=χ21-0.05/2=13.12

∵χ21-α/2<χ2<χ2α/2,∴P>0.05

6)接受H 0,拒绝H A ,即在显著水平0.05下,近阶段产量的总体方差与5000无显著差异。

单个样本显著性检验要点

在对做检验时,要依σ1=σ2,还是σ1≠σ2而不同。

1x 2x 一、两个方差的检验——F 检验

第二节两个样本的差异显著性检验

F检验的程序概述如下:

(1)假定从两个正态总体中,独立地抽取含量分别为n 1和n 2的两个随机样本,计算出S 12和S 22。

(2)零假设H 0:σ1 =σ2。

备择假设可能是以下三种情况中的任一种:①H A :σ1>σ2,若已知σ不可能小于σ2②H A :σ1<σ2,若已知σ不可能大于σ2③H A :σ1 ≠σ2,包括σ1>σ2和σ1<σ2(3)显著性水平α=0.05和α=0.01(4)检验统计量:

1

,1,,22112

22121?=?==

n df n df S S F df df (5)建立H 0的拒绝域,作出统计推断

①相应于H A : σ1>σ2,应做上尾检验,当F>F α时拒绝H 0。

②相应于H A :σ1<σ2,应做下尾检验,当F<F 1-α时拒绝H 0。

α

α,,112211

,,df df df df F F =

?③相应于H A :σ1≠σ2,应做双侧检验,当F >F α/2及

F<F 1-α/2时拒绝H 0。

例对两批黄连中小檗碱的含量进行比较,分别随机抽取出4个150克的样品,在同样条件下测定含量。

8.90

8.96

8.828.988.858.968.918.90第二批数据(X2克)第一批数据(X1克)试检验这两批黄连小檗碱含量的总体方差是否有显著差异?

解:

1)从两个正态总体,独立随机抽样,样本1:容量为n 1=4,方差s 12=0.0012样本2:容量为n 2=4,方差s 22=0.00182)提出假设H 0:σ1=σ2H A :σ1≠σ2

3)α=0.05

4)F df1,df2=S 12/S 22=0.0018/0.0012=1.5df 1=n 1-1=3, df 2=n 2-1=35)拒绝域F α/2,df1,df2 =15.44

F 1-α/2,df1,df2=1/F α/2,df 2,df 1=1/15.44F 1-α/2

6) 接受H 0,否定H A ,即此两批含量的总体方差无显著差异。

二、标准差(σi )已知时两样本均数间

差异显著性的检验

检验程序:

1)假定从两个正态总体或近似正态总体中,独立地抽取含量分别为n 1和n 2的随机样本。(2)零假设H 0:μ1=μ2。

备择假设可能是以下三种情况中的仟何一种:

①H A :μ1>μ2,若已知μ1不可能小于μ2;②H A :μ1<μ2,若已知μ1可能大于μ2;③H A :μ1≠μ2,包括μ1>μ2和μ1<μ2。(3)显著性水平:一般用α=0.05和α=0.01两个水平

(4)检验统计量:从两个正态总体中,独立地抽取含量分别为n 1和n 2的样本,那么样本平均数的差()的分布也是正态分布,服从21x x ???

????

+

?)(

),( 2221

2121

n n N σσμμ

所以检验统计量为

2

2

2

1

2

12121)

()x (U n n x σσμμ+

???=

2

2

21

2

12

1x

n n x σσ+

?=2

1x

2

1x x x ??=

σ平均数差数的标准误差

:2

1x

x ?σ(5)建立H 0的拒绝域,作出统计推断

①相应于H A :u 1>u 2,应做上尾检验,查u α当u>u α时拒绝H 0。

②相应于H A :u 1<u 2,应做下尾单侧检验,查-u α,当u<-u α时拒绝H 0。

③相应于H A :u 1≠u 2,应做双侧检验,查u α/2当|u|>u α/2或表示为|u|>u α( 两侧)时拒绝H 0。6)推断并作出生物学的解释

例据已往资料,已知某区域每平方米昆虫数σ2=0.4 (头2),今在该区域用A 、B 两法取样,A 法取12个样点,得平均数为1.2;B 法取8个样点,得平均数为1.4,试比较两法每平方米昆虫数是否有显著差异?解:

X 1へN (μ1,σ2),样本容量为n 1=12X 2へN (μ2,σ2),样本容量为n 2=8独立随机抽样2)提出假设

H 0:μ1=μ2; H A :μ1≠μ2

3)α=0.054)统计检验量

5)拒绝域

│u│α

6) 接受H 0,否定H A ,即A、B两取样方法所得每平方米昆虫数无显著差异。

2

22

1

21

2121)

(n n x x u σσμμ+

???=

8

4.012

4.04.12.122+?=

69

.02887

.02

.0?=?=

?

在实际工作中还经常会遇到推断两个样本均数差异是否显著的问题,从而了解两样本所属总体的均数是否相同。?

对于两样本均数的显著性检验,因条件或试验设计不同,一般可分为两种情况:一是非配对设计或成组设计两样本平均数的比较;二是配对设计两样本平均数的比较。

三、标准差(σi )未知,但相等时,两样本均数间差异显著性的检验—成组数据t 检验

成组设计或非配对设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。

在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。非配对设计资料的一般形式见下表。

μ2

n 2

x 21,x 22,x 23,…x 2j

2

μ1n 1x 11,x 12,x 13…x 1j 1总体平均数

平均数样本含量

观测值处理1

11/n x x j

∑=

∑=2

22

/n x

x j

成组设计两样本平均数差异显著性检验的基本步骤如下:

(一)提出假设

零假设H 0:μ1=μ2。

备择假设可能是以下三种情况中的任何一种:①H A :μ1>μ2,若已知μ1不可能小于μ2;②H A :μ1<μ2,若已知μ1可能大于μ2;③HA:μ1≠μ2,包括μ1>μ2和μ1<μ2。

应用条件:两个样本所在总体都服从正态分布,并且

2

2221σσσ==(二)计算t 值

计算公式为:

2

121x x S x x t ??=

)

1()1(21?+?=n n df

其中:

)11

()

1()1()()(2

21121222211n n n n x x x x S x x +×?+??+?=

∑∑?()()????????+×?+???

???????+?????????=∑∑∑∑21

2122

2221212111)1()1(n n n n n x x n x x )

1

1()1()1()1()1(2

1212

22211n n n n S n S n +×?+??+?=

当时

n n n ==21)

1()()(2

22

2

11

21??+?=

∑∑?n n x x

x x S x x n

S n

S 2

22

1

+

=

为均数差的标准误差,、,

、,、分别为两样本含量、平均数、方差。

21x x S ?1n 2n 1x 2x 2

1S 2

2S (三)根据df=(n 1-1)+(n 2-1),查临界值:t 0.05、t 0.01,将

计算所得t 值的绝对值与其比较,作出统计推断

【例】分别测定两个品种的家兔停食18小时后正常血糖

值,测定结果如下表所示。设两品种家兔正常血糖值服从正态分布,且方差相等,问该两个品种家兔的正常血糖值有无差异?

两个不同品种家兔的正常血糖值

31

96

82

57

32

39

50

82

36

89

10

青紫蓝

118

6853731041171191371011205711大耳白血糖值(mg/100ml 血)n 品种经计算得

2110:;:2μμμμ≠=A H H 此例,

,111=n 102=n 2.847,

0.972

11==S x 3

.650,4.592

22==S x 1.建立假设2.计算t 值

于是

)

11()1()1()1()1(2

1212

222112

1n n n n s n s n S x x +?+??+?=?0

.12)10

1

111()111()110(3.65092.84710=+?+?×+×=

=?=

?2

121x x s x x t **133.30

.124

.590.97=?3.查临界t值,作出推断

查t值表,由df=11+10-2=19得t 0.01=2.681,|t|>2.681,P<0.01,表明两品种家兔正常血糖值差异极显著,这里表现为大耳白品种家兔的正常血糖值极显著高于青紫兰品种家兔的正常血糖值。

注意:当比较两个样本标准差未知时首先进行方差齐性检验,方差相等或齐性是在进行上述平均数差异检验。

四、标准差(σi )未知且可能不等时,两样本均数间差异显著性的检验

Aspin -Welch 检验,该检验的临界值仍由t 表查出,但最后自由度却由df 1和df 2和。n S n S 共同确定和2

2

2121()2

2

1211df k df k df ?+=

2

2

212

11

21n S n S n S k +=

2

2

212

12

1n S n S x x t +?=

2222

11x

x x

S S S k +=

或检验统计量

t df 分布自由度的近似服从具有例测定两个细胞系A 和B 的蛋白质含量:A :10次,均值1=14.3(%),s 12=1.621B :5次,均值2=11.7(%),s 22=0.135

试测验两细胞系蛋白质含量的差异显著性

解:

第I步方差齐性检验

1)从两个正态总体,独立随机抽样,样本1:容量为n 1=10,方差s 21=1.621样本2:容量为n 2=5,方差s 22=0.1352)提出假设H 0:σ1=σ2H A :σ1≠σ2

3)α=0.05

4)F df1,df2=s 21/s 22=1.621/0.135=12.01df 1=n 1-1=9, df 2=n 2-1=45)拒绝域F α/2,9,4=8.905

F 1-α/2,9,4=1/F α/2, 4,9=1/4.718=0.212F>F α/2 P<0.05

6) 接受H A ,否定H 0,即两总体方差有显著差异。

第II步两平均数间差异显著性检验1)正态总体

X 1へN(μ1,σ21),样本容量为n 1,s 21X 2へN(μ2,σ22),样本容量为n 2,s 22

独立随机抽样,σ2i 未知但不等(上述F检验)2)提出假设H 0:μ1=μ2H A :μ1≠μ23)α=0.05

4)检验统计量

2

2

2

1212121)

(n s n s x x t df +???=

μμ435

.06.25

135

.010621.17.113.14=

+?=

2

2212

11

2

1222

2

11n s n s n s s s s k x x x +=+=

0270

.01621.01621

.0+=

5135.010621.110621.1+=98

.5=86

.0=

5)拒绝域

t α/2,11=2.201, │t│>t α/2, P<α

6) 接受H A ,否定H 0,即此两细胞系的蛋白质含量有显著差异。

1

)1(11

)1(122

122

2

12??+

?=

?+=

n k n k df k df k df 1

5)

86.01(11086.01

2

2

??+?=

11

48.11≈=五、配对数据的显著性检验—t检验

非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。

为了消除试验单位初使条件不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与与精确性,可以利用局部控制的原则,采用配对设计。

(一)配对设计的概念和分类

配对设计是指试验单位先根据配对的要求两两配对,然后将配成对子的两个试验单位随机地分配到两个处理中。

配对的要求是,配成对子的两个试验单位(对子内)的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异。每一个对子就是试验处理的一个重复。

配对的方式有两种:

1.自身配对

指同一试验单位

n 在二个不同时间上分别接受前后两次处理,用其前后两次的观察值进行自身对照比较;o 或在空间上用其不同部位的观察值;p 不同方法的观察值进行自身对照比较。

?如观察某种病畜治疗前后临床检查结果的变化;观察用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。

2.同源配对指将来源相同、性质相同的两个个体配成一对(如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对),然后对配对的两个个体随机地实施不同处理。

样本1 样本2

对 A 处理 B 处理 差异 对1 a 1 b 1 d 1 对2 a 2 b 2 d 2 ┆ ┆ ┆ ┆ 对n

a n

b n d n

21

1

1s

x μ↓

22

22s

x μ↓

2d

d

s d μ↓

在配对设计中,由于各对试验单位间存在系统

误差,对内两个试验单位存在相似性,所以其资料的显著性检验不同于非配对设计。

(二)配对设计显著性检验的步骤

检验的步骤是:1.建立假设

00:;0:0<>≠=d

d

d

A d H H μμμμ或或其中为两样本配对数据差值d 总体均数。

d μ2、计算差数标准误、t值和自由度

d为两个样本各对数据之差: ,(i=1,

2,…,n);为d的标准差;n为配对的对子数,即

试验的重复数。

1,?==

n df s d

t d

其中:为差数标准误,计算公式为:

d s )

1()

(2

??=

=

∑n n d d n

s s d d i i i x x d 21?=d s 3.根据自由度df=n-1查t值表,得临界t值

,然后将计算所得t 值的绝对值与其比较,作出推断。

)1(01.0)1(05.0,??n n t t 表 A、B两法处理的病毒在番茄上产生的病痕数组别A法B法d 11025-152131213814-64315-125512-762027-77618-12

例选生长期、发育进度、植株大小和其它方面皆一致的两株番茄构成一组,共得7株,每组中一株接种A 处理病毒,另一株接种B 处理病毒,以研究不同处理病毒方法对纯化的效果,得结果为病毒在番茄上产生的病痕数目(如表),试测验两种处理方法的差异显著性(α=0.01)

解:这是配对设计,因A 、B 两法纯化病毒的效应并未明确,故用两尾测验。

1)X1和X2来自同一总体且配对2)提出假设

0:,0:0≠=d A d H H μμ 3)α=0.01

3

.8758)]12(1)15[(7

1

?=?=?+++?=

L d 43.1677

)58()12(1)15(2

22=??

?+++?=L d SS )

1(?==?=

?=

n n SS d n

s d

n

s d s d t d

d

d d d

d μμ6

171=?=?=n df 4) 计算统计检验量

16

.4)

17(743.1673.8?=??=

5) 拒绝域

tα/2,6=3.707, │t│>tα/2, 6

P<0.01

6)推断: 否定H0,接受H A。即A、B两法对纯化病毒的效应有极显著的差异。

六、配对法与成组法检验的比较

?一般来说,配对法比成组法更容易检出两组数据平均数间的差异。因为在进行t检验时,统计量t值越大,拒绝H

的可能性越大。

?在条件许可情况下,尽可能把实验设计成配对法做比较。这是因为配对数据的方差更小,从而t值更大。

复习思考题和作业

P82习题5.2, 5.4, 5.7, 5.9

The end

SPSS统计软件使用指导(免费下载)

SPSS统计软件使用指导 管理统计学课程设计是在学习了《管理统计学》课程之后,进行此课程设计,是对这门课程的全面复习。是整个教学工作的重要环节。 一、目的和任务 通过管理统计学课程设计教学所要达到的目的是:以管理统计学课程和理论知识为基础,通过课程设计的实践,培养学生理论联系实际的思想,加强学生对所修相关课程的理解、掌握,训练并提高其在SPSS软件的使用、统计分析的方法、独立解决问题的思路和计算机应用等方面的能力。 管理统计学课程设计的任务是:依据所提供的SPSS软件功能及相关资料,完成SPSS实现操作并选择有现实意义的课题进行计算与分析,递交统计分析报告。 二、设计要求 1.时间要求:本课程设计安排在《管理统计学》课程教学之后进行,设计时间为(30学时)。其中: 2学时:对所研究的问题进行课堂分析。 2学时:熟悉SPSS界面:①SPSS的启动,②SPSS的主窗口,③SPSS的菜单,④SPSS录入数据,⑤SPSS的退出,⑥SPSS的求助系统。 10学时:根据《管理统计学》课程设计指导书实地操作SPSS软件的主要功能:①SPSS的数据管理功能,②SPSS文本文件的编辑,③摘要性分析,即对原始数据进行描述性分析。④平均水平的比较:Means(平均数)过程、Indendent-Samples T Test(两组资料样本T检验)过程、Paired-Samples T Test (配对样本T检验)过程、One-Way-ANOV A(单因素方差分析)过程。⑤方差分析。⑥相关分析。⑦回归分析。 2学时:SPSS制图功能:主要练习SPSS中条形图、线图、控制图、散点图和直方图的绘制。 12学时:根据案例提供的样本数据,登陆国家统计局网站:https://www.wendangku.net/doc/ec1368433.html,/(或其他网站)选择有意义课题,选取4个自变量,即T、Y、X1、X2、X3、X4,进行多元线性回归分析。 2学时:总结设计过程,整理课程设计的书面材料,撰写并提交一份统计分析报告。 2.设计资料要求:尽可能选用具有说服力的,反映社会经济现象发展趋势的数据作为该课程设计的基础内容。 3.工作量要求:学生3-5人分为一组,以小组为单位共同完成本课程设计。小组成员明确独立完成的工作量,使每名学生工作量均饱满。 4.成果要求:学生以小组为单位完成课程设计的全部任务,撰写课程设计说明书,累计字数不少于8000字。并按时、按质、按量提交规范格式的设计成果。交计算机打印稿及电子版。 5.设计步骤:首先运用SPSS软件,按着指导书的内容将SPSS的基本功能逐个练习掌握。其次登陆《国家统计局网站:https://www.wendangku.net/doc/ec1368433.html,/》或其他网站,选择有意义课题,选取不少于4个自变量,即T、Y、X1、X2、X3、X4,进行多元线性回归分析,并提交一份统计分析报告。提交设计成果及装订顺序如下: (1)封面 使用统一封面,具体格式按给定的模版,不允许修改。 注意①“指导教师”一项为空;②“班级”一项统一规范,尤其是专业名称,如:05工商管理1班、05信息管理2班、05电子商务1班、05市场营销2班;③“日期”一项统一规范,统一为2007年6月10日。

第六章 从本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数 (μ,2 σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个体(即N n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

数理统计方法与工具--质量管理QC新、老七种工具应用

数理统计方法与工具--质量管理QC 新、老七种工具应用 在质量管理活动中经常提到“方法应用”和“工具应用”二种说法,从本质上说二者没有原则的区别。 数理统计方法属于应用数学的范畴,是实践的科学,没有实际应用就失去了存在的意义。但是,数理统计方 法的理论基础是“概率论”,从这一点看又要求应用者有较高的素质。日本在推行全面质量管理过程中特别注 意到数理统计方法的应用,许多专家致力于对数理统计方法进行简化的研究,先后提出了“质量管理七种工 具”和“质量管理新七种工具”。此时,应用者只要根据规定的要求去应用,就会收到好的效果,这就好比工 人的操作中使用扳手、郎头等工具一样方便。因此称为数理统计工具。 1.新、老七种工具的主要区别 1)老七种工具;包括排列图、因果图、调查表、分层法、直方图、散布图、控制图。 在老七种工具中,除因果图以外,都属于统计型方法。其主要特点为: 1/ 适用于现场质量管理活动中应用; 2/ 研究对象大都是可定量化表达的; 3./ 收集分析数据和进行统计计算的方法取得分析结果。 2) 新七种工具:包括系统图等七种 在新七种工具中除矩阵数据解析法外,都属于情理型方法,其主要特点是 1/适用于管理层次的应用 2/研究对象大都是定性的 3/很少进行计算,主要以收集语言资料和用图表 4/新七种工具是能提供思考方法,提供一系列科学思维方法的工具。 2.、排列图的应用 2.1 定义:排列图是为寻找主要问题或影响质量的主要因素所使用的图。排列图是由两个纵坐标(左边 的纵坐标为项目发生的频数,右边的纵坐标为累积百分数),一个横坐标(按列的项目数均等分), 几个按高低顺序依次排列的直方柱(“其他”一项除外。无论频数多大,“其它”这一项均应放在最 后位置)和一条累积百分比折线 甲 已 丙 丁 其他 即帕累托折线)所组成的图 2.2 排列图分析的程序频 数 累计%

第六章统计推断

第六章 统计推断 6.1 什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是哪一种?为什么? 6.2 什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系? 6.3 什么叫统计推断?它包括哪些内容?为什么统计推断的结论有可能发生错误?有哪两类错误?如何克服? 6.4 若n =16,=σ15,要在=α0.01水平上测验H 0:=μ140,问y 要多大?若n =100,=σ15,要在=α0.05水平上测验H 0:=μ100,试求其否定区域? [答案:(1)y <132.65或>147.35;(2)y <96.13或>103.87] 6.5 对桃树的含氮量测定10次,得结果(%)为:2.38,2.38,2.41,2.50,2.47,2.41, 2.38,2.26,2.32,2.41,试测验H 0:=μ 2.50(提示:将各观察值减去2.40,可简化计算)。 [答案:y =2.39%,=y s 0.02%,t =5.5] 6.6 从前作喷洒过有机砷杀雄剂的麦田中随机取4株各测定砷的残留量得 7.5,9.7,6.8,和6.4mg ,又测定对照田的3株样本,得砷含量为4.2,7.0及4.6mg 。(1)已知喷有机砷只能使株体的砷含量增高,决不会降低,试测验其显著性;(2)用两尾测验。将测验结果和 (1)相比较,并加解释。 [答案:=2e s 2.218,=-21y y s 1.14] 6.7 从一个方差为24的正态总体中抽取一个容量为6的样本,求得其平均数=1y 15,又从一个方差为80的正态总体中抽取一个容量为8的样本,并知=2y 13,试取=α0.05测验210μμ=:H 和相对应的21μμ≠:A H 。 [答案:u =0.534,接受H 0] 6.8 一个容量为6的样本来自一个正态总体,知其平均数=1y 30和均方=21s 40,一个容量 为11的样本来自一个正态总体,得平均数=2y 22,均方=22s 45,测验=-210μμ:H 4和 相对的21μμ-:A H >4,取0.05的显著水平。 [答案:=2e s 50,t =1.2,接受H 0] 6.9 历史资料得岱字棉15的纤维长度(mm )为N (29.8,2.25)的总体。试求:(1)若n =10,用=α0.05否定m m 029.8:=μH 和μ:0H ≤mm 29.8,其否定区间为何?(2)若n =100

教育事业统计软件简明使用教程

教育统计软件安装与操作 一、安装:教育统计软件运行环境操作系统补丁 1、确认电脑系统是windows xp3或其后面的,若不是,最好重装系统或换台电脑。xp系统直接运行“教育统计软件运行环境操作系统补丁”内的,Windows Vista , Win 7 用户安装注意需要在文件一鼠标右击,选【以管理员身份运行】。 2、安装过程中依据您的系统不同可能会出现[重新启动]的提示,依照提示[重新启动]启动后,安装将自动继续,注意:如果系统重新启动后安装没有继续,再运行文件,直到显示setupruntime安装结束才可! 二:统计软件安装(安装正式版软件之前请先使用安装包中“数据库版本兼容工具”检测,如有冲突,进行修复) 执行教育统计系统安装包.exe后,会出现如下界面,建议不要更改目标文件夹,保持为“D:\EDUDB” 三、软件操作 1、首次使用→系统管理 点击齿轮按钮进入系统管理 点击齿轮按钮进入系统管理先点:初始 化数据库 再点:导入 编码

2、创建学校账号:

3、录入数据及审核:录入数字、英文字符等信息都要用半角录入,注意不要使用全角。 4、上报数据 找到学校后,点添加学校用户 点宁德市、蕉城区,在右侧出现学校 点上面自己的学校,再点右下角的绿色箭头

上报时,系统形成一个文件夹存放上报文件,文件夹名形如【51_宁德市蕉城区实验幼儿园_基础教育_上报】,51是学校的标识码,要将整个文件夹的内容或压缩后上交。 四、相关问题: 1、填表无法保存: 方法1、

方法2、开始—控制面版—性能和维护(有的电脑可能没有,就直接找:管理工具)—管理工具---服务---找到Distributed Transaction Coordinator服务—点右键再点启动.启动类型若为“手动”的,再从右键中“属性”进入更改为“自动” 2、中职311表操作: 1、在各个学生分类状态时只能添加该分类的专业行,在“全部”状态时才能保存。 2、不要漏填“其中:女”的数据行。 3、如果年制不填会报错,所以添加专业时先把年制写上。 4、浮动行表不同于固定行表,目前只能导出Excel文件,但不支持导入,也不支持基表过录。 5、对于一年级未分专业的学生,录入在xxxx97代码中(该代码不能录入二年级及以上学生)。 6、录入前,先去掉右下角中的“只读”选项的勾。 7、中职学校不要漏填基111表的“历史沿革”相关信息

统计学教案(第6章抽样推断)

统计学 授课题目第6章抽样推断课次第8-9次 授课方式讲授课时安排第8教学周-第9教学周,共4课时教学目的: 通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本单位数的确定方法。 教学重点及难点提示: 重点:区间估计 难点:抽样平均误差的计算 案例导入:大学生消费调查:一个月你花多少? 第一节抽样推断概述 一、抽样推断的概念及特点 (一)概念 按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进行科学估计和推断的方法。 包括抽样调查和统计推断 抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相 关资料,以推断总体 统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估 计和推断。 (二)特点 1.按随机原则(等可能性原则)抽取调查单位.随机抽样的目的是为了排除人的主观教法提示:多媒体教学案例教学列举法

影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。 2.根据部分推断总体的数量特征 3.抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制 其他特点有经济性、时效性、准确性、灵活性等 (三)抽样推断的使用 1.不可能进行全面调查时 2.不必要进行全面调查时 3.检查生产过程正常和否 4.对全面调查资料进行补充修正时 二、抽样的几个基本概念 1.样本容量和样本个数 (1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n 表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。 (2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少和抽样方法有关。 2.总体参数和样本统计量 (1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总 体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。 (2)样本统计量:和总体参数对应的是样本统计量。 设(12 ,,n X X X )是总体X 容量为n 的样本,若样本函数 T T (12 ,,n X X X ) 中不含任何未知参数,则称T 为一个统计量。 例如

第五章统计推断

第五章统计推断 ?总体与样本之间的关系 -从总体到样本的研究。 -由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。?对总体做统计推断的两种途径 –先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis) –通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter) ?本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。 一、假设检验 假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。 小概率原理 在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。 在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α” 例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法? 小概率原理用于显著性检验 例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中? 解:1 样本平均数满足何种分布?

Excel_在描述统计中的应用

第三节Excel在描述统计中的应用 在使用Excel进行数据分析时,要经常使用到Excel中一 些函数和数据分析工具。其中,函数是Excel预定义的置公 式。它可以接受被称为参数的特定数值,按函数的置语法结构进行特定计算,最后返回一定的函数运算结果。例如,SU M函数对单元格或单元格区域执行相加运算,PMT函数在给 定的利率、贷款期限和本金数额基础上计算偿还额。函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号。参数可以是数字、文本、形如TRUE或FALSE 的逻辑值、数组、形如#N/A的错误值,或单元格引用。给定的参数必须能产生有效的值。参数也可以是常量、公式或其它函数。 Excel还提供了一组数据分析工具,称为“分析工具库” ,在建立复杂的统计分析时,使用现成的数据分析工具,可以节省很多时间。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或数学函数,在输出表格中显示相应的结果。其中的一些工具在生成输出表格时还能同时产生图表。如果要浏览已有的分析工具,可以单击“工具” 菜单中的“数据分析”命令。如果“数据分析”命令没有出现在“工具”菜单上,则必须运行“安装”程序来加载“分析工具库”。安装完毕之后,必须通过“工具”菜单中的“加载宏”命令,在“加载宏”对话框中选择并启动它。 一、描述统计工具 (一)简介:此分析工具用于生成对输入区域中数据的单变量分析,

提供数据趋中性和易变性等有关信息。 (二)操作步骤: 1.用鼠标点击工作表中待分析数据的任一单元格。 2.选择“工具”菜单的“数据分析”子菜单。 3.用鼠标双击数据分析工具中的“描述统计”选项。 4.出现“描述统计”对话框,对话框各选项的含义如下:输入区域:在此输入待分析数据区域的单元格围。一般情况下Excel会自动根据当前单元格确定待分析数据区域。分组方式:如果需要指出输入区域中的数据是按行还是按列排列,贝U单击“行”或“列”。 标志位于第一行/列:如果输入区域的第一行中包含标志项 (变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”复选框;如果输入区域没有标志项,则不选任何复选框,Excel 将在输出表中生成适宜的数据标志。 均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,置信度95%可计算出的总体样 本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为(X -10, X +10 )。 第K个最大/小值:如果需要在输出表的某一行中包含每个 区域的数据的第k个最大/小值,贝y选中此复选框。然后 在右侧的编辑框中,输入k的数值。

第五章统计学教案(假设检验)

第五章假设检验 参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证,从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 本章的目的与要求 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数的检验方法,主要是Z 检验和t检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 本章主要内容(计划学时2 ) 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验 3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 学习重点 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 学习难点 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 第一节统计检验的基本概念 一、假设检验概述

基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其为“实际不可能事件”。 二、假设检验的基本概念 (一)原假设与对立假设 1、原假设:用“H0:”表示(也称“零假设”、“虚无假设”) 这是研究者对总体参数事先提出的假设。通常以总体没有发生显著变化为原假设。 2、对立假设:用“H1:”表示 对立假设也称“备择假设” 这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。 (二)显著性水平与显著性差异 1、显著性水平: 在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用α表示.这个α就是显著性水平。 常用的α有0.1、0.05或0.01等 2、显著性差异: 如果统计量和假设的参数值存在差距,有两种可能: (1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。可接受原假设。 (2)差距很大(即出现在小概率范围内),即可认为总体发生了显著变化。说明存在着显著性差异,故拒绝原假设。 (三)双侧检验与单侧检验 1、双侧检验(双尾检验): 双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负, 给出的显著水平α 2、单侧检验(单尾检验):(有左单侧和右单侧两种) 单侧检验只注意估计值是否偏高(或偏低),它是单方向的,给出的显著性水平α集中在同一侧。偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。 (四)两种类型的错误 1、第一类错误——以真为假

智慧树知到《SPSS统计工具应用》2020年度章节检验答案解析

智慧树知到《SPSS统计工具应用》2020章节测试答案第一章单元测试 1、问题:结果输出窗口保存的文件以什么为后缀() 选项: A:sav ●B:spo C:sps D:rtf 答案: 【spo】 2、问题:下面不属于SPSS的缺点是() 选项: ●A:与OFFICE等办公软件兼容性差 B:非专业统计软件 C:数据收集和数据清洗功能弱 D:处理数据量级较低 答案: 【与OFFICE等办公软件兼容性差】 3、问题:下面不属于SPSS的优点是() 选项: A:基本统计方法较全面

B:易用性强 ●C:编程能力强 D:帮助功能强大 答案: 【编程能力强】 4、问题:IBM SPSS品牌中的计数功能产品是() 选项: A:SPSS Modeler ●B:SPSS Statistic C:SPSS Amos D:PASW 答案: 【SPSS Statistic】 5、问题:SPSS中的“统计辅导”帮助功能以个案的形式讲解各模块的主要分析方法的基本操作和结果解释。 选项: A:对 ●B:错 答案: 【错】 6、问题:SPSS可以同时打开多个结果输出窗口,并将输出结果同时输出在所有输出窗口中。

A:对 ●B:错 答案: 【错】 7、问题:SPSS的结果输出窗口中也有分析菜单,所以统计分析操作可以在输出窗口执行。 选项: ●A:对 B:错 答案: 【对】 8、问题:社会经济问题研究中常用采用的统计数据分析方法是严格设计支持下的统计方法。 选项: A:对 ●B:错 答案: 【错】 第二章单元测试 1、问题:SPSS数据变量类型不包括() 选项: A:数值型

C:日期型 ●D:逻辑型 答案: 【逻辑型】 2、问题:同学们的考核等级变量属于什么计量尺度()选项: A:定类尺度 B:定距尺度 ●C:定序尺度 D:定比尺度 答案: 【定序尺度】 3、问题:SPSS中定义变量尺度属性称为() 选项: A:变量值标签 ●B:度量标准 C:变量类型 D:变量角色 答案: 【度量标准】

统计工具、方法与应用

统计工具、方法与应用 本章介绍了统计基本知识、处理数据的常用工具(Browser、SQL-PLUS)、主要统计业务。通过掌握这些内容,读者就具备了统计分析的基本技能、问题分析能力、决策的支持能力。 第一节常用统计工具与方法介绍 本节介绍统计基本知识、华为公司统计人员在数据提取与处理方面的常用工具:Query Builder(BROWSER) 和SQL-PLUS。 一、统计基本知识 1、统计基本概念 统计学作为应用科学,广泛应用于国民经济的各个领域,已经自成一个学科体系。由于统计学的提出与发展历史同数学密不可分,同时要学好统计必须要有扎实的数学基础,国内学术界仍把统计学作为数学的一个分支。根据学科的研究对象,又将统计学分为数理统计、经济统计等分支。 统计学用统计模型、统计量来描述研究的对象,常用正态分布来进行探索研究,然后将结论推广到其他分布(如泊洼松分布、t-分布、F-分布等)。视分析研究的对象不同,确定不同的收集数据方式:试验设计、抽样调查等,进行探索性分析/描述性分析、方差分析、显著性检验,验证统计模型的正确性。 在实际工作中,也常使用业务数据,运用统计的基本方法来进行分析,将计算结果与目标/经验数据进行对比,发现业务中存在的问题,为决策与工作改进提供参考。 2、应用简介 这里是华为公司计调业务方面的统计简介。 ?指标体系:分析供应链中各业务流程,建立监控点,通过定期统计KPI、WCM完成情况,反映公司的经营情况。 ?统计分析:随着公司运作日益规范化、IT化,业务的运作将产生大家的信息,通过对这些信息的分析,有助我们做正确的判断、做正确的事,提高工作效率。 ?SPC:统计的质量观。将生产数据通过控制图监控设备、产品质量是否正常,有没有异常的趋势,确保生产处于受控状态。 3、常用的专业统计工具 ?描述性统计 ?抽样调查 ?分布检验 ?方差分析

第六章分类资料的统计推断

1不满足正态近似条件,所以采用直接计算概率法。 H0:加维生素C的治愈率与不加相同,即π=π0=0.6 H1:加维生素C的治愈率高于不加维生素C,即π>π0 α=0.05 P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C109*0.69*0.41-C1010*0.610*0.40= 0.9536>0.05 不拒绝H0,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。 2满足正态近似条件,采用正态近似法。 H0:经健康教育后的高血压患病率与以前相同,即π=π0=0.6 H1:经健康教育后的高血压患病率比以前降低,即π<π0 单侧α=0.05 u==4.9453536 u>u0.05,单侧=1.64 p<0.05,拒绝H0,接受H1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。 3①建立检验假设和确定检验水准 H0:男女大学生HBV感染对其心理影响相同,即π1 =π2 H1:男女大学生HBV感染对其心理影响不同,即π1≠π2 检验水准α=0.05 ②计算检验统计量 χ2=(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d) =(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651 ν=1 ③确定p值 查χ2届值表,得p<0.05 ④统计推断 按α=0.05水准,拒绝H O,接受H1,差别有统计学意义,可以认为HBV感染对不同性别的大学生在心理行为方面的影响不同。 4①建立检验假设和确定检验水准 H0:两组的治愈率相等,即π1 =π2 H1:两组的治愈率不等,即π1≠π2 检验水准α=0.05

第六章分类资料的统计推断(pdf 6)

第六章 分类资料的统计推断 分类资料中最常用的统计方法是2χ检验,确切概率法,另外还有秩和检验。秩和检验在后一章介绍,本章重点介绍2χ检验,其它方法简略讲述。 6.1 四格表资料2χ检验 例 6.1 某医院治疗慢性肾炎病人,其中用西药治疗79例,有效者63人,有效率79.75%,用中药治疗54例,有效者47人,有效率87.04%,问两种药物治疗慢性肾炎有效率是否相同? 处理 有效 无效 西药组 63 16 中药组 47 7 具体步骤: 1. 数据录入 设变量group 代表处理组(西药组为1,中药组为2),变量effect 代表是否有效(有效为1,无效为0),变量f 代表频数,即例数。如西药组有效例数为63,则group 为1,effect 为1,freq 为63。数据格式如图6.1。 2.统计分析 首先依次选取Data -weight Cases ,展开对话框如图6.2,选择Weight cases by ,将freq 选入Frequency Variable :框,即赋予权重;然后依次选取Analyze -Descriptive Statistics -Crosstabs ,展开对话框如图6.3,将group 选入Rows 框,effect 选入Columns 框,或相反; 该对话框下方有三个按钮:Statistics 、Cells 和Format ,现将其子对话框选项介绍如下: Statistics 选择要输出的统计量,常用的有2χ(Chi -square )、Pearson 相关系数

χ(McNemar)(Correlations)、Kappa系数(Kappa)、相对危险度(Risk)、配对2 等。 Cells指定多维分布表中显示实际频数、理论频数、行列及全部百分比和残差等。 Format指定行顺序(升序或降序)。 在对话框下方还有两个选项:Display Clustered Bar Charts(输出直方图)和Suppress Tables(不输出多维分布表)。 本例仅计算2 χ,单击Statistics,弹出对话框如图6.4,选取Chi-square。返回主对话框,单击OK提交执行。 χ检验数据格式 图6.1 2

统计软件应用实训

统计软件应用实训 Document number:PBGCG-0857-BTDO-0089-PTT1998

工程技术学院 《统计软件应用实训》报告 2014-2015第1学期 选题:战略绩效控制指标重要度的分析研究 姓名:刘仁泽 班级序号: 17 专业班级:市场营销61301 指导教师:黄明婷老师杨青老 师 时间:~

战略绩效控制指标重要度的分析研究 案例背景 XATC是中国电信集团陕西电信公司的分公司,属于国有独资公司。XATC作为民族资产和国有企业,必须面对现实,改革创新,为客户提供高质量、低成本的产品和服务,提高竞争力。所有的这些,关键是从公司的管理工作做起,特别是关键的计划和控制工作。而XATC现在还是以传统的财务控制和绩效考核为主,且绩效考核常常没有落实,只是流于形式,急需要设计一套完整实用财务绩效考核体系;另外,那些被忽视的非财务绩效也是战略绩效中不可缺少的一部分,应该加以考虑。所以,对XATC现有的计划和控制系统进行改进,并建立新的以计划—预算—控制为一体的战略绩效控制与绩效测评指标,并找出其相对重要度,予以分别对待,显得尤为重要。 数据来源及说明 发出调查问卷总共为30份,收回30份。

分析要求 1、对var01~ var04进行统计量分析。 2、在不降维的前提下,分析影响var01~ var04的因素及主要 因素;并建立与其对应的回归模型(4个综合变量,如 “var01”,4选2进行分析)。 3、对除var01~ var04以外的16个分变量进行降维,并分析其 结果。 战略绩效控制指标重要度的分析研究分析 一、数据描述 (一)频数分析 二、影响因素分析与线性回归分析 (1)影响因素分析 影响财务指标的因素有资产负债率、收支差额、总资产报酬率、业务收入。 影响外部指标的因素有与客户沟通次数、普通用户满意率、投标成功率。 影响创新与学习的因素有业务增长率、员工态度调查、新产品(新用户)收入比例、员工合理化建议数、员工培训、机关管理水平、大用户满意率。 影响内部经营管理状况的因素有安全事件指数、市场占有率。(2)线性回归分析 三、因子分析降维 第四个点为拐点 因子1:业务增长率、员工态度调查、新产品(新用户)收入比例都会对提高业务有帮助。 因子2:资产负债率、收支差额、总资产报酬率主要影响公司的财务。 因子3:与客户沟通次数、普通用户满意率、投标成功率主要对与客户间的交易是否成功、与其他公司的合作产生影响。 因子4:安全事件指数、市场占有率会对公司在某一地区的市场份额产生影响。 四.结论及建议 (1)结论 (一)资产负债率、收支差额、总资产报酬率、业务收入影响财务指标

第五章统计估计和假设检验

第五章统计估计和假设检验 第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。 统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。 假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验; 另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。 第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。 极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。 例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:

相关文档 最新文档