文档库 最新最全的文档下载
当前位置:文档库 › 统计学:纯公式版

统计学:纯公式版

统计学:纯公式版
统计学:纯公式版

1.计量资料的统计描述

均数(了解即可,加权的算法应该不看了)

①算数均数:直接法

n X

n Xn X X X ∑=

+++=

(21)

加权法

n fX

f fX f f f X f X f X f X k k k ∑=

∑∑=++++++=

(212211)

②几何均数(G ) 直接:?

??

??∑=-n X

G lg lg 1 加权:

???

??∑=-n X f G lg lg 1

③中位数:直接:奇数时()2

/

1+=n X M 偶数时()2/12/2/++=n n X X M

加权略 离散趋势

①极差(全距)(R )= 最大值-最小值 ②四分位数间距(Q ):P 75 (上四分位数)- P 25(下四分位数) ③方差(S 2

):(离均差(-

-X X )平分和的总和÷N (或N-1))

总体方差:()N X 2

2μσ-∑= 样本方差:()

()1

1

2

2

2

2-∑-

∑=

--∑=

n n

X X n X X S

标准差(S ,SD ):

总体:()N

X 2

μσ-∑= 样本:()

()1

1

2

2

2

-∑-

∑=

--∑=

n n

X X n X X S

④变异系数(CV ):%100?=

X

S

CV 用于:a. 比较计量单位不同的几组资料的离散程度 b. 比较均数相差悬殊的几组资料的离散程度 2.计量资料统计推断 均数抽样误差与标准误 标准误:n

S n X ==

X S σσ σ为总体,S 为抽样

总体均数的估计

均数的双侧可信区间为:

①大样本或总样本已知(且为正态分布)时,按正态分布原理

()

X X X u X u X u

X σσσααα2/2/2

/ ,±=+-

= ,=

②小样本或总样本未知时,按t 分布原理:

()

X

X X S t X S t X S t

X ναναν

α,2/,2/,2/ ,±=+-

附:参考值范围计算公式(注意区分):(参考值用标准差,可信区间用标准误)

X

-100X 2/P ~ P X 偏态分布正态分布S u α± ,α=1-范围(如95%等)

t 检验

①单样本t 检验(已有一个大样本均数(视为总体均数0μ),本次样本的均数比较与0μX ) 1-n 0

0=-=-=

νμμn

S X S X t X (后面变式可以不用记,即标准误的算法变化)

一般假设:H0:μd= 0, H1:μd ≠ 0,α=

②配对t 检验(一般为对照配比的实验,计算差值, 比较与0d )

n

S d t d

0-=

一般假设:H 0:μd = 0,H 1:μd ≠ 0,α=

③两独立样本t 检验:比较与21X X

)

(2

)1(n )1(n 212

11

n 12122

22112

12

1n X X n n S S X X S X X t +-+-+--=

-=

-,v=n1+n2-2

附:若为两个大样本,可用u 检验

2

22

1212

12

12

1n S n S X

X S X X u X X +-=

-=

-

一般假设:H 0:μ1=μ2,H 1:μ1≠μ2 α=

方差齐性检验

计算公式:()()

1 1

22112221-=-==n n S S F νν较小较大

结果根据F 值,V1值,V2值,查F 表即可

一般假设:H 0:σ12=σ22

,即两组总体方差相等

H 1: σ12≠σ22

,即两组总体方差不等

α=(这个随意啦) 3.方差分析

①完全随机设计资料方差分析

完全随机设计方差分析计算表(较简单)

变异来源 离均差平方和SS

自由度 均方MS F

总 )1(2-N S

N-1

MS 组间/MS 组内

组间

2

)(X X n i

i -∑

k-1 (k 为组数)

SS 组间/df 组间 组内(视为误差)

SS 总 –SS 组间

N-k

SS 组内/df 组内

建立假设:H 0: 1=2 = 3 ,H 1:

1

,

2

, 3

不等或不全相等,=

②随机区组设计资料的方差分析 随机区组设计资料的方差分析

变异来源 离均差平方和SS

自由度()

均方MS F (求两个方差)

总 )1(2-=n S SS T

N-1

处理组间 2

)(∑-=X X m SS i A

k-1(k 为处理因素个数) SS A /(k-1) MS A /MSe 区组组间

2

)(∑-=X X k SS j B

m-1

(m 为组数)

SS B /(m-1) MS B /MSe

误差(sse )

SS 总—A SS —B SS

(k-1)(m-1) SSe/

e

建立假设:有两个方差比较,所以会有两个假设

: 处理因素导致应变量均数相等 ,H 1: 不等或不全相等,=

: 区组因素(如不同区组动物)导致应变量均数相等 ,H 1: 不等或不全相等,= ④多样本均数间的两两比较法

()

)1

1(2/

B

A B A n n MSe X X q +-= 自由度: =

e

4.计量资料

率的抽样误差和标准误

总体:n

p )

1(ππσ-=

样本: n

P p S p )

1(-=

( p =阳性率, 1- p=阴性率)

总体率的置信区间估计 正态近似法:

条件: n 足够大,样本率p 或1-p 均不太小时, 即np 和 n(1-p)>5

p

u

/2

× Sp

两个率的比较的u 检验(z 检验)

①样本率与总体率的比较: n

p p u p

)

1(πππ

σπ

--=

-=

②两个样本率比较(记前面一个公式就好):

)

1

1)(1(S 2

12

12

12

1n n p p p p p p u c c p p +--=-=

-,其中

2

121n n X X p c ++=

卡方检验:

1.计算公式:T 5, 且 N 40时, 使用(注意T 为理论频数)

()T

T A 2

2

-∑

, df=(行数-1)(列数-1)

A 为实际频数,T 为理论频数(计算方法有多种,此处略)

2.校正公式:1 T < 5,且N 40时,用连续性校正公式

()

--=T

T A 2

5.02χ

四格表资料的Χ2

检验

四格表专用公式:)

)()()(()(22d b c a d c b a n

bc ad ++++-=χ,df =(R-1)(C-1)=1

四格表专用校正公式:())

)()()((2/22

d c b a d b c a n

n bc ad ++++--=

χ

1. T 5, 且 N 40时, 用非校正的公式

2. 1 T < 5,且N 40时,用连续性校正公式

配对设计资料的Χ2

检验(特殊的四格)

①b+c >40时:()c

b c b +-=

2

2χ ② b+c <40时:()

c

b c b +--=

2

12χ

行×列表资料的

2

检验 (R ×C 表资料)

基本公式:??

?

???-∑

=122

C R n n A n χ ,df=(行数-1)(列数-1) 5.直线相关与回归 相关系数:YY

XX XY l l l r

=

,t 检验:r

r s r t 0

-=

,df =n -2

直线回归:bX a Y +=?,()()()

X

b Y a l l X X Y Y X X b XX

XY

-==

---=∑∑2

,t 检验:b

S b t 0

-=

df =n -2

相关文档