1.计量资料的统计描述
均数(了解即可,加权的算法应该不看了)
①算数均数:直接法
n X
n Xn X X X ∑=
+++=
(21)
加权法
n fX
f fX f f f X f X f X f X k k k ∑=
∑∑=++++++=
(212211)
②几何均数(G ) 直接:?
??
??∑=-n X
G lg lg 1 加权:
???
??∑=-n X f G lg lg 1
③中位数:直接:奇数时()2
/
1+=n X M 偶数时()2/12/2/++=n n X X M
加权略 离散趋势
①极差(全距)(R )= 最大值-最小值 ②四分位数间距(Q ):P 75 (上四分位数)- P 25(下四分位数) ③方差(S 2
):(离均差(-
-X X )平分和的总和÷N (或N-1))
总体方差:()N X 2
2μσ-∑= 样本方差:()
()1
1
2
2
2
2-∑-
∑=
--∑=
n n
X X n X X S
标准差(S ,SD ):
总体:()N
X 2
μσ-∑= 样本:()
()1
1
2
2
2
-∑-
∑=
--∑=
n n
X X n X X S
④变异系数(CV ):%100?=
X
S
CV 用于:a. 比较计量单位不同的几组资料的离散程度 b. 比较均数相差悬殊的几组资料的离散程度 2.计量资料统计推断 均数抽样误差与标准误 标准误:n
S n X ==
X S σσ σ为总体,S 为抽样
总体均数的估计
均数的双侧可信区间为:
①大样本或总样本已知(且为正态分布)时,按正态分布原理
()
X X X u X u X u
X σσσααα2/2/2
/ ,±=+-
= ,=
②小样本或总样本未知时,按t 分布原理:
()
X
X X S t X S t X S t
X ναναν
α,2/,2/,2/ ,±=+-
附:参考值范围计算公式(注意区分):(参考值用标准差,可信区间用标准误)
X
-100X 2/P ~ P X 偏态分布正态分布S u α± ,α=1-范围(如95%等)
t 检验
①单样本t 检验(已有一个大样本均数(视为总体均数0μ),本次样本的均数比较与0μX ) 1-n 0
0=-=-=
νμμn
S X S X t X (后面变式可以不用记,即标准误的算法变化)
一般假设:H0:μd= 0, H1:μd ≠ 0,α=
②配对t 检验(一般为对照配比的实验,计算差值, 比较与0d )
n
S d t d
0-=
一般假设:H 0:μd = 0,H 1:μd ≠ 0,α=
③两独立样本t 检验:比较与21X X
)
(2
)1(n )1(n 212
11
n 12122
22112
12
1n X X n n S S X X S X X t +-+-+--=
-=
-,v=n1+n2-2
附:若为两个大样本,可用u 检验
2
22
1212
12
12
1n S n S X
X S X X u X X +-=
-=
-
一般假设:H 0:μ1=μ2,H 1:μ1≠μ2 α=
方差齐性检验
计算公式:()()
1 1
22112221-=-==n n S S F νν较小较大
结果根据F 值,V1值,V2值,查F 表即可
一般假设:H 0:σ12=σ22
,即两组总体方差相等
H 1: σ12≠σ22
,即两组总体方差不等
α=(这个随意啦) 3.方差分析
①完全随机设计资料方差分析
完全随机设计方差分析计算表(较简单)
变异来源 离均差平方和SS
自由度 均方MS F
总 )1(2-N S
N-1
MS 组间/MS 组内
组间
2
)(X X n i
i -∑
k-1 (k 为组数)
SS 组间/df 组间 组内(视为误差)
SS 总 –SS 组间
N-k
SS 组内/df 组内
建立假设:H 0: 1=2 = 3 ,H 1:
1
,
2
, 3
不等或不全相等,=
②随机区组设计资料的方差分析 随机区组设计资料的方差分析
变异来源 离均差平方和SS
自由度()
均方MS F (求两个方差)
总 )1(2-=n S SS T
N-1
处理组间 2
)(∑-=X X m SS i A
k-1(k 为处理因素个数) SS A /(k-1) MS A /MSe 区组组间
2
)(∑-=X X k SS j B
m-1
(m 为组数)
SS B /(m-1) MS B /MSe
误差(sse )
SS 总—A SS —B SS
(k-1)(m-1) SSe/
e
建立假设:有两个方差比较,所以会有两个假设
: 处理因素导致应变量均数相等 ,H 1: 不等或不全相等,=
: 区组因素(如不同区组动物)导致应变量均数相等 ,H 1: 不等或不全相等,= ④多样本均数间的两两比较法
()
)1
1(2/
B
A B A n n MSe X X q +-= 自由度: =
e
4.计量资料
率的抽样误差和标准误
总体:n
p )
1(ππσ-=
样本: n
P p S p )
1(-=
( p =阳性率, 1- p=阴性率)
总体率的置信区间估计 正态近似法:
条件: n 足够大,样本率p 或1-p 均不太小时, 即np 和 n(1-p)>5
p
u
/2
× Sp
两个率的比较的u 检验(z 检验)
①样本率与总体率的比较: n
p p u p
)
1(πππ
σπ
--=
-=
②两个样本率比较(记前面一个公式就好):
)
1
1)(1(S 2
12
12
12
1n n p p p p p p u c c p p +--=-=
-,其中
2
121n n X X p c ++=
卡方检验:
1.计算公式:T 5, 且 N 40时, 使用(注意T 为理论频数)
()T
T A 2
2
-∑
=χ
, df=(行数-1)(列数-1)
A 为实际频数,T 为理论频数(计算方法有多种,此处略)
2.校正公式:1 T < 5,且N 40时,用连续性校正公式
()
∑
--=T
T A 2
5.02χ
四格表资料的Χ2
检验
四格表专用公式:)
)()()(()(22d b c a d c b a n
bc ad ++++-=χ,df =(R-1)(C-1)=1
四格表专用校正公式:())
)()()((2/22
d c b a d b c a n
n bc ad ++++--=
χ
1. T 5, 且 N 40时, 用非校正的公式
2. 1 T < 5,且N 40时,用连续性校正公式
配对设计资料的Χ2
检验(特殊的四格)
①b+c >40时:()c
b c b +-=
2
2χ ② b+c <40时:()
c
b c b +--=
2
12χ
行×列表资料的
2
检验 (R ×C 表资料)
基本公式:??
?
???-∑
=122
C R n n A n χ ,df=(行数-1)(列数-1) 5.直线相关与回归 相关系数:YY
XX XY l l l r
=
,t 检验:r
r s r t 0
-=
,df =n -2
直线回归:bX a Y +=?,()()()
X
b Y a l l X X Y Y X X b XX
XY
-==
---=∑∑2
,t 检验:b
S b t 0
-=
df =n -2