统计
一绪论
第一节:
统计学:
重要作用:在于能够透过偶然现象来探测其规律性。
研究对象:具有不确定性结果的事物。
第二节:
基本内容:
1 .统计设计
2 .数据整理
3.统计描述
4.统计推断
第三节:
统计学的基本概念
同质:根据研究目的所确定的观察单位其性质大致相同。变异:各观察单位存在差异,这种差异称为变异。
变量与数据类型
总体和样本
总体:根据研究目的所确定的同质观察单位的全体。
参数:μ率:μ/π
样本:从研究总体中抽取部分有代表性的观察单位。
统计量:率/ P
X X
第二章
第一节频数分布
频数表
1.求全距:max—min=R
2.确定组数:1/10*全距
3.确定组距:
4.确定组限: 第一组下限≤min 最后一组上限≥max 偶数比奇数好
5.确定频数
6.归纳分析
第二节
一、算术均数 适用:正态分布
用于说明一组观察值的平均水平或集中趋势。 (一)直接法(小样本)
= /
:样本均数 n :样本观察例数
(二)加权法 (大样本) n
∑= X f X
=(各组中值*组频数)/n 组中值=1.(本组下限+第二组下限)/2 2.本组下限值+组距/2
二、几何均数
适用:1.等比资料 2.对数正态分布
X X X
小样本:n
∑-= X lg lg G 1
大样本:n
∑-=M 1
X lg f lg G
三、中位数
小样本:奇数:M=X (N+1)/2
偶数:M=1/2[X n /2+X (n/2+1)]
大样本:i f f n 5.0L M M
L
M ?-+=)(
M :中位数; L M :M 所在组的上限; f L :M 所在组之前积累的频数 ;f M :M 所在组的频数; i :组距。 四、百分位数
i f f x%n L P x
L
x X ?-?+=)(
L x :X 所在组的上限; f X :X 所在组之前积累的频数 ;f L :X 所在组的频数; i :组距
第三节变异程度的统计指标
一、极差
极差(R ):即全距=max –min
二、四分位数间距 (越大则数据变异越大。适用于偏态分布。)
Q=P 75 - P 25
三、方差
样本方差:S 2=Σ(X- )2/(n-1) 总体方差
: Σ(x μ)2/(n -1)
Ps:
四、标准差 样本:S=
五、变异系数
用于均属相差交大或单位不同的几组数据观察值的比较。
CV=%100X
S
? 第三章 正态分布与医学参考值范围
第一节正态分布
(高斯分布)
一、正态曲线
X
中间高,两边低,左右对称,略呈钟形。
随机变量X服从
f(x)=
且
F (x )=
随机变数x 的分布叫作正态分布,记作N( μ , δ2 ) ,读作“具平均数为μ,方差为δ2 的正态分布”
主要特征:
1.以X=μ为中心,左右对称,不与x轴相交。
2.在X=μ处有最大值,越远越小。
3. μ曲线右移
μ曲线左移
曲线越平
4. μ±面积68.27%
μ±1.64面积90.00%
μ±1.96面积95.00%
μ±2.58面积99.00%
三、标准正态分布
对于任意服从N( μ , δ2 )分布的随机变量X 经
Z=(X-μ)/转化为μ=0 的标准正态分布。
Φ(u )=
Φ(Z)=1-Φ(-Z)
u=
当μ和未知利用样本均数和标准差S计算Z
Z=(X-)/S
四、医学参考值范围
指数据大多数个体值的波动范围。
制定:
1.确定同质的参照总体。
2.选择足够例数的参照样本。
3.控制检测误差。
4.选择单、双侧界值。
5.选择适合的百分数范围。
6.选择计算参考值范围的方法。
三、计算方法
第四章定性数据的统计描述
第一节常用相对数
相对数:两个相关的绝对数之比。性质取决于分子与分母的意义。
一、率
率=(某事物或现象发生的实际数/某事物或现象发生的所有可能数)*比例基数
率=(A+/A ++A-)*K
二、构成比
构成比=(该事物内部某一组成部分的观察单位数/某事物内部的所有观察单位之后)*100%
三、相对比
相对比=A/B*K (*100%)分子大于分母不乘K
第二节医学常用相对数指标
1、死亡率=(死亡人口总数/同年该地平均人口数)*100% 构成比≠率
第五章统计表与统计图
第一节、统计表
(必要)结构:
1.表号标题(时间、地点、研究内容)
2.标目
3.线条顶线、底线、中线
4.数字
5.备注
第二节、统计图注意图例
结构:
1.标题
2.图域
3.标目
4.图例
5.刻度
定量数据:(连续性)
一、直方图(连续变量频数分布)
二、线图(一个量随另一个量的变化趋势)横/纵=7/5 纵轴必须从零开始
三、箱式图(比较两组或多组资料的集中和离散趋势)(偏态分布)
五、散点图(用密集程度和变化趋势表示两指标之间的直线或曲线关系)
定性数据:
一、直条图(用等宽直条的长短来表示相互独立的统计指标数值大小和对比关系)
(单式、复式)
二、构成图(用于构成比资料)
1.圆图
2.百分条图
第六章参数估计与假设检验
第一节参数估计
一、抽样误差
(一)均数的标准误:反应样本均数之间的变异的标准差。
理论:
样本:标准差
标准误
(二)率的标准误:样本率的标准差
总体:
样本:
二、可信区间
事先给定的概率1-α称为可信度
计算得到的区间称为可信区间
(一)已知
(二)未知
1. t分布
μ=
t=
第二节假设检验
目的:比较总体参数之间有无差别
基本步骤:
(一)建立假设检验和确认检验水准
H0:…………………………
H1:…………………………
α=0.05 或α=0.01 (写明单双侧)
(二)选择检验方法和计算检验统计量
(三)根据P值做出推断
结论:
1、p<α,样本数据差异显著,有统计学意义,拒绝H0,接受H1
2、P>α,样本数据差异不显著,无统计学意义,根据现有样本不足以拒绝H0(不等于接受H0)。
第七章t 检验
第一节t 检验 一、单样本t 检验
适用样本均数与已知总体均数μ0
t =
V=n -1
二、配对样本的均数t 检验
检验两相关样本均数所代表的未知总体均数是否有差别。
为差值样本的均数 S d 为差值样本的标准差
为差值本
的标准误 n 为配对样本的对子数
P 值越小越有理由拒绝原假设 成组设计实验的两样本均数比较 条件:n1,n2,X 1,X 2,S1,S2 1、H 0:μ1=μ2 , 2、u=
2
22
121
21/S /n S X X n +-
3、96.1u 05.0=,58.2u 01.0=
假设检验中的两类错误:
1、第一类错误:当H0为真时,拒绝H0接受H1。又称假阳性错误(阳性指两者总体参数有差异)。检验水准α是预先规定的犯第一类错误的概率的最大值。
2、第二类错误:当H0为假时,不拒绝H0。又称假阴性错误。概率大小用β表示,只取单侧,一般未知。
可证,α越大β越小,α越小β越越大。若要同时减少第一类错误和第二类错误,唯一方法是增大样本含量。
第九章卡方检验
第一节四格表资料
一、通用公式n >40 T≥5
V=(行数-1)(列数-1)
A 实际T理论
=3.84 =6.63
二、专用公式
三、校正公式1≤T<5 n≥40
通用:
专用:
第二节配对四格表
(b+c)≥40 :V=1
(b+c)<40 :V =1
第三节行乘列表的卡方检验
V=(R-1)(c-1)
N为总例数 A 实际频数A A A B 分别对应周边合计数
二、多个样本率间多重比较
两两比较:
实验对照: