文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学(第六版)期末复习

医学统计学(第六版)期末复习

统计

一绪论

第一节:

统计学:

重要作用:在于能够透过偶然现象来探测其规律性。

研究对象:具有不确定性结果的事物。

第二节:

基本内容:

1 .统计设计

2 .数据整理

3.统计描述

4.统计推断

第三节:

统计学的基本概念

同质:根据研究目的所确定的观察单位其性质大致相同。变异:各观察单位存在差异,这种差异称为变异。

变量与数据类型

总体和样本

总体:根据研究目的所确定的同质观察单位的全体。

参数:μ率:μ/π

样本:从研究总体中抽取部分有代表性的观察单位。

统计量:率/ P

X X

第二章

第一节频数分布

频数表

1.求全距:max—min=R

2.确定组数:1/10*全距

3.确定组距:

4.确定组限: 第一组下限≤min 最后一组上限≥max 偶数比奇数好

5.确定频数

6.归纳分析

第二节

一、算术均数 适用:正态分布

用于说明一组观察值的平均水平或集中趋势。 (一)直接法(小样本)

= /

:样本均数 n :样本观察例数

(二)加权法 (大样本) n

∑= X f X

=(各组中值*组频数)/n 组中值=1.(本组下限+第二组下限)/2 2.本组下限值+组距/2

二、几何均数

适用:1.等比资料 2.对数正态分布

X X X

小样本:n

∑-= X lg lg G 1

大样本:n

∑-=M 1

X lg f lg G

三、中位数

小样本:奇数:M=X (N+1)/2

偶数:M=1/2[X n /2+X (n/2+1)]

大样本:i f f n 5.0L M M

L

M ?-+=)(

M :中位数; L M :M 所在组的上限; f L :M 所在组之前积累的频数 ;f M :M 所在组的频数; i :组距。 四、百分位数

i f f x%n L P x

L

x X ?-?+=)(

L x :X 所在组的上限; f X :X 所在组之前积累的频数 ;f L :X 所在组的频数; i :组距

第三节变异程度的统计指标

一、极差

极差(R ):即全距=max –min

二、四分位数间距 (越大则数据变异越大。适用于偏态分布。)

Q=P 75 - P 25

三、方差

样本方差:S 2=Σ(X- )2/(n-1) 总体方差

: Σ(x μ)2/(n -1)

Ps:

四、标准差 样本:S=

五、变异系数

用于均属相差交大或单位不同的几组数据观察值的比较。

CV=%100X

S

? 第三章 正态分布与医学参考值范围

第一节正态分布

(高斯分布)

一、正态曲线

X

中间高,两边低,左右对称,略呈钟形。

随机变量X服从

f(x)=

F (x )=

随机变数x 的分布叫作正态分布,记作N( μ , δ2 ) ,读作“具平均数为μ,方差为δ2 的正态分布”

主要特征:

1.以X=μ为中心,左右对称,不与x轴相交。

2.在X=μ处有最大值,越远越小。

3. μ曲线右移

μ曲线左移

曲线越平

4. μ±面积68.27%

μ±1.64面积90.00%

μ±1.96面积95.00%

μ±2.58面积99.00%

三、标准正态分布

对于任意服从N( μ , δ2 )分布的随机变量X 经

Z=(X-μ)/转化为μ=0 的标准正态分布。

Φ(u )=

Φ(Z)=1-Φ(-Z)

u=

当μ和未知利用样本均数和标准差S计算Z

Z=(X-)/S

四、医学参考值范围

指数据大多数个体值的波动范围。

制定:

1.确定同质的参照总体。

2.选择足够例数的参照样本。

3.控制检测误差。

4.选择单、双侧界值。

5.选择适合的百分数范围。

6.选择计算参考值范围的方法。

三、计算方法

第四章定性数据的统计描述

第一节常用相对数

相对数:两个相关的绝对数之比。性质取决于分子与分母的意义。

一、率

率=(某事物或现象发生的实际数/某事物或现象发生的所有可能数)*比例基数

率=(A+/A ++A-)*K

二、构成比

构成比=(该事物内部某一组成部分的观察单位数/某事物内部的所有观察单位之后)*100%

三、相对比

相对比=A/B*K (*100%)分子大于分母不乘K

第二节医学常用相对数指标

1、死亡率=(死亡人口总数/同年该地平均人口数)*100% 构成比≠率

第五章统计表与统计图

第一节、统计表

(必要)结构:

1.表号标题(时间、地点、研究内容)

2.标目

3.线条顶线、底线、中线

4.数字

5.备注

第二节、统计图注意图例

结构:

1.标题

2.图域

3.标目

4.图例

5.刻度

定量数据:(连续性)

一、直方图(连续变量频数分布)

二、线图(一个量随另一个量的变化趋势)横/纵=7/5 纵轴必须从零开始

三、箱式图(比较两组或多组资料的集中和离散趋势)(偏态分布)

五、散点图(用密集程度和变化趋势表示两指标之间的直线或曲线关系)

定性数据:

一、直条图(用等宽直条的长短来表示相互独立的统计指标数值大小和对比关系)

(单式、复式)

二、构成图(用于构成比资料)

1.圆图

2.百分条图

第六章参数估计与假设检验

第一节参数估计

一、抽样误差

(一)均数的标准误:反应样本均数之间的变异的标准差。

理论:

样本:标准差

标准误

(二)率的标准误:样本率的标准差

总体:

样本:

二、可信区间

事先给定的概率1-α称为可信度

计算得到的区间称为可信区间

(一)已知

(二)未知

1. t分布

μ=

t=

第二节假设检验

目的:比较总体参数之间有无差别

基本步骤:

(一)建立假设检验和确认检验水准

H0:…………………………

H1:…………………………

α=0.05 或α=0.01 (写明单双侧)

(二)选择检验方法和计算检验统计量

(三)根据P值做出推断

结论:

1、p<α,样本数据差异显著,有统计学意义,拒绝H0,接受H1

2、P>α,样本数据差异不显著,无统计学意义,根据现有样本不足以拒绝H0(不等于接受H0)。

第七章t 检验

第一节t 检验 一、单样本t 检验

适用样本均数与已知总体均数μ0

t =

V=n -1

二、配对样本的均数t 检验

检验两相关样本均数所代表的未知总体均数是否有差别。

为差值样本的均数 S d 为差值样本的标准差

为差值本

的标准误 n 为配对样本的对子数

P 值越小越有理由拒绝原假设 成组设计实验的两样本均数比较 条件:n1,n2,X 1,X 2,S1,S2 1、H 0:μ1=μ2 , 2、u=

2

22

121

21/S /n S X X n +-

3、96.1u 05.0=,58.2u 01.0=

假设检验中的两类错误:

1、第一类错误:当H0为真时,拒绝H0接受H1。又称假阳性错误(阳性指两者总体参数有差异)。检验水准α是预先规定的犯第一类错误的概率的最大值。

2、第二类错误:当H0为假时,不拒绝H0。又称假阴性错误。概率大小用β表示,只取单侧,一般未知。

可证,α越大β越小,α越小β越越大。若要同时减少第一类错误和第二类错误,唯一方法是增大样本含量。

第九章卡方检验

第一节四格表资料

一、通用公式n >40 T≥5

V=(行数-1)(列数-1)

A 实际T理论

=3.84 =6.63

二、专用公式

三、校正公式1≤T<5 n≥40

通用:

专用:

第二节配对四格表

(b+c)≥40 :V=1

(b+c)<40 :V =1

第三节行乘列表的卡方检验

V=(R-1)(c-1)

N为总例数 A 实际频数A A A B 分别对应周边合计数

二、多个样本率间多重比较

两两比较:

实验对照:

相关文档
相关文档 最新文档