文档库 最新最全的文档下载
当前位置:文档库 › 统计学知识点总结

统计学知识点总结

统计学知识点总结
统计学知识点总结

第2章统计描述

1. 对定量资料进行统计描述时,如何选择适宜的指标?

定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合

平均水平均数个体的平均值对称分布

几何均数平均倍数取对数后对称分布

中位数位次居中的观察值①非对称分布;②半定量资料;③末端开

口资料;④分布不明

众数频数最多的观察值不拘分布形式,概略分析

调和均数基于倒数变换的平均值正偏峰分布资料

变异度全距观察值取值范围不拘分布形式,概略分析

标准差(方差)观察值平均离开均数的

程度

对称分布,特别是正态分布资料

四分位数间距居中半数观察值的全距

①非对称分布;②半定量资料;③末端开

口资料;④分布不明

变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但

数量级相差悬殊的变量间比较

定性资料:阳性事件的概率,概率分布,强度和相对比。

2. 应用相对数时应注意哪些问题?

答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。

(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。

(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。

(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。

3. 常用统计图有哪些?分别适用于什么分析目的?

常用统计图的适用资料及实施方法

图形适用资料实施方法

条图组间数量对比用直条高度表示数量大小

直方图定量资料的分布用直条的面积表示各组段的频数或频率

百分条图构成比用直条分段的长度表示全体中各部分的构成比

饼图构成比用圆饼的扇形面积表示全体中各部分的构成比

线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系

半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数

第3章概率分布

1. 服从二项分布及Poisson分布的条件分别是什么?

二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。

Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。

2. 二项分布、Poisson分布分别有什么特征?

①二项分布、Poisson分布都是离散型分布。

②二项分布的形状取决于π与n的大小。π=0.5时,不论n大小,对称分布。π≠0.5时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。

③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。

4、正态分布应用

①估计变量值的频数分布

②制定参考值范围

③质量控制

④正态分布是很多统计方法的基础

5. 正态分布特征

①以均数为中心,左右对称

②正态曲线在横轴上方均数处取得最高点

③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)

④正态曲线下面积有一定规律

第4章参数估计

1. 标准误与标准差的区别

(1)标准差反映个体值散布的程度;标准误反映精确知道总体参数的程度。

(2)标准误小于标准差。

(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,随着样本含量的增大,标准差有可能增大,也有可能减小。

(4)用途不同。

标准差的用途:

①反映一组资料的离散程度

②计算变异系数

③结合均数与正态分布的规律,估计参考值范围

标准误的用途:

④衡量样本均数的可靠性

⑤与样本均数结合,估计总体均数的置信区间

⑥可用于进行均数的假设检验

标准误与标准差的区别与联系

区别置信区间参考值范围

含义

用途

计算公式总体参数的波动范围,即按事先给

定的概率100(1-)%所确定的包

含未知总体参数的一个波动范围

估计未知总体均数所在范围

σ未知:

/2,X

t S

αν

±

σ已知或σ未知但n≥30,有

/2X

X Z

α

σ

±

/2X

X Z S

α

±

个体值的波动范围,即按事先给

定的范围100(1-)%所确定

的“正常人”的解剖、生理、

生化指标的波动范围

供判断观察个体某项指标是否

“正常”时参考(辅助诊断)

正态分布:

/2

X Z S

α

±

偏峰分布:P X~P100-X

4 何谓置信区间准确度与精确度?如何协调两者间的关系。

置信区间有准确度与精密度两个要素。

(1)准确度由置信度(1-α) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,

(2)精密度是置信区间宽度的一半,意指置信区间的两端点值离样本统计量(如X、p)

的距离。从精密度的角度看,置信区间宽度愈窄愈好。

(3)在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。

3、参考值范围估计的基本步骤

①从正常人的总体中进行随机抽样

②对选定的正常人进行准确的测定

③确定取单侧还是双侧范围

④确定范围常用95%。

⑤根据资料的分布类型选用恰当的界值估计方法

第5章 假设检验

1.试述假设检验中α与P 的联系与区别。 区别:(1)α值是事先确定的一个小的概率值。为一次检验中,甘愿冒的风险。

(2)P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。为一次检验中,实际冒的风险。

联系:以t 检验为例,P 、a 都可以用t 分布尾部面积大小表示。P ≤α时,拒绝0H 假设。 2. 试述假设检验与置信区间的联系与区别。

联系:区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。 区别:置信区间用于说明量的大小,即推断总体参数的置信范围;

假设检验用于推断质的不同,即判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验?

需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,则应选用双侧检验。若需要区分何者为优,,则应选用单侧检验。在没有特殊专业知识说明的情况下,一般采用双侧检验即可。 4. 试述两类错误的意义及其关系。

⑴Ⅰ类错误:如果检验假设0H 实际是正确的,由样本数据计算获得的检验统计量得出拒绝

0H 的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H (弃真)的错误称

为Ⅰ类错误。Ⅰ类错误的概率用 α表示。

⑵Ⅱ类错误:若检验假设0H 原本不正确(1H 正确),由样本数据计算获得的检验统计量得出不拒绝0H (纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β 表示。

在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。

5.试述检验功效的概念和主要影响因素。

答:拒绝不正确的0H 的概率,在统计学中称为检验功效(power of test),记为1β-。

检验功效的意义是:当两个总体参数间存在差异时(如备择假设1H :0μμ≠成立时),所使用的统计检验能够发现这种差异(拒绝零假设0H :0μμ=)的概率,一般情况下要求检验功效应在0.8以上。

影响检验功效的四要素为总体参数的差异δ、总体标准差σ、检验水准α及样本量n 。

6.简述假设检验的基本思想。

假设检验是在H 0成立的前提下,从样本数据中寻找证据来拒绝0H 、接受1H 的一种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝0H ,暂且认为0H 成立,即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝0H 是根据某个界值,即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝0H ,即有足够证据推断差异具有统计学意义。

7. 建设检验四步骤:

⑦ 建立检验假设H 0和备择假设H 1(判断是单侧检验还是双侧检验再作假设) ⑧ 确定检验水准

⑨ 选定检验方法和计算检验统计量 ⑩ 确定P 值和作出推断结论 8.参数及非参数检验优缺点

第6章两样本定量资料的比较

1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?

答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性(样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐,采用t 检验;如果满足正态性但总体方差不齐,采用t′检验;当两者都不满足时,才考虑选用秩和检验。当然,我们也可采用变量变换的方法使其满足t或t′检验的条件。

2.t检验有几种,适用条件是什么?

t检验是以t分布为理论基础。小样本时,要求资料符合正态分布和方差齐性。一般有以下三种:

?样本均数与总体均数的比较

?配对资料的比较

?两个样本均数的比较

此外,还有相关系数,回归系数的t检验。

3.两组定量独立样本的比较

(1)两独立样本的t检验(满足正态性和方差齐性)

(2)校正的t检验(正态但方差不齐)

(3)u检验(大样本,且方差齐)

(4)秩和检验(小样本,不正不齐){p值确定分为T值在范围内还是范围外}

4.配对定量资料的比较

(1)配对资料的t检验(差值服从正态)

(2)符号秩和检验(不正){p值确定类似于t检验}

5.两poisson分布资料的比较 Z检验

第7章多组定量资料的比较

1. 方差分析的基本思想和应用条件是什么?

基本思想

将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。

应用条件

①各样本是相互独立的随机样本,均服从正态分布;

②各样本的总体方差相等,即方差齐性。

2.方差分析的步骤

①建立假设检验和检验水准(H0:总体均数都相等)

②计算统计量F

③确定P值和作出推断结论

④作两两均数之间的比较(若P>0.05,可省略此步)

3. 多组定量资料比较时,统计处理的基本流程是什么?

多组定量资料比较时首先应考虑用方差分析。

(1)若方差齐性,且各样本均服从正态分布,选单因素方差分析。

(2)若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。

若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。

4.方差分析的应用?

①多组定量资料比较,即两个或两个以上均数的比较

②方差齐性检验

③两个或多个研究因素的交互作用

④回归方程的线性假设检验

第8章 定性资料的比较

1. 简述2χ检验适用的数据类型,基本思想,检验步骤。

答:⑴卡方检验是应用较广的一种定性资料的假设检验方法,用于①检验两个或多个样本率(或构成比)之间有无差别,②交叉分类资料两属性间的关联性检验 ③频数分布的拟合优度

⑵χ2检验的基本思想:χ2

值反映的是实际频数与理论频数的吻合程度,在检验假设

H 0成立的情况下,实际频数与理论频数差别仅由随机误差所致,其χ2

值会比较小,反之亦

然,χ2

值越大,越有理由认为检验假设H 0不成立。

⑶检验步骤:

① 建立假设检验和检验水准(H 0 :总体分布/某情况/某率相等) ② 计算统计量 2χ

③ 确定P 值和做出推断结论

④ 作两两之间的比较(若P>0.05,可省略此步)

2.四格表资料χ2

检验的条件有哪些?(注意T 为理论频数)

完全随机设计公式,χ2 = (ad-bc )2

. n/{(a+b )(c+d )(a+c )(b+d )}

① 总例数n ≥40,且T ≥5,直接计算χ2

不用校正

② n ≥40,且1≤T <5,用连续性校正χ2检验

③ n <40或T <1,不能用χ2

检验,用直接计算概率的方法Fisher 确切概率法。

配对设计公式 χ2 = (b-c )2

/(b+c) ① b+c ≥40,无需校正 ②b+c ≤40,用连续校正公式

3. 两组二分类资料的设计类型有几类?其相应的检验方法是什么?

两组二分类资料的设计类型主要有2类,即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。

通用公式χ2 =(A-T )2

/ T

完全随机设计公式 χ2 = (ad-bc )2

. n/{(a+b )(c+d )(a+c )(b+d )}

配对设计公式 χ2 = (b-c )2

/(b+c)

4. 什么资料适合用秩和检验进行检验?简述秩和检验步骤。

适用于总体分布未知资料,偏态分布资料,开口资料,等级资料。 秩和检验步骤为:

① 建立假设10H H 和,并确定检验水准α;(H 0总体分布相等/配对秩和:中体中位数为0) ② 根据不同的设计类型对资料进行编秩并计算秩和;

③ 根据计算的秩和直接查表或计算相应的统计量再查表,确定P 值,作出统计推断。

6、行×列表资料χ2检验的注意事项

①要求不能有1/5以上的格子理论频数小于5,或不能有任意一个格子的理论频数小于1,否则易致分析的偏性。

②若结果拒绝检验假设,只能认为各总体率或构成比之间总的来说有差别,并非彼此间都有差别

③单向有序的行×列表资料,不宜作χ2检验。

6、两样本比较的秩和检验直接法基本思想

假定含量分别为N1和N2的两个样本,来自同一总体或分布相同的两个总体,则样本含量为N1的样本的T与平均秩和N1(N+1)/2一般相差不大,若相差悬殊,超出界值范围,表示随机抽得现有样本统计量T值的概率很小。

7.非参与参数检验的定义及两者区别

参数检验是总体的分布类型已知,对其中未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。

非参数检验是不依赖于总体分布形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。

9.配对设计差值的秩和检验的编秩方法

①求差值

②将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。

③若差值绝对值相等,则取其平均秩次。

④编秩时若遇差值为0,则舍去不计。

10.两组比较的秩和检验的编秩方法

将两样本混合编秩次,若有“相同数据”,处于不同组,则取其平均秩次;在同一组,则无需取平均秩次。(数据 0 不舍去)

11. 配对设计差值的秩和检验的检验步骤

⑴建立假设检验,确定检验水准 H0 :差值的总体中位数为零 H1 :差值的总体中位数不为零

⑵计算检验统计量T值

①求差值

②编秩:将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值绝对值相等,则取其平均秩次。编秩时若遇差值为0,则舍去不计。

③求秩和确定统计量T

⑶确定P值,作出统计学推断。n<25,用查表法。n>25,用正态近似法。

8.参数检验和非参数检验的优缺点比较

13.非参检验适用范围

①各种资料初步分析

②等级资料,如严重程度,优劣等级,成效大小等。

③资料分布类型不能确认或偏态分布。

④综合分析同质性较差的资料

⑤组内个别数据偏离较大,或组内相差悬殊。

第9章关联性分析第10章简单线性回归分析

1.Pearson积距相关系数r的特点

①相关系数ρ是一个无量纲的数值,且-1≤ρ≤1

②ρ>0为正相关,ρ<0为负相关。

③| ρ |越接近1,说明相关性越好;| ρ |越接近0,说明相关性越差。

2.线性回归分析的前提条件 LINE

①线性指反应变量Y与自变量X呈线性变化趋势。一般通过散点图来考察。

②独立性任意两个观察值相互独立。一个个体的取值不受另外一个个体的影响。

③正态性指给定X值时,Y的取值服从正态分布。

④等方差性指对应于不同的X值,Y值的总体变异相同。

Pearson秩相关(即等级相关)的应用条件

①双变量不服从正态分布的资料

②总体分布类型未知的资料

③数据本身有不确定值

④等级资料

直线回归及其回归方程有何用途

①描述Y对X的依存关系

②预测。由自变量X预测应变量Y。

③统计控制。通过控制自变量X的取值,从而使Y在一定范围内波动。

简述做直线相关与回归分析时的注意事项

①回归方程要有实际意义

②分析前先绘散点图,观察是否存在直线趋势或异常点

③直线回归的适用范围一般以自变量X的取值范围为限,不能随便外延。

直线相关与直线回归的区别与联系

区别

①资料要求不同。相关分析要求X,Y均服从正态分布,而回归分析时,要求Y服从正态分布。

②应用不同。相关是只说明两个变量间是否有关联。回归是由一个变量推算另外一个变量,说明依存变化的数量关系。

③相关系数与回归系数 r 与 b 不同。

A.意义不同:b表示X每增(减)一个单位,Y改变b个单位;r说明具有直线关系的两个变量关系的密切程度和方向。

B.取值范围不同 -∞<b<+∞,-1≤r≤+1

C.b有单位,r无单位。

联系

①同一组资料相关系数和回归系数的符号相同。

②同一资料相关系数和回归系数的假设检验等价。即 tr=tb ,P值相等。

③可以用回归解释相关。

简述简单线性回归分析的基本步骤。

①绘制散点图,考察是否有线性趋势及可疑的异常点;

②估计回归系数;

③对总体回归系数或回归方程进行假设检验;

④列出回归方程,绘制回归直线;

⑤统计应用。

回归分析中决定系数R2

①定义:考察在Y的变异中,由X所引起的变异占多大的比重。 R2=SS回归/SS总

②取值在0-1之间(因SS回归<SS总)

③大小反映了自变量对回归效果的贡献,即在Y的总变异中回归关系所能解释的百分比。

④反映了回归模型的拟合效果,常作为拟合优度的指标。

⑤当X与Y均为随机变量时,决定系数R2等于相关系数(r)的平方。

第11章多重线性回归分析

μ=β0 +β1X1 + β2X2 +…+ βp X p

⑴β0:当所有自变量为0时反应变量Y的平均取值

⑵βi:(偏回归系数)方程中其他自变量不变时,Xi每增加(或减少)一个计量单位,反应变量Y平均改变βi 个单位。

⑶确定系数R2:反映回归方程的效果好坏。R2=SS回归/SS总说明自变量组X可以解释反应变量Y总变异的百分比。(增加自变量,R2只增不减)

⑷调整的确定系数R2ab =1 — MS残差/MS总(增加贡献很小的自变量,R2ab可能减小)

⑸复相关系数 R=确定系数开平方,表示随机变量Y与一组随机变量X之间线性相关的程度。

1. 多重线性回归分析的用途有哪些?

①定量地建立一个反应变量与多个解释变量之间的线性关系,

②筛选危险因素,

③通过较易测量的变量估计不易测量的变量,

④通过解释变量预测反应变量,

⑤通过反应变量控制解释变量。

4. 如何判断和处理多重共线性?

①如果自变量之间存在较强的相关,则存在多重共线性。

②通过分析自变量之间的相关系数、计算方差膨胀因子和容忍度等指标判断是否存在多重共线性。

③最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。

④也可采用主成分回归方法。

5. 如何判断、分析自变量间的交互作用?

答:基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义。

6. 多重线性回归模型的基本假定有哪些?如何判断资料是否满足这些假定?如果资料不满足假定条件,常用的处理方法有哪些?

多重线性回归的前提条件(基本假定)是线性、独立性、正态性和等方差性,可以借助残差分析等方法判断资料是否满足条件。如果资料不满足前提条件,可以采用变量变换、引入交互作用项和更换回归方程等方法处理。

7、哑变量的设置:将有序变量或无序多分类变量转换成为多个二分类变量的过程。个数为变量类别数减1。

第12章实验设计

科研设计的四项基本原则及其意义

①对照原则通过对照鉴别处理因素与非处理因素的差异;消除或减少实验误差

②均衡原则要求各处理组非实验因素的条件均衡一致,以消除非实验因素对实验的影响。

③随机原则抽样随机,分配随机,实验顺序随机,以减少系统误差。

④重复原则要求一定的样本量。重复实验、重复取样、重复测量

实验设计三要素

①处理因素

②受试对象

③实验效应(客观性、精准性、灵敏度、特异性)

实验设计类型

①单因素设计(完全随机设计):单组设计、成组设计、单因素多水平设计

配对设计、

②随机区组设计(配对设计的拓展)

③交叉设计(处理因素顺序)

④析因设计(K个因素与各水平组合)

⑤重复测量设计

第13章临床试验设计

1.临床试验通常分为哪四期,各期的主要目的分别是什么?

答:Ⅰ期临床试验:初步的临床药理学及人体安全性评价试验。观察人体对于新药的耐受程度和药代动力学,为制定给药方案提供依据。

Ⅱ期临床试验:治疗作用初步评价阶段。其目的是初步评价药物对目标适应证患者的治疗作用和安全性,也包括为Ⅲ期临床试验研究设计和给药剂量方案的确定提供依据。此阶段的研究设计可以根据具体的研究目的采用多种形式,包括随机盲法对照临床试验。治疗组不少于100例。

Ⅲ期临床试验:治疗作用确证阶段。其目的是进一步验证药物对目标适应证患者的治疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。试验一般应为具有足够样本量的随机盲法对照试验。治疗组不少于300例,对照组不少于100.

Ⅳ期临床试验:新药上市后由申请人进行的应用研究阶段。其目的是考察在广泛使用条件下的药物的疗效和不良反应、评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。

2.在临床试验开始之前,应做哪些必要的准备工作?

答:应当了解临床试验相关法规,了解临床试验相关指导原则,了解临床试验的伦理学原则,了解在哪里以及作哪些临床试验。

5. 临床试验设计的基本原则包括哪些?

答:临床试验必须遵循对照、随机、重复和均衡的原则。

6、统计检验类型

①差异性检验差别是否有统计学意义应确定检验水平

②非劣性检验是否不差于有效参比药应确定非劣差异下限

③等效性检验是否与有效参比药等效应确定等效界限

8、统计数据集

①意向性分析数据集未能观察全程的病历资料,用最后一次观察数据作为试验最终结果

②符合方案数据集符合方案,完成主要填写内容的病例,或服药量在80%~120%之间

③安全性数据集只服药一次并进行了至少一次安全性评估的患者。

第14章调查设计

调查按调查方法分为①普查②抽样调查③典型调查

调查问卷的评价

(1)效度评价反映调查对象真实情况的程度。

①表面效度字面上看能否反映调查目的。

②内容效度内容上看能否反映;是否包含足够条目反映。

③结构效度条目设置能否反映,

(2)信度评价同条件同对象重复测验结果的一致性

①重测信度不同时间点

②内部信度问卷内条目的相关程度

③测评者一致性不同测评者

调查设计类型

①横断面研究对同一时间点的各个因素的调查研究

优点:广泛探索多因素;得知疾病流行情况;若调查时间短,成本较低。

缺点:不能推断因果关系;只计算点患病率,不能计算发病率;不适合患病率很低的疾病。

②病例对照研究回顾性

优点:同时调查多个因素;节省人力物力;不存在医疗道德

缺点:不能获得因果关系;不能计算患病率及发病率;容易产生偏倚

③队列研究前瞻性

优点:可以估计发病和暴露因素的联系程度

缺点:费人力物力;每次只考察一个暴露因素;容易失访;难以实施盲法。

抽样方法

①单纯随机抽样:事先规定规则,将调查总体编号,然后借助抽签或随机数字抽样。估计误差简单,但编号并非易事。

②系统抽样:先将调查总体排序,随机抽一个单位为起点,然后依次每隔若干个单位抽取一个单位。简便和节省时间,但当总体呈某种趋势时,可能产生偏移。

③分层随机抽样:现将总体按主要特征(如年龄)分为若干层次,然后在隔层中进行随机抽样。抽样误差小,但操作麻烦。

④整群抽样:以群体为基本单位抽样。在大规模调查中,易于组织。

就抽样误差而言,4>1>2>3

⑤多阶段抽样:将整个抽样过程分成若干个阶段进行。

系统误差,也叫偏倚。常见的有选择性偏倚信息偏倚混杂偏倚。

第15章样本含量估计

样本含量估计的要素(条件)

①根据研究目的所建立检验假设。

②检验水准α,常取α=0.05。α越小,需要的n越大

③检验效能(1-β),常取β=0.2 。检验效能越高,需要的n越大。

④有关总体的一些信息。如,对于两样本均数比较,需知道两均数间差别δ、总体标准差σ。

2. 当假设检验的结果为“阴性”(P>0.05)时,对样本含量和检验功效进行复核有何意义?

答:当假设检验的结果为“阴性”(P>0.05)时,对样本含量和检验功效进行复核具有重要意义。通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。

第16章随机区组设计和析因设计资料的分析

1.随机区组设计与完全随机设计资料在设计和分析方面有何不同?

在设计上,与后者比,前者在设计阶段按照一定条件将受试对象配成区组,平衡了某些因素效应对处理因素效应的影响,更好地控制了其他因素对处理因素效应的影响,设计效率较高。

在分析上,随机区组设计资料的方差分析将总变异分解为3部分,将由区组因素导致的变异分离出来,使得误差更接近“随机误差”,假设检验的结果更敏感。

H如何写?请解释之。

2. 随机区组设计的Friedman检验,

答:各种处理的总体分布相同。Friedman检验的前提为在各区组内部变量值的秩次是随机的,因此由这些秩次算得各种处理总体的秩次值之和相等。

4.对于两因素的析因设计资料和随机区组设计资料,假定两个因素分别用A和B表示,可否先单独分析A因素,再单独分析B因素?为什么?

答:不可以。如果分别应用单因素的方法(方差分析方法、t检验或秩和检验等)分析A、B两因素,就会出现以下结果:①没有按照实验设计的方法选择分析资料,达不到设计时的目的,信息利用率低。②不能同时分析两个因素,即控制一个因素影响后分析另一个因素的实验效应。③对于析因设计资料,无法分析因素间的交互效应。

第17章重复测量设计和交叉设计资料

1. 交叉设计所收集的资料是否属于非独立资料?

答:交叉设计所收集的资料是属于非独立资料。

2. 能否从某个药物的交叉设计所观察资料的统计分析结果推断临床的实际疗效?

答:交叉设计的某个药物的效果平均是多阶段的平均疗效评价,而临床的实际疗效往往是针对某个阶段的疗效评价,所以有时交叉试验的评价结果与临床的实际疗效评价有一些差异。

3. 能否用析因设计的方差分析方法分析重复测量资料?为什么?

答:不能,因为重复测量的资料是不独立的,析因设计的方差分析要求资料是独立的。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

统计学实验心得体会分享

统计学实验心得体会分享 在两天的统计学实验学习中,加深了对统计数据知识的理解和掌握,同时也对Excel操作软件的应用,统计学实验心得体会。下面是我这次实验的一些心得和体会。 统计学(statistics)一门收集,整理,显示和分析统计数据的科学,目的是探索数据内在的数量规律性。从定义中不难看出,统计学是一门针对数据而展开探求的科学。在实验中,对数据的筛选和处理就成为了比较重要的内容和要求了。同时对数据的分析也离不开相关软件的支持。因此,Eexcel软件的安装与运行则变成了首要任务。 实验过程中,对Excel软件的安装因要求具体而变的相对简单。虽然大多数计算机都已内存此软件,但在实验中通过具体的操作亦可以提高自己的计算机操作水平。接下来的重头戏就是对统计数据的输入与分析了。按Excel对输入数据的要求将数据正确输入的过程并不轻松,既要细心又要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。因此,输入正确的数据也就成为了整个统计实验的基矗。 数据的输入固然重要,但如果没有分析的数据则是一点意义都没有。因此,统计数据的描述与分析也就成了关键的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分

析,抽样分析,方差分析,回归问题以及时间序列分析等则更具体和深刻的向我们揭示了统计数据的内在规律性。在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。 通过实验过程的进行,对统计学的有关知识点的复习也与之同步。在将课本知识与实验过程相结合的过程中,实验步骤的操作也变的得心应手。也给了我们一个启发,在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让我们的实验过程不在那么枯燥无谓。同时在实验的同步中亦可以反馈自己的知识薄弱环节,实现自己的全面提高。 本次实验是我大学生活中不可或缺的重要经历,其收获和意义可见一斑。首先,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼;其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。 在实验过程中还有些其它方面也让我学到了很多东西,知道统计工作是一项具有创造性的活动,要出一流成果,就必须要有专业的统计人才和认真严肃的工作态度。在实践的校对工作中,知道一丝不苟的真正内涵。 通过本次实验,不仅仅是掌握操作步骤完成实验任务而

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

贾俊平 统计学 总结

第一章导论 概念: 统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。 统计的分类: 描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。 推断统计:是研究如何利用样木数据进行推断总体特征。 数据: 1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类 2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 3.数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm,190cm,200cm 参数:描述总体特征。有总体均值(μ)、标准差()总体比例(T) 统计量:描述样本特征,样本标准差(s),样木比例(p) 统计方法 描述统计推断统计 参数估计假设检验

第二章 数据的搜集 1. 数据来源包括直接来源(一手数据)和间接来源(二手数据) 2. 抽样方式包括概率抽样与非概率抽样 3. 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都 有一定的机会被抽中。 4. 5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述 的是所有样本可能的结果与总体真值之间的平均差异。 统计数据的分类 按计量层次 分类的 数据 顺序的数据 数值型数 据 按时间状况 截 面 的 数 据 时序的 数据 按收集方法 观察的数 据 实验的数 据

6.抽样误差的大小与样本量的大小和总体的变异程度有关。 第三章数据的图表展示 计算机实训内容, 要求: 1.数据筛选,自动筛选 2.高级筛选, 3.数据排序 4.分类汇总-利用数据透视表 5.对比条形图 6.环形图 7.累计频数图 8.散点图 9.雷达图 等等 频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据 数据-数据透视表数据透视表 第四章数据的概括性度量

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

简单统计分析方法总结

简单统计分析方法总结 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后 对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统 计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验 结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有 统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结 果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。但实际过程中这一条是值得商榷的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

统计学重点、难点问题总结

1、品质标志和数量标志有什么区别 答:品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。 2、什么是统计指标统计指标和标志有什么区别和联系 答:统计指标是反映社会经济现象总体综合数量特征的科学概念或范畴。统计指标反映现象总体的数量特征;一个完整的统计指标应该由总体范围、时间、地点、指标数量和数值单位等内容构成。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 标志和指标的主要联系表现在:指标值往往由数量标志值汇总而来;在一定条件下,数量标志和指标存在着变换关系。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者的主要区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 3、统计普查有哪些主要特点和应用意义 答:普查是专门组织的、一般用来调查属性一定时点上社会经济现象数量的全面调查。普查的特点:(1)普查是一种不连续调查。因为普查的对象是时点现象,时点现象的数量在短期内往往变动不大,不需做连续登记。 (2)普查是全面调查。它比任何其它调查方法都更能掌握全面、系统的反映国情国力方面的基本统计资料。 (3)普查能解决全面统计报表不能解决的问题。因为普查所包括的单位、分组目录、指标内容比定期统计报表更广泛、更详细,所以能取得更详尽的全面资料。 (4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 4、抽样调查有哪些特点有哪些优越性 答:(1)抽样调查是一种非全面调查,但其目的是要通过对部分单位的调查结果推断总体的数量特征。 (2)抽样调查是按照随机原则从全部总体单位中来抽选调查单位。所谓随机原则就是总体中调查单位的确定完全由随机因素来决定,单位中选与不中选不受主观因素的影响,保证总体中每一个单位都有同等的中选可能性。抽样调查方式的优越性现在经济性、实效性。准确性和灵活性等方面。 抽样调查的作用:能够解决全面调查无法解决或解决困难的问题;可以补充和订正全面调查的结果;可以应用于生产过程中产品质量的检查和控制;可以用于对总体的某种假设进行检验。 5、统计分组可以进行哪些分类 答:根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志化分为若干性质不同而又有联系的几个部分,称为统计分组。 统计分组可以按分组的任务和作用、分组标志的多少以及分组标志的性质等方面来进行分类。 统计分组可以按其任务和作用的不同,分为类型分组、结果分组和分析分组。进行这些分组的目的,分别是化分社会经济类型、研究同类总体的结构和分析被研究现象总体诸标志之间的联系和依存关系。类型分组和结构分组的界限比较难区分,一般认为,现象总体按主要的品质标志分组,多属于类型分组,如社会产品按经济类型、按部门、按轻重工业分组;按数量标志分组多是结构分组。进行结构分组的现象总体相对来说同类较强。如全民所有制企业按产量计划完成程度、劳动生产率水平、职工人数、利税来分组。分析分组是为研究现象总体诸标志依存关系的分组。分析分组的分组标志称为原因标志,与原因标志对应的标志称为结果标志。原因标志多是数量标志,也运用品质标志;结果标志一定是数量标志,而且要求计算为相对数或平均数。 统计分组按分组标志的多少分为简单分组和复和分组。简单分组实际上就是各个组按一个标志形成的。而复制分组则是各个组按两个以上的标志形成的。

统计学学习心得体会

统计学个人心得 12级会计7班 3212005244 谢翠欣 在学习统计学之前,谈起统计我脑袋中就浮现出计数,一大堆枯燥的数字,还有一长串的数学计算式。在我眼中,统计学是一门非常枯燥非常单调的学科,它不像数学那样强调严密的推理和逻辑,而是仅仅需要搜集原始资料,套用数学公式而已,我甚至不是很喜欢这门课程。但是经过一个学期的学习,我对统计学有了全新的认识。我开始意识到统计学在学术研究中,在公司决策中,在国家制定方针政策时??在社会生活的各个方面都发挥着重要作用,我开始了解到统计学是一个理论联系实际的学科,非常具有实践性,统计的原始资料全部来源于实际生活。统计学也是一种成熟的学科,它有它独立而完备的理论体系,它是相当科学的,它是以数学作为它的基本工具,但它有比数学更有实际用途,它可以对生活中大量的无序的数据进行分析,找出它们的规律,从而为研究、决策提供基本的依据,它是其他学科的一切理论的基础和来源。 期末,老师布置了分组调查问题的任务,我们小组分工地完成了大学生男女婚恋观的差异,通过一整套的调查流程,从问卷设计、寻找答卷人、调查结果对比以及综合分析,带着问题去寻找答案并得出结论,是一件很意义的事情。 因为要考试,所以花几天时间,整体复习了一遍统计学,准确的来说是从第一页开始较为仔细的阅读了一遍《统计学》这本教科书。随后统计为我打开了另一扇窗,让我得以从不同的视角重新思考这门让我痛苦了一个学期的课程。至此统计学不再仅仅是一些无数抽象公式的代名词,而是一门理论联系实际,工作活动中不可或缺的一门重要科学。 总论和统计数据的内容比较简单,引出概念,复习以往学习过的知识。理论上来说假设检验与方差分析的内容要难于抽样估计。但是个人觉得《抽样估计的行文并不像假设检验》那么好理解。统计学这本书喜欢先向学生介绍很多概念和公式,再将公式引用到例子中来解决问题。然而在介绍公式的同时,学生往往不了解这些公式真正的意义和使用方法,单纯的死记硬背效率颇低。拿抽样估计来说,计算抽样平均误差的公式之多,方法之众,让同学们的脑袋混沌了好久。大家私下交流,混沌的原因在于不知道这些公式的来龙去脉,只将条件带入相应的公式计算答案的方法是以前没有经历过的,需要一段时间的适应过程。相关与回归分析同样吸引人。因为之前我片面的认为相关关系没有确切的规律可循,更不容说计算出事物的内在联系了。然而科学证明,不但相关系数可以计算出来,回归方程也可以用来做分析预测。我想起了一句话:任何学科脱离了统计都将不是科学。只有统计能仅凭现象就能分析归纳出事务的内在联系,给我们呈现出一个更明朗的世界。 时间序列分析在我看来是和我的专业---会计联系最紧密的知识。运用所学到的知识可以分析出公司销售额的各种增长情况,公司的销售额有什么样的季节变化规律,还能建立一个模型对未来的财务情况做出预测。 这么快一个学期统计学的学习就结束了,我才刚刚了解统计学,我知道统计学知识还能运用到店铺开设选址等等的问题上,这是我比较感兴趣的,所以我以后还要继续深入了解统计学,并且运用它服务生活。篇二:统计学学习感想 统计学学习感想 通过半个多学期的学习,我对统计学这门课程有了一定的了解,对学习这门课程也有了一定的感想。 首先,我谈谈我对这门课程的理解。 一)对统计学新的认识 在学习统计学之前,谈起统计我脑袋中就浮现出计数,一大堆枯燥的数字,还有一长串的数学计算式。在我眼中,统计学是一门非常枯燥非常单调的学科,它不像数学那样强调严密的推理和逻辑,而是仅仅需要搜集原始资料,套用数学公式而已,我甚至不是很喜欢这门

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

统计学重要考点总结

第一章导论 1.2、 描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计 方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 1.3、统计学据可以分成哪几种类型,各有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同,分为:观测数据、和实验数据。 观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 1.4 分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。 顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,它是由顺序尺度计量形成的。 数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进 行测量的结果,其结果表现为具体的数值。 第二章数据的搜集 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽 样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本

被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 第三章数据的图表搜集 3.4直方图和条形图有何区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积 表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度 与宽度都有意义; 直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。 3.6饼图和环形图的不同? 饼图只能显示一个样本或总体各部分所占比例。环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。 第四章习题答案 4.5简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值; 优点:不受极值的影响。 缺点:具有不唯一性;只有数据量较大时才有效果 中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。 平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。 优点:利用了所有数据信息;数据误差相互抵消,具有无偏性; 缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。 4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。

统计学知识点的总结

1、统计的含义 (1)统计工作:即统计实践,是指很据科学的方法从事统计设计、收集、整理、分析研究和提供各种统计资料和统计咨询意见的活动的总称。其成果是统计资料(原始调查资料和加工处理后的系统资料); (2)统计资料:即统计工作过程中所获得的各种有关数字资料以及与之相关的其他资料的总称。通常以统计表、统计图和统计报告的形式变现,用以反映社会经济现象的规模、水平、速度、结构和比例关系等信息的数字和文字资料; (3)统计科学:即统计理论,是指统计工作实践的理论概括和科学总结。 2、统计学 统计学:是一门搜集、整理、分析数据方法的科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 3、统计学的研究对象 统计学研究的对象是:社会经济现象总体的数量特征和数量关系。 其根本特征:在质与量的辩证统一中,研究大量社会经济现象总体的数量方面,反映社会现象发展变化的规律性在具体时间、地点和条件下的数量表现,揭示事物的本质、相互联系、变动规律和发展趋势。 4、统计学研究特点 数量性、总体性、具体性、社会性 5、统计工作的过程及基本职能 统计工作的过程:统计设计、统计调查、统计整理、统计分析(定性—定量—定性:循环往复) 统计设计:指根据统计研究对象的特点和研究的目的、任务,对统计工作的各个方面和各个环节的通盘考虑和安排,是统计认识过程的第一个阶段,即定性认识的阶段; 统计调查:指根据统计研究对象和目的要求,依据统计设计的内容、指标和指标体系的要求,有计划、有目的、有组织的收集原始资料的工作过程,即由定性到定量认识的阶段;统计整理:指根据统计研究的目的,将统计调查得到的原始资料和通过各种方法得到的次级资料进行科学的分类和汇总,使其条理化、系统化的工作过程,即为统计分析准备在一定程度上可以反映总体特征的统计资料; 统计分析:指在统计整理的基础上,根据研究的目的和任务,应用各种科学的统计方法,从静态和动态两个方面对研究对象的数量方面进行计算、分析研究,认识和揭示所研究对象的本质和规律性,做出科学的结论,进而提出建议和可预测性的意见的工作过程,即从定量到定性深入认识的阶段。 统计工作的基本职能:信息、咨询、监督 6、统计学研究的基本方法 大量观察法、统计分组法、综合指标法、时间数列分析法、指数法、抽样推断法、相关分析法。 7、统计学的基本概念 (1)总体:指客观存在的,有性质相同的许多个别事物组成的整体; (2)总体单位:指组成总体的许多性质相同的个别事物,简称单位/个体; (3)标志:用于说明总体单位特征的名称或概念,有数量标志和品质标志之分; (4)标志表现:标志特征在各单位的具体体现,数量标志表现为具体的数值,品质标志表现为对特征加以描述的文字; (5)统计指标:用于说明总体数量特征的名称或概念及数值:一个完整的统计指标包括指标名称、指标数值、指标计量单位、计算方法、指标所属的时间和空间等因素;

相关文档
相关文档 最新文档