当前位置：文档库 › 统计学复习重点

统计学复习重点

第一章绪论（重点）

1.统计实践的产生 P1.

2.我国最早的统计是对人口和土地的数字记载；在欧洲最早对居民人口和财产进行统计调查。P1.

3.统计学成为一门系统的科学，距今仅有300多年的历史。P2

4.统计学的萌芽时期：两大学派代表人物及其主要观点。P2-3

5.统计学的近代期：两大学派代表人物及其主要观点。P3

6.统计学的含义：包含三点内容，及三者之间的关系。（书中没有，自己总结）

7.统计学的研究对象及其特点：P5-6

8.统计学的性质：P6-7

9.统计学的研究方法：P7-8

10.统计总体的特点：3点P8-9

11.统计标志、标志表现

12.统计指标的概念及构成要素P10

13.统计指标的特点：P10-11（注意区分统计指标的特点与统计总体的特点）

14.统计指标与标志的区别和联系P12

15.变异、变量、标志、指标的区别（实际运用）

第二章统计调查（非重点）

1.统计调查的含义及其基本要求：P30-31

2.完整的统计调查方案包括的内容：P31-32或课堂讲义

3.调查项目必须坚持的原则：P32

4.调查表的两种形式：P32

5.统计报表的概念及其分类：P33-34

6.普查、抽样调查、重点调查、典型调查的概念、特点及各自的适用性：P34-38

第三章统计整理

1.统计整理及其原则：P56

2.统计整理的一般程序：关键在前两个步骤P57-58

3.统计分组的概念，达到的目标：组内同质性和组间差异性P58

4.统计分组的作用：三点（要理解）

5.统计分组的要求：P60

6.统计分组的关键：分组标志的选择

7.选择分组标志应当遵循的原则：P60-61

8.简单分组、复合分组、平行分组体系、复合分组体系的区别：P61-62

9.变量数列的编制：P64

10.统计分组的原则：不重不漏。对于离散型变量和连续型变量分组，相邻两组为了解决不重的问题，可以如何来做。

11.分配数列的表示方法：特别注意直方图和条形图的区别，以及次数分布图的绘制。

12.统计表的概念及其构成：P73

13.统计表的种类：P74

14.统计表的设计要求：P76

第四章统计特征值的计算

1.总量指标的概念、作用及其分类：P86-87

2.时期指标、时点指标的特点及区别P87

3.相对指标的概念及其种类P90-95（六种形式的计算方法，各种相对数的涵义，表示方式：有名数、无名数）

4.正确运用相对指标的原则：P95-96

5.平均指标的概念及其作用：P96

6.加权算术平均数的大小取决于哪两个因素：P98

7.算术平均数、加权算术平均数、调和平均数、加权调和平均数的特点及应用

8.应用平均指标的基本原则：P109

9.标志变异指标的概念及其作用：P109-110

10.平均差、标准差、变异系数的计算公式

第五章抽样推断

1.抽样推断的概念、特点及作用：P128-129

2.影响抽样误差的因素：P135

3.区间估计必须具备的要素：P140

4.抽样估计的计算

5.概率抽样的组织形式：几种常见的抽样组织形式

第六章时间数列

1.时间数列的组成及表现形式：P151

2.编制时间数列应该注意的问题：P152-153

3.序时平均数与算术平均数的区别：见讲义

4.时间数列的水平指标分析：发展水平、平均发展水平、增减量、平均增减量的计算：P153-163

第七章统计指数

1.统计指数的概念，广义的统计指数和狭义的统计指数：P193

2.指数的性质：P194

3.统计指数的作用：P194-195

4.统计指数的分类：P195-196

5.综合指数的编制——计算题

6.综合指数法的特点：P200

7.平均指数的计算

8.指数体系和因素分析：P203

第八章相关与回归分析

1.现象之间依存关系的两种类型：P226

2.相关关系的类型：P227-228

3.相关系数的计算公式：P230

4.相关分析与回归分析的区别：P233

5.线性回归分析的计算公式：P234

计算题：

1.某企业三个车间生产同种产品，2006年上半年有关生产资料如下：

车间实际产量(台) 完成计划(％) 实际优质品率(％)

甲1000 110 90

乙1500 100 93

丙2000 70 95

要求：（1）计算该企业产品计划完成百分比；

（2）计算该企业产品的实际优质品率。

参考答案：

（1）

100015002000

100%85.45%

100015002000

110%100%70%

实际完成产量

计划完成百分比＝＝

计划完成产量

（2）

10000.9015000.9320000.95

100%93.22%

100015002000

?+?+?

实际优质品

实际优质品率＝＝

实际产量

2.某金融机构近10年来的年利率有4年为3﹪，2年为5﹪，2年为8﹪，1年为10﹪，1年为15﹪。要求：（1）按复利计算平均年利率。

（2）若按单利计算，求平均年利率。

参考答案：

（1）按复利计算：

()()()

()4

4211010.0310.0510.151.1255 1.1025 1.164 1.1 1.151

G G X X +++=+++=????=- 平均年利率

（2）按单利计算：

()()0.0340.151

411.0910.910Xf V V X f V V V

??++??=

=?++?=

=∑∑ ﹪

3. 从某市500户个体饮食店不重复抽样的方式抽取10%进行月营业额调查，样本资料如下：

月均营业额（万元）

户数 10以下 10——20 20——30 30——40 40——50 50以上 3 5 15 20 5 2 合计

试计算：（1）月营业额的抽样标准误。

（2）在95%的概率保证下，全体个体饮食店月均营业额的置信区间。（3）以同样的概率保证，全体个体饮食店月营业总额的置信区间。

参考答案：2

()500,50,30,125i i

x f x x f N n x s

-===

=∑∑∑∑

（1）2(1) 1.5x s n

n N

μ=-=;

（2）96.1=t

，[

])

(:x t x X σ±，经计算得在95%的概率保证下，全体个体饮食店月均营业额的置信区间为[]27.06,32.94;

（3）全体个体饮食店月均营业总额的置信区间为[]:13530,16470NX

。

4.对某企业甲乙两工人当日产品中各抽取10件产品进行质量检查，资料如下：

单位（mm ）零件数（件）

甲工人乙工人 9.3以下 9.3~9.5 9.5~9.7 9.7~9.9 9.9~10.1 1 2 2 3 2 1 2 3 3 1 合计

要求：计算标准差与变异系数，比较甲乙两工人谁生产的零件质量较稳定。

参考答案：

9.219.429.629.831029.66()10()0.25()

0.25

100% 2.59%9.66

xf x mm f x x f mm f

V x σσσ?+?+?+?+?===-=

===

?=∑∑

∑∑甲

甲

甲甲

9.219.429.639.831019.62()10()0.23()0.23

100% 2.39%9.62

xf x mm f x x f mm f

V x σσσ?+?+?+?+?===-===

?=∑∑

∑∑乙

乙

乙乙

因为V V σσ>乙甲，所以乙工人的零件质量比较稳定。

5.掌握简单算术平均数、加权算术平均数、调和平均数的计算方法。如：某年某月甲、乙两市场某商品价格、销售量和销售额资料如下：

商品品种价格（元/件）

甲市场销售量

乙市场销售额（元）

甲 105 700 126000 乙 120 900 96000 丙 137 1100 95900 合计

－

2700

317900

试分别计算该商品在两个市场上的平均价格。参考答案：

在甲市场上的平均价格：

7001059001201100137

123.04(/)2700

xf x f

?+?+?=

=∑∑元件

在乙市场上的平均价格为：

317900317900

117.74(/)126009600959002700

105120137

m x m x

==++∑∑元件

6.某电子产品使用寿命在3000小时以下为次品，现在用简单随机抽样方法，从5000个产品中抽取100个对其使用寿命进行测试。其结果如下：

电子产品使用寿命表

使用寿命（小时）

产品个数

3000以下 3000—4000 4000—5000 5000以上

2 30 50 18

合计

100

根据以上资料，要求：

（1）按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。（2）按重复抽样和不重复抽样计算该产品次品率的抽样平均误差。

（3）以95%的概率保证程度，对该产品的平均使用寿命和次品率进行区间估计。参考答案：

434000

4340100

xf x f

=∑∑（个/小时）

()

53440000

731.03100

x x f

σ-==

=∑∑（个/小时）

（1）重复抽样：731.03

73.1010

u n

=（个/小时）

不重复抽样：2

534400100

(1)(1)72.371005000

x n u n

N σ=

=-=（个/小时）

（2）100%2%?=2

100

(1)2%98%

1.4%100

(1)2%98%100

(1)(1) 1.39%1005000

p p p p u n p p n u n N -?===-?=

-=-=重复抽样：不重复抽样：

（3）在95%的概率保证程度下，t=1.96

重复抽样：该产品使用寿命的区间是：[4340-73.10,4340+73.10]，即[4266.9,4413.1] 该产品次品率的区间是：[2%-1.4%,2%+1.4%]，即[0.6%,3.4%]

不重复抽样：该产品使用寿命的区间是：[4340-72.37,4340+72.37]，即[4267.63,4412.37] 该产品次品率的区间是：[2%-1.39%,2%+1.39%]，即[0.61%,3.39%]

7.某企业集团公司2005年第三季度职工人数及产值资料如下表所示：

指标单位 7月 8月 9月 10月销售产值万元 5000 5200 5500 －月初人数

人

5640

5660

5680

5600

要求：（1）计算第三季度的月平均劳动生产率（2）计算第三季度的劳动生产率参考答案：（1）第三季度的月平均劳动率

1231235000520055001570033

56405600

56605680169602

222133n n a a a a a n b b b b b n +++++=

++++++

===- 157000.925716960

a C

b =

==（万元/人）（2）第三季度的劳动生产率为：

500052005500

27771.23/169603

++=元人

8.掌握时间数列中，时期数列和时点数列的判断（连续和间断），分别采用不同的计算方法。书中P191思考题6-10。

某厂一车间某年上半年6个月产量及月末人数资料如下：

月份 1 2 3 4 5 6 产量（件） 5000 5040 5050 5080 5070 5090 月末工人数（人）

816

782

794

760

766

760

又知该年1月初工人数为824人，要求：计算该年第一季度、第二季度和上半年平均月劳动生产率。参考答案：

产量是时期指标，采用简单平均法。（1）1

500050405050

5030()3

a ++=

=件

工人数是时点指标，采用首末折半法。

1824794

8167822

2802.33803()3

b +++

==≈人

第一季度的劳动生产率为：

1115030 6.26803a c b =

== （2）2

508050705090

5080()3

a ++=

=件

2794760

7607662

2767.67768()3

b +++

==≈人第二季度的劳动生产率为： 22

25080 6.61768

a c

b === 500050405050508050705090

50556

+++++=

=（件）

824760

8167827947607662

27856

b ++++++

==（人）所以上半年平均月劳动生产率为： 5055 6.44785

a c

b =

==（件/人）

9.指数习题见书上223页第6与第7题，此为两类指数的常见习题。另外补充两题：书中第7题参考答案：销售量指数：00

100

1.151000000.9100000 1.0560000

10000010000060000

q q

K q p q p K q p

q p

?+?+?=

++∑∑∑∑

1150009000063000268000

1.031260000260000

++=

262400

11050009500062400

0.913 1.05560.9905

p p

p q p q K p q p q

===

∑∑∑∑销售价格指数：

2624000.979268000.18=

= 1100000011111

()()q p

p q p q K q p q p p q p q K -=-+-∑∑∑∑∑∑绝对值变动：

80005600.182399.82=-=（元）

（1）某商场销售资料如下表：

产品实际销售额（万元）价格降低率（%）

基期报告期甲 117 80 10

乙 38 20 5 丙

187 250

要求： (1)计算商品价格总指数及由于价格降低而减少商品销售额；

(2)计算商品销售量指数及由于销售量变化对商品销售变化的影响额。（计算结果保留两位小数。）参考答案（典型的指数变形题）： (1)11

8020250

86.62%180202500.90.950.85

p q p q

K p q p q

++=

===

=++∑∑∑∑销售价格指数：

110111111

350404.059254.06p

p q p q p q p q K -=-=-=-∑∑∑∑

（万元）

所以，由于价格降低而减少的商品销售额为54.06万元（2）销售量指数：

8020250

102.3411738187

p q K p q

++=

=++∑∑总％

102.34%

118.15%86.62%

q p K K K =

==总或者：11

100

8020250404.05920.90.950.85118.15%11738187342

p q K q p K q p

q p

++=

==++∑∑∑∑ 所以，由于价格降低而增加了销售量，从而增加的销售额为62.06万元。（2）某工厂产量和价格资料如下表：

产品单位产量

出厂价格（元）基期报告期基期报告期甲

吨 2000 2400 100 120 乙台 1000 1300 50 60 丙

吨

150

2000 2400

计算：(1)三种产品的总价值指数；

(2)三种产品报告期总产值增(减)的绝对额;

(3)从相对数和绝对数两方面分析产量的变动对总产值变动的影响和价格变动对总产值的影响。参考答案（典型的综合指数计算题）： (1)11

24001201300601502400726000

207.43%2000100100050502000350000

p q

K p q

?+?+?=

==?+?+?∑∑总

(2)

726000350000376000p q p q

-=-=∑∑（元）

（3）01

24001001300501502000605000

172.85%2000100100050502000350000

p q K p q

?+?+?=

==?+?+?∑∑

0011

605000350000255000

24001201300601502400726000120%24001001300501502000605000

726000605000121000

p q p q p q K p q p q p q -=-=?+?+?=

===?+?+?-=-=∑∑∑∑∑∑（元）（元）

010********%172.85%207.43%

()()255000121000376000p q K K K p q p q

p q p q p q p q =?=?=-=-+-=+=∑∑∑∑∑∑总（元）

10.某企业某种产品产量与单位成本资料如下：

月份产量（千件）

单位成本（元/件）

1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6

要求：①计算相关系数，说明相关程度；

②确定单位成本对产量的直线回归方程，指出产量每增加1000件时，单位成本平均下降多少元？ ③如果单位成本为70元时，产量应为多少？

参考答案： ②2

0.0018()

n xy x y b n x x -=

=--∑∑∑∑∑

a=77.36

所以回归方程是：Y=77.36-0.0018x

回归系数表明：产量每增加1000件时，单位成本下降1.82元。 x=6000元时，Y=66.45（元/件）

11.已知：n ＝6，ΣX ＝21，ΣY ＝426，ΣX 2

＝79，ΣY 2

＝30268，ΣXY ＝1481。要求计算：（1）直线回归方程；（2）相关系数；参考答案：

6148121426

1.82()6792121

n xy x y b n x x -?-?=

=--?-?∑∑∑∑∑

426211.8277.376

y x a b n

-=+?=∑∑

所以回归方程是：Y=77.37-1.82x 相关系数：2222

0.9166

()()n xy x y n x x n y y γ

--==

=---∑∑∑∑∑∑∑

应用统计学复习重点

应用统计学定义：统计学是研究数据收集、整理、显示与分析方法(或公式)的科学。目的是探索数据内在数量规律性，以达到对客观事物总体的科学认识。 1、参数(parameter)：指用于说明总体的指标。均值—μ, 标准差—σ,方差—σ2,率—P 2、统计量(statistics)：指用于说明样本的指标。均值—。标准差— s。方差— s2 ，率—p 数据的计量尺度 1列名尺度nominal scale （1）定义：按事物的某种属性对事物进行平行分类或分组。划分的各类别之间无大小或优劣之分，且次序可以改变。（2）适用：取值只能大体进行平行分类的品质型标志（变量）。（3）记录方式：变量名称：类别名罗列或用无意义数字表示。例：性别：男/ 女性别：（1）男（2）女 2顺序尺度ordinal scale （1）定义：按事物的某种属性对事物进行分类或分组基础上，再将类别等级由大到小或由小到大排序。（2）适用：取值可以进行分类且各类别具有等级差异的品质型标志（变量）。（3）记录方式：品质变量名：类别名序号由大到小或由小到大排列。例：文化程度（1）文盲（2）小学（3）初中（4）高中以上 3间隔尺度interval scale （1）定义：选定一个测量单位，对数值变量在分类排序基础上测量其间距（差距）。测量出的数值有加、减意义，无乘除意义。（2）适用：可用数值记录其值而无比率意义的数值型标志。（3）记录形式：数值变量名：________ 例：语文成绩：________ **表述语：甲(60分)比乙(30分)高30分 4比例尺度ratio scale （1）定义：选定一个测量单位，对数值型标志（变量）在测量间距基础上，测量其比率。（2）适用：可用数值记录其值且有比率意义的数值型变量。（3）记录形式：

统计学期末以及考研复习知识点内容详细

统计学知识点第一章绪论 1、今天，“统计”一词有三种含义： ⒈统计工作：搜集、整理和分析统计数据的活动。 ⒉统计数据：统计工作的成果。 ⒊统计学：指导统计工作的理论。如数理统计学，社会统计学，经济统计学，应用统计学等。统计三个含义的关系十分密切：统计工作与统计数据是过程与成果的关系；统计工作与统计学是实践与理论的关系。 2、第一部统计学著作是英国人威廉·配第(1623—1687)的《政治算术》(1690)一书。 3、统计学是一门搜集、整理、显示和分析统计数据的科学，其目的是探索数据内在的数量规律性。 4、统计工作全过程一般可以划分为四个环节：统计设计、统计调查、统计整理、统计分析 5．统计的基本方法大量观察法、综合分析法（整理、分析）、归纳推断法（分析） 6、统计学与其他学科的关系 (一)统计学与数学的关系区别：首先，数学研究抽象的数，统计学则研究具体事物的数量；其次，数学使用纯粹的演绎方法，而统计学则使用演绎与归纳相结合的逻辑方法。

(二)统计学与其他学科的关系凡涉及处理实质性数据的学科都要以统计方法为工具。可以说，统计学是其他学科的工具。第二章调查与整理 1、目前，数据的计量尺度由粗略(低级)到精确(高级)分为四个层次，即列名尺度、顺序尺度、定距尺度和定比尺度。 1．列名尺度：按照事物的某种属性对其进行平行的分类。例如，人按性别分为男、女，……。该尺度的数据不能比较大小、优劣。 2．顺序尺度：对事物之间等级差或顺序差别的一种测度。例如，考试成绩可分为优、良、中、……。该尺度的数据能比较优劣，不能进行数学运算。 3．定距尺度：对事物之间等级差或顺序差别较精确地定量测度。如考试成绩的95 分、86 分、……；天气温度的50C、00C、－50C、……。该尺度的“0”表示一个水平。该尺度的数据能进行加、减运算。 4．定比尺度：用来表明数值中存在绝对零点状况下数量特征的描述尺度。例如，企业利润、产品数量等。该尺度的“0”表示“没有”或“不存在”。该尺度的数据能进行加、减、乘、除运算。 2、数据的类型 1．定性数据。也称品质数据，由列名尺度或顺序尺度计量形成，说明事物品质特征，通常用文字描述。

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

统计学期末复习-公式汇总

统计报表专门调查普查抽样调查典型调查重点调查按调查的组织方式不同分为按调查时间是否连续分为按调查单位的范围大小分为全面调查非全面调查一次性调查经常性调查统计学复习第一章 1.“统计”的三个涵义：统计工作、统计资料、统计学 2.三者之间的关系：统计工作和统计资料是工作与工作成果的关系；统计资料和统计学是实践与理论的关系 3.统计学的特点：数量性，总体性，具体性，社会性（广泛性） 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分：统计总体是客观存在的，在同一性质基础上结合起来的许多个别单位的整体，构成总体的这些个别单位称为总体单位。（总体或总体单位的区分不是固定的：同一个研究对象，在一种情况下是总体，在另一种情况下可能成了总体单位。） 6.标志：总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征，不能用数值来表示。如：性别、职业、血型色彩 B 数量标志—标志总体单位量的特征，可以用数值来表示。如：年龄、工资额、身高指标：反映社会经济现象总体数量特征的概念及其数值。指标名称体现事物质的规定性，指标数值体现事物量的规定性第二章 1.统计调查种类 2.统计调查方案包括六项基本内容： 1）确定调查目的；（为什么调查） 2）确定调查对象与调查单位；（向谁调查）调查对象——社会现象的总体调查单位——调查标志的承担者（总体单位）填报单位——报告调查内容，提交统计资料 3）确定调查项目、拟定调查表格；（调查什么） 4）确定调查时间和调查期限 5）制定调查的组织实施计划； 6）选择调查方法。

应用统计学试题和复习资料分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为12.6元，标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=0.9545）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额95.45%的置信区间为（11.8，13.4）附： 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--=)(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为：y =111.314+0.567x ② 计算判定系数： 22 212 2 ()0.5671080 0.884392.8 () x x R y y β-?= ==-∑∑

统计学重点学习的知识点重点学习的全归纳全面准确.doc

统计学知识点汇总一、统计学统计学是一门关于数据资料的收集、整理、分析和推断的科学。二、统计学的产生与发展（ 1）政治算术学派最早的统计学源于17 世纪英国。其代表人物是威廉·配第，代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张，为统计学的发展开辟了广阔的前景。其被称为“无统计学之名，有统计学之实”。（ 2）记述学派亦称国势学派，创始人和代表人物是德国康令和阿亨瓦尔，主要使用文字记述方法对国情国力进行研究，其学科内容与现代统计学有较大差别。因此被称为“有统计学之名，无统计学之实”。（3）社会统计学派创始人和代表人物，德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学，认为统计学的研究对象是社会现象，目的在于明确社会现象内部的联系联系和相互关系。（ 4）数理统计学派创始人是比利时统计学家凯特勒，他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究，其认为统计学是一门通用的方法论科学。从19 世纪中叶到 20 世纪中叶，数理统计学得到迅速发展。到 20 世纪中期，数理统计学的基本框架已经形成，数理统计学派成为英美等国统计学界的主流。三、统计的特点（1）数量性：社会经济统计的认识对象是社会经济现象的数量方面，包括现象的数量表现、现象之

间的数量关系和质量互变的数量界限。（ 2）总体性：社会经济统计的认识对象是社会经济现象的总体的数量方面。例如，国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。（ 3）具体性：社会经济统计的认识对象是具体事物的数量方面，而不是抽象的量。这是统计与数学的区别。（ 4）社会性：社会经济现象是人类有意识的社会活动，是人类社会活动的条件、过程和结果，社会经济统计以社会经济现象作为研究对象，自然具有明显的社会性。四、统计工作过程（ 1）统计设计根据所要研究问题的性质，在有关学科理论的指导下，制定统计指标、指标体系和统计分类，给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。（2）收集数据统计数据的收集有两种基本方法，实验法和调查法。（3）整理与分析描述统计是指对采集的数据进行登记、审核、整理、归类，在此基础上进一步计算出各种能反映总体数量特征的综合指标，并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。推断统计是在对样本数据进行描述的基础上，利用一定的方法根据样本数据去估计或检验总体的数量特征。（ 4）统计资料的积累、开发与应用

(完整word版)医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%，若已知4月份产量为1000，那么1月份的产量为（A ）。 A．909.09 B．976.45 C．968.73 D．1032.28 2.以下各项属于品质标志的有（B ）。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量（ C）。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断，不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况，总体单位是（ B）。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中，调查单位是（D ）。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品，欲了解该产品在市场上的受欢迎程度，公司派人到各商场、超市随机调查了200 名顾客。该公司采用的调查方法是（C ）。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关，那么，在质量检验时最合适采用的调查组织方式是（ D）。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后，处于每组两端的数值叫（C ）。 A. 组距

C. 组限 D. 组中值 9．统计分组的核心问题是（A ）。 A．选择分组的标志 B．划分各组界限 C．区分事物的性质 D．对分组资料再分组 10. 在分组的情况下，总体平均指标数值的大小（C ）。 A. 只受各组变量值水平的影响，与各组单位数无关 B. 只受各组单位数的影响，与各组变量值水平无关 C. 既受各组变量值水平的影响，又与各组次数有关 D. 既不受各组变量值水平的影响，也部受各组次数的影响 11. 在组距数列中，用组中值作为计算算术平均数直接依据的假定条件是（D ）。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的（B ）。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差（ D）。 A．既可以避免，也可以控制 B. 既不可以避免，也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为（ C）。 A. 增（减）量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为（ C）。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中，加权算术平均指数所用权数是（D ）。

医学统计学考试重点

考试题型：名词解释10个选择20个填空题20个简答4-5个讨论分析1-2题计算1-2题绪论 2选1 总体：总体（population）指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 3选1 小概率事件：我们把概率很接近于0（即在大量重复试验中出现的频率非常低）的事件称为小概率事件 P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。统计学中，一般认为等于或小于0.05或0.01的概率为小概率。资料的类型（3选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 2选1 抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

统计学期末复习重点

统计总体：统计总体是根据一定目的确定的所要研究事物的全体，它是客观存在，并在某一相同性质基础上结合起来的由许多个别事物组成的整体，简称总体。样本：是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。算术平均数：算术平均数是统计中最基本、最常用的一种平均数，它的基本计算形式是用总体的单位总数去除总体的标志总量。调和平均数：是根据变量值的倒数计算的，是变量值倒数的算术平均数的倒数，也叫倒数平均数。简单分组：是指对所研究的总体按一个标志进行分组。复合分组：复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。结构相对指标：结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标，也叫比重指标。强度相对指标：是指两个性质不同，但有一定联系的总量指标数值之比。类型抽样：又称分类抽样或分层抽样，它是先将总体按某个主要标志进行分组（或分类），再按随机原则从各组（类）中抽取样本单位的一种抽样方式。机械抽样：它是将总体各单位按某一标志顺序排列，然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。综合指数：凡是一个总量指标可以分解为两个或两个以上的因素指标时，为观察某个因素指标的变动情况，将其他因素指标固定下来计算出的指数称为综合指数。平均指数：平均指数法是以个体指数为基础来计算总指数，根据选用的权数不同，平均指数法可以进一步分为加权算术平均法，加权调和平均法，固定权数加权平均法。相关关系：是指现象之间客观存在的，在数量变化上受随机因素的影响，非确定性的相互依存关系。回归分析：现象之间的相关关系，虽然不是严格的函数关系，但现象之间的一般关系值，可以通过函数关系的近似表达式来反映，这种表达式根据相关现象的实际对应资料，运用数学的方法来建立，这类数学方法称为回归分析。统计调查：就是根据统计研究的目的、要求和任务，运用各种科学的调查方法，有计划、有组织的搜集有关现象的各个单位的资料，对客观事实进行登记，取得真实可靠的调查资料的活动过程。统计指数：广义指数泛指社会经济现象数量变动的比较指标，及用来表明同类现象在不同空间、不同时间，实际与计划对比变动情况的相对数。狭义指数仅指反应不能直接想家的复杂社会经济现象在数量上综合变动情况的相对数。简单随机抽样：简单随机抽样也叫纯随机抽样，它对总体单位不做任何分类排队，而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。季节分析的含义：是指某些现象由于自然因素和社会条件的影响在一年之内比较有规律的变动。总量指标：是指反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。相对指标：是指说明现象之间数量对比关系的指标，用两个或两个以上有联系的指标数值对比来求得，其结果表现为相对数，故也将相对指标称为相对数。平均指标：是同类社会经济现象总体内，各单位某一数量标志在一定时间、地点和条件下，数量差异抽象化的代表性水平指标，其数值表现为平均数。 1计算运用总量指标的原则。（1）在计算实物指标时，应注意现象的同类性（2）统计总量指标时要有明确的统计含义和合理的统计方法

《应用统计学》复习题库48832

第一章思考题及练习题（一）填空题 1．统计工作与统计资料的关系是和的关系。 2．统计工作与统计学的关系是和的关系。 3．统计活动具有. . .和的职能。 4．统计指标反映的是的数量特征，数量标志反映的是的数量特征。5．在人口总体中，个体是“”，“文化程度”是标志。 6．统计研究过程的各个阶段，运用着各种专门的方法，如大量观察法. .综合指标法.和统计推断法等。 7．统计标志是总体中各个体所共同具有的属性或特征的名称。它分为和两种。 8．要了解一个企业的产品质量情况，总体是.个体是。9．性别是标志，标志表现则具体为或两种结果。 10．一件商品的价格在标志分类上属于。 11．一项完整的统计指标应该由. .. . 和等构成。 12．统计指标按所反映的数量特点不同，可以分为和。 13．反映社会经济现象相对水平或工作质量的指标称为指标。 14.统计活动过程通常被划分为. 和三个阶段。 15．经过余年的发展，形成了今天的统计学。 16．古典统计学时期有两大学派，它们分别是和。 17．《关于死之表的自然和政治观察》一书的作者是，他第一次编制了“生命表”。 18. 提出了著名的误差理论和“平均人”思想。 19.统计研究的数量性是指通过数来反映事物的量的.量的.量的和量的。 20.统计学包括和两部分内容。 21.总体中所包含的个体数量的多少称为；样本中所包含的个体数量的多少称为。 22.总体中的一个组或类，可被称为一个研究域或。 23.从总体中随机抽取的一部分个体所组成的集合称为。 24.统计理论与方法，事实上就是关于的理论和方法。 25.总体的三大特征是. 和。 26.总体的差异性要求体现在至少具有一个用以说明个体特征的。 27.企业性质标志适用的测定尺度是，产品质量等级标志适用的测定尺度是，企业利润标志适用的测定尺度是，企业产量标志适用的测定尺度是。 28.可变的数量标志的抽象化称为。它按其所受影响因素不同，可分为和两种，按其数值的变化是否连续出现，可分为和两种。 29.个体是的承担者。 30.统计指标按其反映现象的时间状态不同，可以分为和两种。 31.若干互有联系的统计指标组成的有机整体称为，其中一个很重要的反映国民经济和社会发展状况的基本统计指标体系是。 32. 统计研究的一大任务就是要用的样本指标值去推断的总体指标值。（二）单项选择题 1.社会经济统计的研究对象是（）。 A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量方面 D.社会经济统计认识过程的规律和方法 2.某城市进行工业企业未安装设备普查，个体是（）。

应用统计学复习试题

应用统计学复习题一简述 1．统计调查的方法有那几种答：三种主要调查方式：普查，抽样调查，统计报表。实际中有时也用到重点调查和典型调查。 2.表示数据分散程度的特征数有那几种答：全距（又称极差），方差和标准差，交替标志的平均数和标准差，变异系数，标准分数3为什么对总体均值进行估计时，样本容量越大，估计越精确答：因为总体是所要认识的研究对象的全体，它是具有某种共同性质或特征的许多单位的集合体．总体的单位数通常用Ｎ来表示，Ｎ总是很大的数．样本是总体的一部分，它是从总体中随机抽取出来、代表总体的那部分单位的集合体．样本的单位数称为样本容量，通常用ｎ表示。样本容量n越大，就越接近总体单位数N，样本均值就越接近总体均值，对总体均值进行估计时，估计越精确。 4.区间估计与点估计的结果有何不同答：点估计是使用估计量的单一值作为总体参数的估计值；区间估计是指定估计量的一个取值范围都为总体参数的估计。 5.在统计假设检验中，如果轻易拒绝了原假设会造成严重后果时，应取显著性水平较大还是较小，为什么答：取显著性水平较小，因为如果轻易拒绝了原假设会造成严重后果，那就说明在统计假设检验中，拒绝原假设的概率要小，而假设检验中拒绝原假设的概率正是事先选定的显著性水平α 6.简述算术平均数、几何平均数、调和平均数的适用范围。答：几何平均数主要适用于比率的平均。一般地说，如果待平均的变量x与另外两个变量f 和m 有fx=m 的关系时，若取f为权数，应当采用算术平均方法；若取m 为权数，应当采用调和平均方法。 7.对总体均值的假设检验中，如何通过确定样本容量大小以控制两类错误答：要控制两类错误就要减小误差，也就是提高精确性，决定样本大小的影响因素主要有：（1）总体方差σ2的大小．总体方差大，抽样误差大，则应多抽一些样本容量．问题是实际工作中我们往往不知道总体方差，因而必须作试验性调查，或以过去的历史资料作参考．（2）可靠性程度的高低．要求可靠性越高，所必需的样本容量就越大．（3）允许误差的范围．这主要由研究目的而定．若要求推断比较精确，允许误差范围应该小一些，随之抽取的样本单位数就要多一些．可用最大允许抽样误差e 来表示区间估计的准确程度，其中 /2 e Z α = 对于无限总体， 22 /2 2 Z n e α σ = ；对于有限总体， 2 22 2 /2 n e Z N α σ σ = + ，

预防医学考试重点完整最新版

预防医学医学统计学第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异：由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。总体：总体（population）指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。样本特性代表性随机性可靠性可比性 3选1 小概率事件：我们把概率很接近于0（即在大量中出现的频率非常低）的事件称为小概率事件。 P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。统计学中，一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型（3选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 3选1 抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。随机测量误差:在收集原始资料时，仪器由于各种偶然因素造成同一对象多次测定的结果不一致。统计的步骤（考填空题，四个空）医学统计工作的内容１．实验设计：设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环，是今后工作应遵循的依据。２．收集资料：应采取措施使能取得准确可靠的原始数据。３．整理资料：简化数据，使其系统化、条理化，便于进一步分析计算。４．分析资料：计算有关指标，反映事物的综合特征，阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。实验设计的基本原则（考填空题，三个空）随机化原则、对照的原则（对照的类型，对照的设置）、重复的原则。对照的类型空白对照实验对照标准对照自身对照相互对照历史对照安慰剂对照 2选1 参数：参数（ｐａｒａｍａｔｅｒ）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。统计量：统计量（ｓｔａｔｉｓｔｉｃ）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。完全随机设计常用的几种实验设计方法：配对设计和完全随机设计（名解2选1）完全随机设计：完全随机设计仅涉及一个处理因素（但可为多水平），故又称单因素（one-way）设计。它是将受试对象按随机化的方法分配到各个处理组中，观察实验效应，临床试验中的随机对照试验也属于此类设计。配对设计：是将受试对象按一定条件配成对子，再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。第二章集中趋势的统计描述频数表的制作步骤以及频数分布表的用途（问答题）频数分布表的编制步骤：例：某市1982年50名7岁男童的身高(cm)资料如下，试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

统计学期末复习重点知识

P11 1.3统计数据可以分为哪几种类型？不同类型的数据各有什么特点？答：①按照所采用的计量尺度不同，可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据和顺序数据说明的是事物的品质特征，通常是用文字来表述的，其结果均表现为类别，因此统称定性数据或品质数据。数值型数据说明的是现象的数量特征，通常是用数值来表现，因此也可称为定量数据或数量数据。 ②按照统计数据的收集方法，可以将统计数据分为观测数据和实验数据。观测数据是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据则是在实验室中控制对象而收集到的数据。 ③按照被描述的现象与时间的关系，可以将统计数据分为截面数据和时间序列数据。截面数据通常是在不同的空间获得的，用于描述现象在某一时刻的变化情况。时间序列数据是按时间顺序收集到的，用于描述现象随时间变化的情况。 1.5举例说明总体,样本、参数,统计量变量这几个概念总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命，这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个，这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄，“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄，样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的，这销售额就是变量。 P40 2.2比较概率抽样和非概率抽样的特点，举例说明什么情况下适合采用概率抽样？什么情况下适合非概率抽样？答：概率抽样的特点: ①抽样时是按一定的概率以随机原则抽取样本。 ②每个单位被抽中的概率是已知的，或是可以计算出来的。 ③当用样本对总体目标量进行估计时，要考虑到每个样本单位被抽中的概率。非概率抽样的特点：操作简便，时效快，成本低，而且对于抽样中的统计学专业技术要求不高。非概率抽样适合探索性的研究，调查的结果用于发现问题，为更深入的数量分析提供准备。同时也适合市场调查中的概念测试，如产品包装测试、广告测试等。概率抽样适合调查的目标是用样本的调查结果对总体相应的参数进行估计，并计算估计的误差，得到总体参数的置信区间。 P109

应用统计学公式复习

12-13.1统计学公式复习 A.设各组的组中值为：x 1 ，x 2 ，… ，x k 相应的频数为：f 1 ， f 2 ，… ，f k 样本加权平均： i k i i i k i k k k f f x f f f f x f x f x x 11212211==∑∑= ++++++=ΛΛ 样本方差 1 )(1212 -∑-∑= ==i k i i i k i f f x x s 样本标准差 1 )(121-∑-∑= ==i k i i i k i f f x x s B .离散系数 x s v s = 及其应用。总体均值的区间估计 C. 1.假定条件：大样本(n ≥ 30)或正态分布，总体方差σ 2已知。总体均值 μ 在1-α 置信水平下的置信区间为 n z x σα2/μ或 n s z x 2 /αμ（σ未知） D. 2.假定条件：正态分布，小样本 (n < 30), 总体方差σ 2未知, 总体均值 μ 在1-α置信水平下的置信区间为 n s n t x ) 1(2/-αμ 总体比例的区间估计假定条件：np ≥5，n (1-p )≥5，总体比例π在1-α置信水平下的置信区间为 n p p z x )1(2 /-αμ 估计总体均值时样本量的确定估计总体均值时样本量n 为 2 2 22/D z n σα=其中n z D σα2/= E.估计总体比率时样本量的确定估计总体比率时样本量n 为 2 22/) 1(D z n ππα-= 其中n z D )1(2 /ππα-= 总体均值μ的假设检验假设建立：明确的命题设为原假设H 0，模糊的命题设为备择假设H 1。 F. 1.假定条件：大样本(n ≥ 30)或正态分布，总体方差σ 2已知， (一)建立假设a .H 0 : μ=μ0 H 1 : μ≠μ0 b .H 0 : μ≥μ0 H 1 : μ<μ0 c .H 0 : μ≤μ0 H 1 : μ>μ0 (二)检验统计量 n x z /0σμ-= 或n s x z /0 μ-=（σ未知） (三)拒绝域：a . 2/αz z ≥ b . αz z -< c . αz z > (四)拒绝域成立时，拒绝原假设；否则，不能拒绝原假设。 G . 2.假定条件：正态分布，小样本 (n < 30), 总体方差σ 2未知 (一)建立假设a .H 0 : μ=μ0 H 1 : μ≠μ0 b .H 0 : μ≥μ0 H 1 : μ<μ0 c .H 0 : μ≤μ0 H 1 : μ>μ0 (二)检验统计量 n s x t /0 μ-= (三)拒绝域：a . )1(2/-≥n t t α b . )1(--n t t α (四)拒绝域成立时，拒绝原假设；否则，不能拒绝原假设。总体比例π的假设检验假定条件：n π 0≥5，n (1-π 0)≥5， (一)建立假设a .H 0 : π =π 0 H 1 : π ≠π 0 b .H 0 : π ≥π 0 H 1 : π <π 0 c .H 0 : π ≤π 0 H 1 : π >π 0 (二)检验统计量

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝，弃真错误 Ⅰ型错误（ɑ错误）: H 为假时却被接受，取伪错误 Ⅱ型错误（β错误）: H 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）

统计学原理期末复习重点

。统计学原理例题分析一、判断题（把“√”或“×”填在题后的括号里）１. 社会经济统计的研究对象是社会经济现象总体的各个方面。（）参考答案：× 2. 总体单位是标志的承担者，标志是依附于单位的。（）参考答案：√ 3. 标志通常分为品质标志和数量标志两种。（）参考答案：√ 4. 当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。（）参考答案：√ 5. 调查方案的首要问题是确定调查对象。（）参考答案：√ 6. 我国目前基本的统计调查方法是统计报表、抽样调查和普查。（）参考答案：√ 7. 调查单位和填报单位在任何情况下都不可能一致。（）参考答案：× 8. 按数量标志分组，各组的变量值能准确的反映社会经济现象性质上的差别。（）参考答案：× 9. 在确定组限时，最大组的上限应低于最大变量值。（）参考答案：× 10. 按数量标志分组的目的，就是要区别各组在数量上的差别。（）参考答案：× 11. 离散型变量可以作单项式分组或组距式分组，而连续型变量只能作组距式分组。（）参考答案：√ 12. 对于任何两个性质相同的变量数列，比较其平均数的代表性，都可以采用标准差指标。（）

参考答案：× 13. 样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。（）参考答案：√ 14. 样本容量指从一个总体中可能抽取的样本个数。（）参考答案：× 15. 在抽样推断中，作为推断对象的总体和作为观察对象的样本都是确定、唯一的。（）参考答案：× 16. 产量增加，则单位产品成本降低，这种现象属于函数关系。（）参考答案：× 17. 在直线回归方程Ｙ＝a ＋ｂｘ中，ｂ值可以是正的，也可以是负的。（）参考答案：√ 18. 回归系数ｂ和相关系数γ都可用来判断现象之间相关的密切程度。（）参考答案：× 19. 平均指标指数是综合指数的一种变形。（）参考答案：× 20. 序时平均数与一般平均数完全相同，因为它们都是将各个变量值的差异抽象化了。（）参考答案：× 二、单项选择题（从下列每小题的四个选项中，选出一个正确的，请将正确答案的序号填在括号内）１．以产品的等级来衡量某种产品的质量好坏，则该产品等级是（）。Ａ．数量标志Ｂ．品质标志Ｃ．数量指标Ｄ．质量指标。参考答案：Ｂ 2．某地区有15家生产同种产品的工厂，要研究它们的产品生产情况，总体单位是（）。Ａ．每一个工厂Ｂ．每一件产品Ｃ．所有15家工厂Ｄ．每个工厂的产品参考答案：Ｂ

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论不真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝，弃真错误 Ⅰ型错误（ɑ错误）: H Ⅱ型错误（β错误）: H 为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S =S/√n x ㈡样本率率的抽样误差:样本率p和总体率π的差异