文档库 最新最全的文档下载
当前位置:文档库 › 统计学

统计学

统计学
统计学

统计学

第1章 总论

1、统计学的起源与发展

古典统计学(17世纪中期—18世纪中期):政治算术学派(无名有实)社会经济现象“算术”式的研究;国势学派(有名无实)最先提出“统计学”,主要诉诸文字记述和逻辑比较;概率学派,将数学分析方法系统地引进概率论。 近代统计学(18世纪末—19世纪末):凯特勒提出“偶然误差”概念。戈尔登提出“百分位数”、“中位数”、“四分位数差”等概念。皮尔逊给出了极大似然估计方法,导出了χ2分布,确立了“大样本”统计理论。 现代统计学(20世纪):戈赛特导出了t 分布,是“小样本”统计研究的基石。费暄论证了相关系数的抽样分布,提出了t 检验、F 检验,相关系数检验,编制了相应的概率检验表。 内曼和皮尔逊完善了区间估计和假设检验的理论。 2、统计学的学科体系

①从方法功能分??

??

????假设检验参数估计征)本的数据推断整体的特推断统计学(如何用样理、展示数据)描述统计学(搜集、整

②从方法研究的重点分?

?

?问题)应用统计学(解决实际数学原理)理论统计学(统计学的

3、统计学的定义

统计学是指阐述统计工作基本理论和基本方法的科学,是对统计工作实践的理论概括和经验总结。它以现象总体的数量方面为研究对象,阐述统计设计、统计调查、统计整理和统计分析的理论与方法。

“统计”一词通常有统计工作、统计资料、统计学三种含义。

统计学

?????←??→

?经验总结与概括

指导统计工作

??→?取得

统计资料 4、统计学的研究对象、方法及性质

研究对象:大量社会经济现象的数量方面

性质:①数量性 ②总体性 ③不确定性 ④归纳推断性

研究方法:①大量观察法 ②设计实验 ③统计描述法 ④统计推断法 ⑤统计模型法 5、统计总体与总体单位

统计总体简称总体,是由客观存在的、具有某种共同性质的许多个别事物构成的整体。 构成总体的这些具有某种共同性质的个别事物就是总体单位。

统计总体的基本特征:①同质性 ②大量性 ③变异性 ④相对性 ⑤客观性 统计总体的分类:

①所属时间不同???动态总体静态总体 ②单位是否可以计量?

??无限总体有限总体

总体和总体单位的关系:随着研究目的和范围的不同,两者可以相互转化。

6、标志和指标

6.1标志是说明总体单位共有特征和属性的名称。可分为: ①根据标志的具体表现??

?数量标志

品质标志 ②根据变异情况??

?可变标志

不变标志

6.2统计指标是表明客观现象总体数量特征的概念和数值。一个完整的统计指标包括指标名称、计量单位、核算方法、时空限制、计算价格、指标具体数值六大要素。 6.3指标与标志的区别与联系

区别:①统计指标说明总体数量特征,而标志则反映总体单位特征。②统计指标都是能用数值表示的,而标志有数量标志和品质标志之分。 联系:①标志是统计指标的核算基础。②许多指标的数值是由总体单位的数量标志值汇总而来。③指标与标志随着研究目的和范围的不同可以相互转化。 7、变异与变量

变异是指标志表现及指标的具体表现上的差异。 可变的数量标志和所有统计指标称为变量。

第2章 统计数据的搜集

1、统计数据的来源、分类及准确性

统计数据的来源??

?????

?成本较低,作用广泛)间接来源(搜集容易,实验(针对自然科学)

学)直接调查(针对社会科直接来源

分类:

①横截面数据:在同一时间对不同单位观测同一组变量的变化过程而得到的数据。 ②时间序列:在不同时间对同一单位观测同一组变量的变化过程而得到的数据。 ③纵列数据:在不同时间对同一组单位进行调查所得到的结果,是横截面数据和时间序列混合起来的数据。

准确性:①应立足趋势性原则 ②准确性是相对的 ③经济性、时效性 ④层次性 2、统计数据的四类计量尺度

测度是指按照某种法则给物体和事物分派一定的数字和符号,亦即把某种物体、事件或现象的非数状态转化为一种数字符号状态的过程。测度由测度的客体、数字或符号、分派数字或符号的法则三大基本要素构成。 ①定类尺度(品质标志):以文字表述出定类变量各类别间是平等的。最粗略,最低级;同类同质,异类异质。具有对称性和传递性。 ②定序尺度(品质标志):以文字表述定序变量各类别间有优劣之分。不能测度类别间准确的差值;可以运用“大于”和“小于”作比较。 ③定距尺度(数量标志):对事物类别或次序之间的间距进行测度。可以准确地指出类别间的差值,通常使用通用的物理度量单位作为测度的尺度。每个间隔相等,可以加减运算。 ④定比尺度:具有定序尺度所有的性质特征,并且有一个绝对原点的测量尺度。可进行加减乘除运算。

上述四类计量尺度的水平是由低到高、由粗略到精确逐步递进的。 3、统计调查的意义

统计调查是根据统计任务的要求,运用科学的调查方法,有计划、有组织地搜集统计资料的过程。统计调查的基本任务是取得反映客观现象总体全部或部分单位以数字资料为主体的信息。

要求:准确性、及时性、全面性和经济性。“准中求快,准中求全”

4、统计调查的种类 ①按组织形式??

?专门调查统计报表制度 ②按研究总体的范围???非全面调查

力财力)全面调查(耗费人力物

5、统计调查的组织方式

①统计报表制度

特点:统一性、全面性、连续性、及时性。

缺点:中间环节多,费时费力,易出现弄虚作假的现象。

种类:按报表内容和实施范围的不同,分为基本统计报表和专门统计报表。 按调查范围不同,分为全面和非全面的统计报表制度。

按报送周期长短不同,分为日报、旬报、月报、季报、半年报和年报。 ②专门调查

(1)普查:是一种专门组织的一次性的全面调查,用以搜集一定时间上的某种调查对象较全面、较精确的统计资料。普查一般是调查属于一定时点上的客观现象的总量。 特点:周期性、规定统一的标准调查时间、全面调查

组织原则:确定标准时点,所有调查单位步调保持一致,普查项目应统一规定,选择适当的普查时间、间隔

(2)重点调查:当统计总体中存在重点单位时,在所要调查总体的全部单位中,选择一部分重点单位进行调查,用对一部分重点单位调查的结果,来掌握统计总体的基本情况的统计调查方法。

特点:非全面、非经常开展

重点单位的选择:适当确定重点单位的数量,选择要客观,选择要有相对的概念

(3)典型调查:从被研究对象中,根据调查目的和要求,有意识地选择有代表性的单位,进行深入细致调查的方法。(选择最突出,最体现共性的单位) 特点:调查单位小,调查方式灵活,非全面调查

目的:寻找其发生原因、变化趋势等事物的本质和规律性。

(4)抽样调查:按随机原则从总体中抽取一部分单位进行观察,用这部分单位指标数值来推算总体的指标数值的调查,是一种专门组织的非全面调查。 特点:抽样误差可以事先计算并加以控制

第3章 统计数据的整理与显示

1、数据的预处理

①数据的审核(完整性及准确性的审核) ②数据的筛选 ③数据排序 2、统计分组 定义:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。 原则:穷尽原则 互斥原则 作用:①区分现象质的差别 ②分析总体内部结构和总体结构特征 ③揭示现象之间的依存关系

程序:选择分组标志→确定分组体系→总体单位归类

种类:根据分组标志的性质不同,分为品质分组和数量分组。 分组标志的选择:①根据统计研究的目的与任务选择分组标志

②在若干个标志中要抓住具有本质性或主要的标志作为分组依据 ③根据现象所处的历史条件或经济条件来选择分组标志 3、频数分布

概念:在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分配,叫做频数分布。将各组别与次数按一定的次序排列所形成的数列称作频数分布数列。

变量数列:依据数量标志分组编制的分布数列。

单项式分组就是用一个变量值作为一组,形成单项式变量数列。 组距式分组就是将变量依次划分为几段区间,把一段区间内所有变量归为一组,形成组距式变量数列。

组距:各组上下限之间的距离。

组中值:上下限之间的中点数值 组中值=

2

上限

下限+

首组假定下限=首组上限—邻组组距 末组假定上限=末组下限+邻组组距 4、统计表

优点:①能够使统计资料的表现条理化、系统化、标准化。 ②简明易懂,节省篇幅 ③便于比较各项目之间的关系,便于计算。

构成:①形式上由总标题、横行标题、纵栏标题和指标数值四部分构成。 ②内容上由主词栏和宾词栏构成。

主词栏是统计表所要说明的总体及其分组,宾词栏是统计表用来说明总体数量特征

的各个统计指标。主词一般列在表的左方,宾词栏一般列在表的右方 分类:

①根据主词是否分组和分组的程度???

??两个以上标志进行分组复合表:主词按两个或标志进行分组分组表:主词只按一个分组简单表:主词未经任何

②宾词的设计??

?

??个以上标志分组标有层次地按两个或两宾词分组层叠排列:指分开,平行排列词栏中各分组标志彼此宾词分组平行排列:宾

排列进行分组,按一定顺序宾词简单排列:宾词不

设计:①合理安排统计表的结构,一般为长方形 ②表头一般包括表号、总标题和表中

数据的单位等 ③表的上下端以粗线绘制,表内纵横栏以细线绘制,表的左右两端不画线 ④在统计表下应加注解或说明,以便查考 ⑤表的纵栏较多时,可编栏号 ⑥填写要规范化 5、统计图

定类数据的图示:

①条形图:用条形图的高度或长度来表示各类别数据的频数或频率。 ②饼图:用园内扇形的角度来表示数值大小。 定序数据的图示: ①累计频率分布图 ②环形图:同时绘制多个总体或样本中的数据系列,每一个总体或样本的数据系列为一环。 定量数据的图示:

①直方图:用直方行的宽度和高度来表示次数分布。

②折线图:以线段的起伏表示其数量分布的特征。两个终点要与横轴相交,折线图下所围成的面积与直方图的面积相等。

③曲线图:连接各组坐标时用平滑曲线。

④累计曲线图(洛伦兹曲线图):以分组变量为横轴,以累计频数(频率)为纵轴。在坐标系上将各组上限与向上累计频数(频率)构成坐标点,用曲线相连,即向上累计曲线。 6、频数分布的类型 钟型分布:“两头小,中间大”,以变量的平均数为对称轴,左右两侧对称,两侧变量值分布的次数随着与其平均值距离的增大而逐次减少。 U 型分布:“两头大,中间小” J 型分布:正J 型分布和反J 型分布

第4章 统计数据特征的度量

1、绝对数 概念:也称总量指标,是反映客观现象规模大小和数量多少的综合指标,也称为绝对指标。 作用:①是认识客观现象的起点

②是编制计划、实行经济管理的重要依据 ③是计算相对数和平均数的基础

分类:

①反映的内容?

??和的总量指标映总体各单位标志值总总体标志总量指标:反标映总体单位数的总量指总体单位总量指标:反

②反映的时间状况??

?指标某一时刻上状况的总量时点指标:反映总体在

总量指标一段时期内活动过程的时期指标:反映总体在

计量单位:①实物单位:根据事物的自然形态和物理属性而采用的计量单位,又包括自然

单位、度量衡单位、标准实物单位及复合单位四种。

②价值单位:用货币来度量社会财富或劳动成果的一种计量单位。 计算:①简单加法M=x 1+x 2+……+x n =∑x

②加权加法M=x 1f 1+x 2f 2+……+x n f n =∑xf

计算要求:①现象要具有同类性 ②要有统一的计量单位

③要有明确科学的含义和科学的统计方法

2、相对数 概念:是两个有联系的统计指标对比计算的相对数,表明客观现象之间的数量依存和对比关系,也称相对指标。

作用:①可以表明事物的内部结构和比例关系

②可以使那些利用总量指标不能直接对比的现象,找到可比基础

③是进行经济管理与考核企业经济活动成果的重要指标

表现形式:①无名数:抽象化的数值,一般用系数、倍数、成数、百分数、千分数等表示。 ②有名数:用来表示强度相对指标的数值,将相对指标的分子与分母的计量单位同时使用,以表明事物的密度、普遍程度和强度等。 种类及计算方法:

(1)结构相对数:是在资料分组的基础上,以总体总量为对比基础,求出各组总量占总体总量的比重,来反映总体内部构成状况的综合指标。 结构相对数=

总体总量

各组总量

特点:①必须与统计分组相结合 ②分子只能是分母数值的一部分 ③各部分结构相对数之和等于1或100%

作用:①分析总体内部的构成,说明客观现象的性质和特征

②分析现象总体内部结构的变化,说明客观现象的发展过程和规律性 ③说明被研究对象的工作质量,反映人、财、物的利用情况

(2)比例相对数:是总体中不同部分数量对比形成的相对数,可以来反映总体范围内各个局部之间、各组之间的比例关系和协调平衡状况。 比例相对数=

总体中另一部分数值

总体中某一部分数值

(3)比较相对数:是由不同总体同一时期的同类指标对比而计算的相对数,用来说明同一事物在不同空间之间的差异程度。 比较相对数=

另一地区的同类指标数某地区的某类指标数值

(4)计划完成程度相对数:是将现象在某一时期内的实际完成数与计划任务数对比计算的

相对数,一般用百分数表示。 计划完成程度相对数=计划数

实际完成数

?100%

①计划任务数为绝对数:

a .水平法(时点概念):计划完成程度相对数=

%100?水平计划规定末期应达到的平

计划末期实际达到的水

b .累计法(时期概念):计划完成程度相对数=%100?计划规定的累计数

计划期间实际累计完成

②计划任务数为相对数: 计划完成程度相对数=%100?计划百分数

实际完成百分数

③计划任务数为平均数:

计划完成程度相对数=

%100?计划平均水平

实际平均水平

(5)动态相对数:是同一现象在不同时期的两个指标之比,表明该现象在时间上发展变化的方向和强度,一般用百分数或倍数表示。 动态相对数=

%100?基期水平

报告期水平

(6)强度相对数:是两个性质不同但又有一定联系的绝对数之比,用以表明某一现象在另一现象中发展的强度、密度和普遍程度,一般是有名数,以分子、分母的复合单位计量。 强度相对数=

现象的总量指标

另一有联系而性质不同某一现象的总量指标

注意事项:①选择好对比的基数 ②对比指标的可比性

③相对数和绝对数结合应用 ④各种相对数结合应用 ⑤结合实际内容 3、集中趋势的测度(平均数的计算) 平均数:是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。

特点:①数量抽象性 ②同类现象的平均 ③集中趋势的代表性 作用:①进行同类现象在不同时空上的比较 ②分析现象之间的依存关系

③进行数量上的推算,作为论断事物的一种数量标准 分类:数值平均数包括算术平均数、调和平均数、几何平均数 位置平均数包括中位数、四分位数、众数 4、算术平均数X

(1)基本公式:算术平均数=总体单位总量

总体标志总量

(2)简单算术平均数 X =n

X n

X X X n

∑=

+++ (21)

(3)加权算术平均数

①根据单项数列计算:∑∑=

++++++=f

Xf f f f f X f X f X X n

n

n (212211)

②根据组距式数列计算:计算出各组的组中值,以组中值代表该组的标志值。 (4)数学性质

①如果将各变量值加或减任意数A ,则所得的平均数也相应增加或减少A

()A X f

f

A X ±=±∑∑

②如果将各变量值除以任意数A (A ≠0),则所得的平均数也就除以任意数A

A

X

f f A X

=∑∑

③各变量值与平均数的离差之和等于零

()0=-∑X X ()0=-∑f

X X

④各变量值与平均数的离差平方和为最小值

()

02

=-∑X X

()

02

=-∑f X X

5、调和平均数H X

概念:标志值倒数的算术平均数的倒数

特点:①若数列中有一标志值为0,则无法计算 ②作为一种数值平均数,受所有标志值影响 ③受极端值影响小

(1)简单调和平均数(资料未分组)

H X =

∑=

++X

n X X X n

n

1

1 (1121)

(2)加权调和平均数

H X =∑∑=

+++++X

M M

X M X M X M M M M n

n n

(22)

1121

6、几何平均数G X

概念:是n 个变量值连乘积的n 次方根,适用于现象各变量值的连乘积等于总体标志总量。 特点:①若数列中有一标志值为0,则无法计算 ②是用于反映特定现象的平均水平 ③受极端值影响较小 (1)简单几何平均数

G X

=n

n

i i

n

n X

X X X ∏==1

21......

(2)加权几何平均数

G X =

∑=

=∏

=++n

i i

i

n

n

f n

i f i

f f f f n

f f X X X X 1

212

1

1

...2

1

.....

关系:H X

7、中位数M e

概念:把总体各单位的标志值按大小顺序排列,则处于序列中间位置的标志值,即中位数。 特点:①是位置平均数,不受极端值及开口组的影响,具有稳健性 ②各单位标志值与中位数离差的绝对值之和是最小值

③对某些不具有数学特点或不能用数字测定的现象,可以用中位数求一般水平 (1)未分组资料确定中位数

将各单位的标志值按大小顺序排列,而后用公式()21+n 来确定中位数在数列中的位置。 当变量值的项数为奇数时,中位数等于序列中间一项的变量值;当变量值的项数为偶数时,中位数等于序列中间两项变量值的算术平均数。 (2)分组资料确定中位数 ①单项数列:按

2

∑f

确定中位数位置,再计算累计次数,确定中位数所在组,即累计

次数较中位数位置略大的组,这一组的变量值就是中位数。 ②组距数列:a 、按

2

∑f

确定中位数位置

b 、根据向上累计:M e =L+

i f S f

m

m ?--∑12

式中:L 为中位数组的下限;f m 为中位数组的次数;S m-1为中位数组以下各组的累计次数;i 为中位数组的组距 8、四分位数 概念:将所有变量值按大小顺序排列并分成四等份,处于三个分位点上的数值即四分位数。最小的四分位数称为下四分位数,最大的四分位数称为上四分位数。 计算:

下四分位数:Q L = L QL +

L L

L Q Q Q i f S f

?--∑

14

上四分位数:Q U = L QU +

Q U Q U

Q i f S f

U ?--∑1

43 9、众数M 0

概念:总体中出现次数最多的变量值。

特点:①是位置平均数,只考虑总体分布中最频繁出现的变量值,不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口数列的影响。 ②众数是一个不易确定的平均指标。

(1)由单项数列确定众数:找出次数最多的组,该组的变量值就是众数。 (2)由组距数列确定众数 下限公式:M 0=L+

i 2

11

?+??

式中:L 为众数组的下限;1?为众数组次数与前一组次数之差;2?为众数组次数与后一组

次数之差;i 为众数组的组距。

10、中位数、众数和算术平均数的关系 ①当次数分布完全对称时,X = M e = M 0

②当次数分布呈现非对称的钟型分布时,次数分布右偏X > M e > M 0,左偏时相反。 皮尔逊公式:M 0=3 M e -2X M e =(M 0+2X )/3 X =(3 M e - M 0)/2

11、全距R

概念:全距又称极差,它是数列的最大标志值与最小标志值之差。 R=X max -X min

特点:计算简单,便于理解。只能反映数列两极端数值的差异,不能反映所有标志值的差异 12、四分位差Q D

概念:是上四分位数与下四分位数之差。 Q D=Q U -Q L

特点:①不受两端各25%数值的影响,能对开口组数列的差异程度进行测度 ②可以衡量中位数的代表性高低 ③只描述次数分配中一半的离差 13、平均差A ?D

概念:是总体中各单位标志值与其算术平均数离差绝对值的算术平均数。

(1)简单平均式:A ?D=

n

X

X i

∑-

(2)加权平均式:A ?D=

∑-i

i

i

f

f X X

特点:①能全面反映标志值的差异程度

②计算有绝对值符号,不适合代数方法的演算,使其使用受限

平均差越大,表明标志变动程度越大,平均数的代表性越小

14、标准差σ

概念:是总体各单位标志值与其算术平均数离差平方的算术平均数的平方根。 (1)简单平均式:()

n

X X ∑-=

2

σ

(2)加权平均式:()∑∑-=

f

f

X X 2

σ

数学性质:①变量的方差等于变量平方的平均数与变量平均数的平方之差。 ()

2

2

2

X

X -=σ

②变量对算术平均数的方差,小于对任意常数的方差

()()n

X

X n

X X ∑∑-≤-20

2

15、变异系数V

概念:是各种指标与平均数的比率。反映总体各单位标志值的相对离散程度。 标准差系数V σ=

%100?X

σ

第5章 抽样分布与参数估计

1、抽样调查

含义:是非全面调查中的一种重要方法,是按照一定程序,从所研究对象的全体中抽取一部分进行调查或观察,并在一定条件下运用数理统计的原理和方法,对总体的数量特征进行估计和推断。

特点:①抽样调查总体中的每个单位被抽中的概率是已知的

②遵守抽样的随机原则 ③从数量上推断总体 ④估计和推断的精确性和可靠性 数学原理:

(1)大数定律:1lim =???

?

??

?

?

-∑∞

→εμ n

X

P n

(2)中心极限定理:设从均值为μ,方差为2

σ(有限)的任意一个总体中抽取样本量为n

的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值μ,方差为n

2

σ的正态分布。

组织方式:

(1)简单随机抽样:是对被抽样总体不作任何分组、排列,完全客观地从中抽取调查单位,是最基本、最简单的抽样组织形式。

优点:最符合随机原则,方法简单直观,计算抽样误差及对总体指标加以推断比较方便。 缺点:要对总体编号;当总体的标志变异程度较大时,样本代表性下降;样本比较分散。 (2)类型抽样:又称分层抽样,是先将总体所有单位按某些重要标志进行分类,然后在各类中独立地抽取样本单位的一种抽样方式。

优点:突出层间差异,使每一层内部各个单位标志值之间的差别缩小,层内分布均匀。 缩小了层内的抽样误差,是样本指标的代表性提高,确保对总体指标的估计精度。 便于行政管理。

缺点:必须具有完整的抽样框

(3)整群抽样:是按照某一标志将总体分成若干个群体,每个群体包含若干总体单位,每群的单位数若是相等,则称为等群体整群抽样。

优点:组织起来比较方便 缺点:抽样误差有可能较大

(4)系统抽样:就是先将总体单位按一定顺序排列起来,在规定的范围内随即在抽取起始单元,然后按一定间隔来抽取样本单位。 优点:抽取样本方便易行

能保证样本单位在总体中均匀分布,提高样本对总体的代表性,降低抽样误差 缺点:复杂、细致; 节奏性重合时,影响调查的精度; 抽样误差的计算比较复杂 2、抽样分布

定义:从同一总体中,抽取样本容量相同的所有可能样本后,计算每一个样本统计量的取值和相应的概率,组成样本统计量的概率分布,简称抽样分布。 常用术语:

总体是研究对象的全体。样本由从总体中按一定程序抽得的那部分个体或抽样单元组成。

总体指标是根据总体各单位标志值计算的指标,样本指标是根据样本各单位标志值计算。 (1)样本均值的抽样分布

当总体分布为正态分布N (2

σμ,)时,X ~N (n

2

σμ,)

n 越大,样本均值接近于总体均值 (2)两个样本均值之差的分布

(21X X -)~N (2

22

1

2

121-n n σσμμ+

D (x+y )=D(x)+D(y)-2D(x)D(y)COVxy ,协方差为零,两变量独立

(3)样本方差的分布

当总体分布为正态分布N (2

σμ,)时,(1-n )22

σ

s ~ 2χ(1-n )

3、抽样误差 定义:由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和总体指标之间的绝对离差。

影响因素:①被研究总体各单位标志值的变异程度。总体方差越大,抽样误差越大

②样本容量。抽样单位数越多,抽样误差越小

③抽样调查的方式方法。不重复抽样的样本代表性高,随机抽样的抽样误差可以控制 4、抽样平均误差 (1)简单随机抽样

①样本平均数的平均误差(X μ)

重复抽样:X μ=n

s 2

不重复抽样:X μ=??? ??-N n n s 12

②抽样成数的平均误差(p μ)

重复抽样:p μ=

()n P P -1 不重复抽样:p μ=()??? ?

?--N n n P P 11

(2)类型抽样

重复抽样:X μ=n s 2

不重复抽样:X μ=??

? ??-N n n s 12

(3)整群抽样

X μ=

1

2

--?

R r R r δ 样本群间方差:()

1

1

2

2--=∑=r X

X

r

i i

δ

5、抽样极限误差 定义:是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定

的最大可能范围,记作X ?或P ?。 公式: X ?=2

α

z X μ P ?=2

αz p μ

6、参数估计

定义:以样本统计量来估计总体参数。

(1)点估计:从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量的具体数值视为总体参数的估计值。

优点:简单、具体、明确 缺点:无法控制误差,对准确度及可靠度要求不高 (2)抽样估计的优良标准

①无偏性:样本指标的数学期望等于总体指标

θθ

=)?(E ②一致性:样本指标与总体指标的绝对离差小于某一任意小的正数ε的极限概率等于1

1)?(lim =<-∞

→εθθ

P n

③有效性:以某一样本指标1?θ作为优良估计量,则其方差)?(1θD 必须小于其他估计量2?θ的方差)?(2θD ,亦即:)?(1θD <)?(2

θD (3)区间估计:根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。

在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减误差得到; 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。 (4)置信区间:一般地,设总体参数为θ,U L θθ和为由样本确定的两个统计量。对于给

定的)(10<<αα,有αθθθ-=<<1)(U L P ,称(U L θθ,)为参数θ的置信度为α

-1的置信区间。

(5)单一总体均值的区间估计

①已知方差2

σ的正态总体(服从正态分布)

②未知方差2

σ

的正态总体(服从t 分布,自由度为n-1)

计算步骤:先算X ,再算2

s ,求出X μ,再求X ?=2

α

z X μ,最后X ±X ?

(5)成数的区间估计(服从正态分布) 先算P ,再算p μ,再求P ?=2

α

z p μ,最后P ±P ?

7、样本容量的确定

(1)影响因素:①总体的标志变异程度(同向关系)

②允许误差的大小(反向关系) ③调查结果的可靠程度(同向关系) ④抽样的方法(不重复抽样<重复抽样)

⑤抽样的组织形式(简单随机抽样所需样本较多)

(2)简单随机抽样中样本容量的计算

重复抽样:12222+???

?

???????=X s z n α 成数222)1(P P P z n ?-=α

不重复抽样:2

2

2

22

22

s

z N s

Nz n X

αα+?=

成数22

2

)

1(P

P P z n ?-=

α

第6章 假设检验与方差分析

1.假设检验

分类:假设检验??

?????

?双侧检验下侧检验上侧检验

单侧检验

基本思想:小概率反证法

步骤:①建立原假设0H 和备择假设1H (先建立备择假设,“=”总是放在原假设上) ②构造检验统计量

③给定显著性水平α,当原假设0H 为真时,求出临界值

④计算检验统计量的值,对原假设作出拒绝或接受的判断

两类错误:①原假设为真,拒绝了它,弃真错误;②原假设不真,接受了它,取伪错误 2、总体均值的检验

(1)总体为正态分布且方差已知(服从正态分布) 检验统计量:n

X Z σμ0

-=

①0100:μμμμ≠=:,H H 当02

H z Z 时,拒绝α≥ ②0100:μμμμ>=:,H H 当0H z Z 时,拒绝α≥ ③0100:μμμμ<=:,H H 当0H z Z 时,拒绝α-≤ (2)总体为正态分布但方差未知(服从自由度为n-1的t 分布)

检验统计量:n

s

X t 0μ-=

①0100:μμμμ≠=:,H H 当02

)1(H n t t 时,拒绝-≥α ②0100:μμμμ>=:,H H 当0)1(H n t t 时,拒绝-≥α ③0100:μμμμ<=:,H H 当0)1(H n t t 时,拒绝--≤α

第8章 相关和回归分析

1、相关与回归分析的基本问题

(1)相关关系:现象之间存在一定的关系,但是这种关系并不确定。 类型:

①涉及因素的多少?

?

?复相关单相关 ②相关的方向???负相关正相关

③表现形式???非线性相关线性相关 ④相关的密切程度??

?

??不完全相关

不相关完全相关

相关分析的内容:判断变量之间是否存在相关关系;测定变量之间相关关系的密切程度 (2)回归分析:对具有高度相关关系的现象,根据其相关的形态,建立一个合适的数学模型来近似地反映现象之间一般变化关系的一种分析方法。

类型: ①回归方程的表现形式??

?非线性回归分析线性回归分析 ②涉及自变量的多少???多元回归分析

一元回归分析

主要内容:①根据样本观察值对回归模型参数进行估计,求得回归方程

②对回归方程进行统计检验

③利用回归方程进行预测、政策分析和实证分析 (3)相关分析和回归分析的区别与联系

联系:相关分析是回归分析的基础和前提;回归分析是相关分析的深入和继续

区别:①变量之间的关系不同??

?系存在解释和被解释的关回归分析中,两个变量

的地位是平等的与变量相关分析中,变量

X Y

②变量的性质不同?

??为随机变量因变量回归分析中,一般设定都是随机变量与变量相关分析中,变量

Y X Y

③分析的作用不同??

?方程进行预测回归分析能够通过回归

之间的相关密切程度相关分析主要分析变量

(4)相关系数

yy

xx xy l l l r ?=

21

)(∑=-=n

i i xx X X l 2

1

)(∑=-=n

i i yy Y Y l )()(1

Y Y X X l i n

i i xy --=∑=

)1,1(-∈r 为低度相关

为弱相关;,5.03.0,3.0<≤

r=1或r=-1,说明两个变量完全正相关或完全负相关,此时两个变量之间的关系为函数关系。

2、一元线性回归分析 (1)一元线性回归模型

①总体回归方程:i i i X Y εββ++=10 ②样本回归方程:i

i X Y 10???ββ+= (2)一元线性回归模型的最小二乘估计

基本假定:①零均值假定 0)(=i E ε

②同方差假定222)())(()(σεεεε==-=i i i i E E E Var

③无自相关假定0)())]())(([(),(==--=j i j j i i j i E E E E Cov εεεεεεεε ④自变量0),(=i i i i X Cov X εε不相关假定和随机误差项

公式: ∑∑==---=n i i

n

i i i

X X

Y Y X X

1

2

1

1

)()

)((?β X Y 1

0??ββ-= (3)一元线性回归模型的统计检验

①拟合优度检验(拟合系数计算)

∑∑==--=

n

i i

n

i i Y Y

X X R 1

2

1212)()

()?(β

102

≤≤R ,若,说明完全拟合表明完全不拟合;若1,022

==R R

②参数的显著性检验(t 检验)

首先,提出假设:00:10≠=i i H H ββ:, 其次,构造检验统计量:

)

?(?)?(i i

i

se t βββ=~)2(-n t ∑∑∑===-----=n

i i n

i n

i i i i i

X X n X X Y Y se 1

2

1

1

222

)()2()()?()()?(ββ

最后,给定显著性水平,查出临界值 若;拒绝原假设0),2(2

H n t

t ->α

若;不能拒绝原假设0),2(2

H n t

t -<α

(4)一元线性回归模型的预测(只掌握点预测)

点预测:给定未来自变量0X ,带入样本回归方程,0

100???X Y ββ+=

第9章 时间数列

1、时间数列概述

(1)概念:时间数列是把反映某种客观现象在时间上发展变化的指标数值,按时间先后顺序排列起来所形成的数列。

(2)基本要素:①现象所属的时间 ②现象在各时间上的统计指标数值 (3)作用:①反映客观现象的发展状态和结果 ②研究客观现象的发展速度和发展趋势,揭示现象发展变化的规律,并据以进行统计预测 ③利用不同但有联系的数列进行对比分析或相关分析

(4)按其所排列指标的性质????

?

???????平均数时间数列指标数值不能相加)相对数时间数列(各项时点数列可以相加)时期数列(各指标数值

绝对数时间数列

(5)编制原则:①时间长短应一致 ②总体范围应一致

③指标的经济内容应该一致 ④指标的计算方法、计算价格和计量单位要一致 2、动态比较指标 (1)增减量

逐期增减量:1--n n a a 累计增减量:0a a n - 关系:逐期增减量之和等于对应的累计增减量

相邻两个时期的累计增减量之差等于相应的逐期增减量

(2)发展速度(动态相对数) 环比发展速度:

1

-n n

a a 定基发展速度:0a a n

关系:环比发展速度的连乘积等于相应的定基发展速度

相邻两个时期的定基发展速度之比等于相应的环比发展速度 (3)增减速度(强度相对数)

环比增减速度=环比发展速度—1 定基增减速度=定基发展速度—1 环比增减速度与定基增减速度之间不存在直接的换算关系 (4)增减1%的绝对值=100

前一期水平

3、动态平均指标 (1)平均增减量=

1

-时间数列项数累计增减量

(2)平均发展水平(序时平均数) (一)根据绝对数时间数列计算

①根据时期数列计算 n

a a ∑=

②根据时点数列计算

a 、由连续时点数列计算???

???

?==∑∑∑f af

a n a a 资料分组资料未分组

b 、由间断时点数列计算????

?????

++++++=

-++++=----111

112

1121......2 (212)

......2n n n n n n f f f a a f a a a n a a a a a 不等间隔等间隔

(二)根据相对数时间数列计算

①由两个时期数列对比

a 、已知相对数时间数列的各指标值及相对数的子项和母项资料

∑∑=

b

a c

b 、已知相对数时间数列的各指标

c 及相对数母项资料b

∑∑=

b

bc c c 、已知相对数时间数列的各指标c 及相对数子项资料a

∑∑=c

a a c ②由两个时点数列对比

a 、由两个连续时点数列对比,且资料未分组,公式同上

b 、由两个连续时点数列对比,且资料分组

∑∑=

bf

af c

c 、由两个等间隔时点数列对比

2

......22 (2)

121

121

n n n

n b b b b a a a a c ++++++++=-- d 、由两个不等间隔时点数列对比

1

112

11

112

12

......22......2----++++++++=n n n n n n f b b f b b f a a f a a c

③由一个时期数列和一个时点数列对比

n

b b b n a a a

c n

n

2

......12......021++++++=

(三)根据平均数时间数列计算(动态平均数)

???

???

?=

=∑∑∑f af a n a a 各时期时间长度不等各时期时间长度相等

(3)平均发展速度和平均增减速度

平均增减速度=平均发展速度—1 水平法(几何平均法)n n

i i

n n n

n

n X

X X X R a a X ∏=====

1

210

...

4、时间数列的变动分析

(一)时间数列的变动影响因素

①长期趋势 ②季节变动 ③循环变动 ④不规则变动

(二)长期趋势的测定 (1)意义:①掌握现象发展变化的规律性②预测现象未来的情况③研究其他三种变动成分 (2)方法: 非数学模型法

①序时平均法:将时期数列的时期或时点数列的间隔适当扩大,求出各个序时平均数,编制出一个平均数时间数列,以表明现象的变动趋势。

②移动平均法:从时间数列的第一项开始,按一定项数求序时平均数,逐项移动,边移动边平均。将原数列中某些不规则变动加以修匀,从而使趋势倾向更明显。

用移动平均数组成的趋势值数列较原数列项数少,若原数列有N 年数据,采用n 项移动平均,则新数列有N —n+1项。

数学模型法(程序:定性分析→判断趋势类型→计算待定系数→利用方程预测) ①最小平方法(最小二乘法)

直线趋势:bt a y c +=

首项为原点??

?+=+=∑∑∑∑∑2

t

b t a ty t

b na y 中项为原点??

?==∑∑∑2

t

b ty na

y

(三)季节变动的测定 ①求季平均数。(各年同季相加除以年数) ②求各季总平均数。(各季的季平均数相加除以4) ③求季节指数。(季平均数除以各季总平均数)

④若季节指数之和不等于4,则求调整系数(4除以季节指数之和)

第10章 统计指数

1、统计指数概述

(1)概念:广义上讲,凡是反映客观现象变动的相对数都是指数。

狭义上指用来反映不能直接加总的多要素所组成的客观现象的综合变动。

(2)种类:①按反映对象的范围不同,分为个体指数和总指数。

②按所反映的现象内容不同,分为数量指标指数和质量指标指数。 ③总指数按其表现形式和计算方法不同,分为综合指数和平均数指数。

(3)作用:①可以表明不同度量现象的总发展趋势

②分析客观现象总变动中的各个因素的影响作用 ③反映客观现象长期发展变化的趋势 2、综合指数

(1)概念:在所研究的总量指标中,包含两个或两个以上的因素,将其中一个或一个以上的因素固定下来,只观察其中一个因素的变动。 同度量因素:把不同度量的现象过渡成可以同度量的媒介因素,同时起同度量和权数的作用。 指数化因素:在指数分析中被研究的因素。 (2)公式

①数量指标指数???

???

?=

=∑∑∑∑01110010q p q p K q p q p K q q 量因素以报告期价格作为同度因素以基期价格作为同度量

编制数量指标综合指数时,应以基期的质量指标作为同度量因素

②质量指标指数???

???

?=

=∑∑∑∑10110001q p q p K q p q p K p p 度量因素以报告期销售量作为同量因素以基期销售量作为同度

编制质量指标综合指数时,应以报告期的数量指标作为同度量因素

3、平均数指数

(1)概念:从个体指数出发,通过求个体指数的加权平均数得出的总指数。 (2)公式:

①加权算术平均数指数????

???

==01

01q q K p p K 物量指数物价指数 ∑∑=

0q

p q

Kp K

②加权调和平均数指数???

?

???

==01

01q q K p p K 物量指数物价指数 ∑∑=

K

q p q p K 1

111

4、指数体系与因素分析

(1)指数体系:经济上有联系、数量上保持一定对等关系的三个或三个以上的指数所形成的整体称为指数体系。

作用:①指数体系是因素分析法的根据

②利用指数体系还可以进行指数之间的相互推算 ③对单个指数的编制有指导意义

应用统计学论文

应用统计学课程论文 经过这学期短暂的学习应用统计学,我对这门学科也有了一定认识。应用统计学是一门运用统计学的原理和方法,研究各个领域有关数据收集、整理、分析的科学是经济、管理类专业的一门重要专业基础课程。掌握统计学的基本理论和方法,具有较好的科学素养,能熟练地运用计算机分析数据,能从事统计调查、统计信息管理、数量分析、市场研究、质量控制等工作。在当前的社会发展中,是市场经济和信息经济的时代,社会各个方面的发展都需要对信息进行收集、分析和整理,所以学好应用统计对不久即将走向社会的我们是只有好处,没有坏处的。 绪论 一、应用统计学的发展: 从统计学的发展过程来看,可以把统计学大致分为古典统计学、近代统计学和现代统计学三个时期。 第一、古典统计学时期: 古典统计学时期是指17世纪初至18世纪末,这是统计学的创立时期,亦称古典统计学时期。在这时期出现了政治算术学派和德国的国势学派两个统计学派. 1、国势学派 国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。 2、政治算术学派 政治算术学派产生于19世纪中叶的英国,其创始人是威廉和约翰.“算术”是指统计方法。主要利用实际资料,运用数字、重量和尺度等统计方法对实际情况作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。 第二、近代统计学时期: 近代统计学是指18世纪末到19世纪末这一百年的统计学,它是古典统计学的继续和发展,是古典统计学向现代统计学过渡的统计学。近代统计学的发端,不能不提到著名的统计学家阿道夫·凯特勒的卓越员献。他既继承了国势学和政治算术的传统,把统计学从作为管理国家行政的“政治医学”,扩展到作为研究社会内在矛盾及其规律性数量表现的科学认识方法,又积极地把古典概率引人统计学,以研究社会经济现象偶然变化中的规律性表现。 1、数理统计学派 指概率论引进统计学形成数理统计学,以概率作为理论基础,抽象掉统 计学的社会经济现象内涵,变成了抽象的数学分析和推断技术. 2、社会统计学派 指研究社会现象变动的原因和规律性的实质性科学。社会统计学在这里也称为社会经济统计学,包括政治统计.经济统计.人口统计.犯罪统计等多方面内容. 第三、现代统计学时期:

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学计算题

统计学计算题 27、【104199】(计算题)某班级30名学生统计学成绩被分为四个等级:A .优;B .良;C .中;D .差。结果如下: B C B A B D B C C B C D B C A B B C B A B A B B D C C B C A B D A A C D C A B D (1)根据数据,计算分类频数,编制频数分布表; (2)按ABCD 顺序计算累积频数,编制向上累积频数分布表和向下累计频数分布表。 【答案】 28、【104202】(计算题)某企业某班组工人日产量资料如下: 根据上表指出: (1)上表变量数列属于哪一种变量数列; (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。 【答案】(1)该数列是等距式变量数列。 (2)变量是日产量,变量值是50-100,下限是,、、、、9080706050上限是,、、、、10090807060次数是111625199、、、、; (3)组距是10,组中值分别是 9585756555、、、、 ,频率分别是13.75%31.25%.20%23.75%11.25% 、、。 29、【104203】(计算题) 甲乙两班各有30名学生,统计学考试成绩如下:

(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。 【答案】 乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出"两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。 30、【104205】(计算题)科学研究表明成年人的身高和体重之间存在着某种关系,根据下面一组体重身高数据绘制散点图,说明这种关系的特征。 体重(Kg ) 50 53 57 60 66 70 76 75 80 85 身高(cm ) 150 155 160 165 168 172 178 180 182 185 【答案】散点图:

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解 第二章 统计调查与整理 1. 见教材P402 2. 见教材P402-403 3. 见教材P403-404 第三章 综合指标 1. 见教材P432 2. %86.12270 25 232018=+++= 产量计划完成相对数 3. 所以劳动生产率计划超额%完成。 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本,未完成计划,还差%完成计划。 5. %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数;所以计划完成数实际完成数标因为,计划完成程度指%105%103= = 1.94%%94.101% 103% 105,比去年增长解得:计划完成数==()得出答案)将数值带入公式即可以计算公式, 上的方程,给大家一个很多同学都不理解也可以得出答案,鉴于(根据第三章天)。 个月零天(也即是个月零(月)也就是大约)(上年同季(月)产量达标季(月)产量超出计划完成产量 达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式:提前多出万吨,比计划数万吨产量之和为:季度至第五年第二季度方法二:从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零 年第四季度为止提前(天),所以截止第五)(根据题意可设方程:万吨完成任务。天达到五年第二季度提前万吨。根据题意,设第万吨达到原计划,还差万吨产量之和为:季度至第五年第一季度方法一:从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

统计学期末试题 模拟试卷一及答案

模拟试卷一:统计学期末试题 院系________姓名_________成绩________ 一.单项选择题(每小题2分,共20分) 1.对于未分组的原始数据,描述其分布特征的图形主要有() A. 直方图和折线图 B. 直方图和茎叶图 C. 茎叶图和箱线图 D. 茎叶图和雷达图 2.在对几组数据的离散程度进行比较时使用的统计量通常是() A. 异众比率 B. 平均差 C. 标准差 D. 离散系数 3.n?50的简单随机样本,样本均值的的总体中,抽出一个从均值为100、标准差为10数学期 望和方差分别为() A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2 4.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准称为() A. 无偏性 B. 有效性 C. 一致性 D. 充分性 5.根据一个具体的样本求出的总体均值95%的置信区间() A. 以95%的概率包含总体均值 B. 有5%的可能性包含总体均值 C. 一定包含总体均值 D. 可能包含也可能不包含总体均值 6.在方差分析中,检验统计量F是() A. 组间平方和除以组内平方和 B. 组间均方和除以组内均方 C. 组间平方和除以总平方和 D. 组间均方和除以组内均方 ??????y?x7.反映的是(在回归模型中,)10y x的线性变化部分的变化引起的由于A. y x的线性变化部分的变化引起的由于 B. yy x的影响C.和除的线性关系之外的随机因素对yy x的影响由于D.的线性关系对和8.在多元回归分析中,多重共线性是指模型中() A.两个或两个以上的自变量彼此相关 B.两个或两个以上的自变量彼此无关 C.因变量与一个自变量相关 D.因变量与两个或两个以上的自变量相关 9.为增长极限。描述该K若某一现象在初期增长迅速,随后增长率逐渐降低,最终则以. 类现象所采用的趋势线应为() A. 趋势直线 B. 指数曲线 C. 修正指数曲线 D. Gompertz曲线 10.消费价格指数反映了() A.商品零售价格的变动趋势和程度

统计学计算题

解:基期总平均成本=1800 120018007001200600+?+?=660 报告期总平均成本=1600 24001600 7002400600+?+?=640 总平均成本下降的原因是该公司产品的生产结构发生了变化, 即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。 2.某商贸公司从产地收购一批水果,分等级的收购价格和收购进入如下, (元) 收购总量收购总额6268.130.1832060.11664000.2127008320 1664012700)()(11=++++=∑ ∑====k i i i i k i i i X f X f X X 3.某中学正在准备给一年级新生定制校服。男生校服分小号、中号和大号三种规格, 分别适合于身高在160cm 以下、160~168cm 之间和168cm 以上的男生。一直一年级 新生中有1200名男生,估计他们身高的平均数为164cm ,标准差为4cm 。试由此粗 略估计三种规格男生校服分别准备多少套? 解:均值=164;标准差=4;总人数=1200 身高分布通常为钟形分布,按经验法则近似估计: 规格 身高 分布范围 比重 数量(套) 小号 160以下 0.15865 190.38 中号 160-168 均值±1*标准差 0.6827 819.24 大号 168以上 0.15865 190.38 合计 1200 4. 根据长期实验,飞机的最大飞行速度服从正态分布。先对某新型飞机进行了 15次试飞,测得各次试飞时的最大飞行速度(单位:米/秒)为: 422.2 417.2 42 5.6 425.8 423.1 418.7 428.2 438.3 434.0 412.3 431.5 413.5 441.3 423.0 420.3 试对该飞机最大飞行速度的数学期望值进行区间估计。(置信概率0.95) 解:样本平均数 X =425, S 2 n-1=72.049, S 14=8.488 X S 2.1916 1510.05/2()t -=2.1448 ?==/2 (n-1) t α×2.1916=4.7005 所求μ425-4.70<μ<425+4.7t0,即(420.30,429.70)。 5.某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区 已购买了微波炉的2200个居民户中用简单随机不还原抽样方法以户为单位抽取 了30户,询问每户一个月中使用微波炉的时间。调查结果依次为: 300 450 900 50 700 400 520 600 340 280 380 800 750 550 20 1100 440 460 580 650 430 460 450 400 360 370 560 610 710 200 试估计该地区已购买了微波炉的居民户平均一户一个月使用微波炉的时间。 解:根据已知条件可以计算得:14820y n 1 i i =∑= 8858600 y n 1 i 2i =∑= 估计量 n i i 1 1y n μ=== ∑ =301 *14820= 494(分钟) 估计量的估计方差 2s n v()v(y)(1)n N μ==- =30 1 *291537520*)2200301(-=1743.1653 其中 () ??? ? ??= = ∑∑==2n 1i 2i n 1 i 2 i 2n -y 1-n 1-y 1-n 1 s = () 2 494*308858600*1 301 -- =29 1537520=53017.93, S=230.26 6.一个市场分析人员想了解某一地区看过某一电视广告的家庭所占的比率。该地区共有居民1500户,分析人员希望以95%的置信度对总体比率进行估计,并要求估计的误差不超过5个百分点。另外,根据先前所做的一个调查,有25%的家庭看过该广告。试根据上述资料,计算要进行总体比率的区间估计,应当抽取的样本单位数。 解: ()222 2222211500 1.960.25(10.25) 115000.05 1.960.25(10.25) P Nz P P n N z P P αα-???-= = ?+-?+??- 241.695= 应抽取242户进行调查。 7.设销售收入X 为自变量,销售成本Y 为因变量。现已根据某百货公司12个月的有关资料 计算出以下数据(单位:万元)。() 2425053.73 t X X -=∑ 647.88X = () 2 262855.25t Y -=∑ 549.8 Y = ()()334229.09t t Y Y X X --=∑ 试利用以上数据:(1)拟合简单线性回归方程,并对回归系数的经济意义作出解释。(2)计算决定系数和回归估计的标准误差。(3)对2β进行显著水平为5%的显著性检验。(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。 解:(1) ()() () t t 22 Y Y X X 334229.09|=0.7863425053.73 t X X β--==-∑∑ 12|=Y-X=549.8-0.7863* 647.88=40.3720β β (2) ( )() ( )( ) 2 2 2 334229.092 20.999834425053.73*262855.25 t t t t Y Y X X r X X Y Y ?? --??===--∑∑∑ ()() 2 2 2 143.6340t e r Y =--=∑∑ 2.0889 e S = = (3)02 12:0,:0H H β=≠ 20.003204 S β = = 2220.7863 245.41200.003204 t S β β β == = t 值远大于临界值2.228,故拒绝零假设, 说明2在5%的显著性水平下通过了显著性检验 (4)40.3720 + 0.7863*800 = 669.41(f Y =万元) f e S = = 2n-2f f e Y t S α± 669.41 2.228*1.0667 =± = 669.41 2.3767± 即有:664.64 674.18f Y ≤ ≤ 8.对9位青少年的身高Y 和体重X 进行观测,并以得出以下数据: 2 i i Y=13.54;Y =22.9788∑∑ 2 i i X=472;X =28158∑∑ i X 803.02i Y =∑ (1) 以身高为因变量,体重为自变量,建立线性回归方程 (2) 计算残差平方和决定系数 (3) 计算身高和体重的相关系数并进行显著性检验(自由度为7, (4) 显著水平为0.05的t-分布双侧检验临界值为2.365) (5) 对回归系数2β进行显著性检验 9.某商业企业某年第一季度的销售额、库存额及流量费用额资料 品流转次数=销售额/平均库存额;商品流通费用=流通费用额/销售额)。 解:第一季度的月平均商品流转次数为: 第一季度的月平均销售额第一季度的平均库存额 ()()()2880+2170+23403 = 19802+1310+1510+156024-1 2466.333= =1.61 1530 第一季度的平均商品流通费用率为:第一季度的月平均流通费用第一季度的平均销售额 () ()230+195+2023 = 2880+2170+23403209 ==8.48%2466.333

应用统计学

应用统计学 课程编码:202136 课程英文译名:Practical Statistics 课程类别:学科基础选修课 开课对象:工业工程专业 开课学期:5 学分: 2学分; 总学时: 32学时; 理论课学时: 32 学时; 实验学时: 0学时; 上机学时: 0 学时 先修课程:概率论 教材:应用统计,朱洪文,高等教育出版社,2001.2 参考书:【1】应用统计学,倪加勋,中国人民大学出版社,1994 一、课程的性质、目的和任务 应用统计学是一门认识方法论的科学,通过对社会经济现象的数量方面资料的搜索、整理、分析和推断,阐明社会经济现象本质及其内在的规律性,以达到对社会经济现象整体的具体的认识。该课程作为经济、管理类专业的专业基础课开设。 通过本课程的教育需达到以下目的:1、为经济管理提供统计调查,资料整理汇总和统计分析的一般原则和方法;2、为进一步学习有关专业知识,奠定理论和方法基础;3、为学习其他经济管理课程和从事经济研究工作提供数量分析的方法。学习中要正确理解课程中的各个基本概念,了解统计工作的各个阶段,掌握统计的基础理论和基本方法,并能综合运用所学的理论知识分析应用经济统计信息,以满足工作的需要。 二、课程的基本要求 1.明确统计的对象及其特点,了解统计的性质与作用以及统计工作的基本环节。透彻理解统计学中的基本范畴,初步建立统计思想。 2.理解统计调查的概念,了解统计调查方法的种类,掌握统计报表制度和各种专门调查的概念、特点以及各种调查方法的结合运用。 3.了解统计调查方案的基本内容,理解统计整理的概念,统计分组的概念和作用,了解次数分布的类型,统计表的结构,掌握制表的一

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

(完整版)统计学期末考试试卷

2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟 一、填空题(每空1分,共15分) 1、按照统计数据的收集方法,可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密 度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为,方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、和 。 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分) 1、理论统计学与应用统计学是两类性质不同的统计学() 2、箱线图主要展示分组的数值型数据的分布。() 3、抽样极限误差可以大于、小于或等于抽样平均误差。() 4、在全国人口普查中,全国人口数是总体,每个人是总体单位。() 5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知, 仅需对分布的未知参数进行估计的问题称为参数估计。() 6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少() 7、在单因素方差分析中,SST =SSE+SSA() 8、右侧检验中,如果P值<α,则拒绝H 。() 9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量 与边际误差成正比。() 10、当原假设为假时接受原假设,称为假设检验的第一类错误。() 三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职 工家庭的年人均收入。这项研究的样本()。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时()。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值 其他 (a

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

《统计学》计算题型与参考答案

《统计学》计算题型 (第二章)1.某车间40名工人完成生产计划百分数(%)资料如下:9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求: (1)编制分配数列;(4分) (2)指出分组标志及其类型;(4分) (3)对该车间工人的生产情况进行分析。(2分) 解答: (1)

(2)分组标志:生产计划完成程度 类型:数量标志 (3)从分配数列可以看出,该计划未能完成计划的有4人,占10%,超额完成计划在10%以内的有22人,占55%,超额20%完成的有7人,占17.5%。反映该车间,该计划完成较好。 (第三章)2.2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个农贸市场农产品的平均价格较高?(8分)并分析说明原因。(2分) 解答: (1)x 甲=∑∑m x m 1=24 8.41 6.36.314.24.21246.34.2?+?+?++=30/7=4.29(元) x 乙= ∑∑f xf = 1 241 8.426.344.2++?+?+?=21.6/7=3.09(元) (2)原因分析:甲市场在价格最高的C 品种成交量最高,而乙市场是在最低的价格A 品种成交量最高,根据权数越大其对应的变量值对平均数的作用越大的原理,可知甲市场平均价格趋近于C ,而乙市场平均价格却趋近于A ,所以甲市场平均价格高于乙市场平均价格。

统计学计算题

第二章 六、计算题. 1.下面是某公司工人月收入水平分组情况和各组工人数情况: 月收入(元)工人数(人) 400-500 20 500-600 30 600-700 50 700-800 10 800-900 10 指出这是什么组距数列,并计算各组的组中值和频率分布状况。 2.抽样调查某省20户城镇居民平均每人全年可支配收入(单位:百元)如下: 88 77 66 85 74 92 67 84 77 94 58 60 74 64 75 66 78 55 70 66 ⑴根据上述资料进行分组整理并编制频数分布数列 ⑵编制向上和向下累计频数、频率数列 答:⑴⑵

第三章 六、计算题. 要求:⑴填满表内空格. ⑵对比全厂两年总产值计划完成程度的好坏。 ⑵该企业2005年的计划完成程度相对数为110.90%,而2006年只有102.22%,所以2005年完成任务程度比2006好。 ⒉某工厂2006年计划工业总产值为1080万吨,实际完成计划的110%,2006年计划总产值比2005年增长8%,试计算2006年实际总产值为2005年的百分比? 解:118.8% 3.某种工业产品单位成本,本期计划比上期下降5%,实际下降了9%,问该种产品成本

计划执行结果? 解:95.79% 4.我国“十五”计划中规定,到“十五”计划的最后一年,钢产量规定为7200万吨, 根据上表资料计算: ⑴钢产量“十五”计划完成程度; ⑵钢产量“十五”计划提前完成的时间是多少? 解:⑴102.08%;⑵提前三个月 5.某城市2005年末和2006年末人口数和商业网点的有关资料如下: 计算:⑴平均每个商业网点服务人数; ⑵平均每个商业职工服务人数; ⑶指出是什么相对指标。 ⑶上述两个指标是强度相对指标。 6.某市电子工业公司所属三个企业的有关资料如下:

统计学练习题及答案

2014统计学练习题及答案 一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高4%,则劳动生产率的任务仅实现一半。(错) 2、在统计调查中,调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。(对) 6.上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季.的影响使实际值高于趋势值,(对) 7.特点是“先对比,后综合。”(错 8.隔相等的时点数列计算平均发展水平时,应用首尾折半的方法。( 错) 9.均数指数的计算特点是:先计算所研究对象各个项目的个体指数;然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中,组数等于数量标志所包含的变量值的个数。(对) 12.中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 14.变异度指标越大,均衡性也越好。( 对) 15.于资料的限制,使综合指数的计算产生困难,就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。(对) 17.数虽然未知,但却具有唯一性。(错) 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的(错) 19.以经常进行,所以它属于经常性调查(错) 20.样本均值来估计总体均值,最主要的原因是样本均值是可知的。()答案未 21.工业普查中,全国工业企业数是统计总体,每个工业企业是个体。(错) 22.标志的承担者,标志是依附于个体的。(对) 23.志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。(错) 24.标和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 25.计指标都是用数值表示的,所以数量标志就是统计指标。(错) 26.标及其数值可以作为总体。(错) 27.润这一标志可以用定比尺度来测定。(错) 28.统计学考试成绩分别为55分,78分,82分,96分,这4个数字是数量指标。(错) 29.术学派注重对事物性质的解释,而国势学派注重数量分析。(错) 30.是统计研究现象总体数量的前提。(对) 31.析中,平均发展速度的计算方法分水平法和方程两种。(错) 32.数值越大,说明相关程度越高:同理,相关系数的数值越小,说明相关程度越低(对 33.志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(错) 34.度具有另外三种尺度的功能。(对) 35.民旅游意向的问卷中,“你最主要的休闲方式是什么?”,这一问题应归属于事实性问题

应用统计学的基本概念

第八讲 应用统计学的基本概念 Dr. Alan Moses 我是Alan Moses博士, 是马萨诸塞州波士顿的Joslin糖尿病中心的高级副院长和首席医生。在这部分讲座中,我们将学习应用统计学的基本概念。我们首先回顾在临床研究中统计学的作用。然后学习统计学的基本概念及常用统计学检验。最后我们将讨论一些所谓的“数据分析中的捣蛋鬼”。 临床研究中统计学的作用是什么?我们所做的就是区分事实和偶然性。我们需要比较组间差异,并检验干预的效应。 那么,临床研究中生物统计学家的作用是什么?虽然我们希望得到令人满意数据并知道如何设计试验及进行分析数据,但通常我们需要依靠生物统计学家的专业知识来选择适当的试验设计和计算适合的样本量。我们都应认识到样本量是由对结果的测定决定的,涉及其精确度、准确度、可重复性和可行性。此外,在进行数据分析时,生物统计学家帮助我们决定使用何种分析工具。在试验开始之前就应确定所使用的统计方法,非常重要的是, 分析方法决不能在试验完成之后加以改变. 在对试验进行分析时,统计学的作用是什么?我们应当记住,统计方法仅仅是一种帮助我们解释试验中所获得的数据的工具。它们是一种工具而不是试验的最终结果。而且像任何工具一样,使用统计工具必须小心。计算机可以产生一些或有统计学意义的数据,但是只有研究者才知道该使用何种统计学检验来进行统计学分析。已参加培训的研究者可以很容易地选择统计学检验方法,必须记住的很重要的一点是,对于没有足够知识的人而言,有强大功能的统计软件包可能导致致命性的错误。 生物统计学的重要概念之一是其正确性(validity)。对于关键性的数据分析、试验的结果尤其是结果的发表,正确性都是其核心。有两种正确性: 内部的和外部的(可推广性)。 内部的正确性就是在设定的试验范围内结果是准确的,使用的方法和分析经受得住检验,数据和相关的医学文献均支持研究者对试验结果的解释和结论。 外部正确性或可推广性决定了试验设计是否能够允许所做的观察和所得的结论推广到整个人群。试验人群的选择决定了最大可推广范围,这个概念我们在这个讲座的其它部分已经谈到过。如果研究对象包括男性、女性、不同的种族、不同的年龄分层,那么就有更多的机会将临床试验的结果应用于普通人群。另一方面,受试者的选择也将决定研究和结论可应用的人群范围。例如,如果在临床试验中选择年龄介于5-10岁的儿童,那么该试验的结果就仅能应用于该人群。如果选择45岁以上的亚洲男性作为受试者,那么试验结果就只能应用于这个人群。 在正确性的概念中,应该认识到须有足够的样本量以支持所得出的结论,同时要选择适当的对照人群,特别是强调随机双盲对照这一临床研究的根本的科学方法。著名科学家Isaac

(完整版)统计学复习题答案

一、主要术语 描述统计 ....:研究数据收集、处理和描述的统计学分支。 推断统计 ....:研究如何利用样本数据来推断总体特征的统计学分支。 观测数据 ....:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。 实验数据 ....:在实验中控制实验对象而收集到的数据。 异众比率 ....:非众数组的频数占总频数的比率。 四分位差 ....:也称为内距或四分间距,上四分位数与下四分位数之差. 。 显著性水平 .....:假设检验中发生第Ⅰ类错误的概率,记为 P-.值.:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。 拟合优度检验 ......:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体是否服从某种分布。一般地,可以用于任何假设的概率分布。 独立性检验 .....:检验两个分类变量之间是否存在相关关系。 多个总体比例差异检验 ..........:检验多个总体比例是否都相等。 消费者物价指数 .......:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。 生产者价格指数 .......:反映企业产品出厂价格变动趋势和变动程度的一种相对数。 股票价格指数 ......:是反映某一股票市场上多种股票价格变动趋势的一种相对 二.简答和计算P41—P42: 2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。 2.6你认为应当如何控制调查中的回答误差? 回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。 调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。 2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。 2.8如何设计调查方案? 第一步:确定调查目的 第二步:确定调查对象和调查单位 第三步:确定调查项目和调查表 第四步:调查表格和问卷的设计 第五步:确定调查时间和调查方法等

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

相关文档