文档库 最新最全的文档下载
当前位置:文档库 › 统计学4章特征

统计学4章特征

统计学4章特征
统计学4章特征

第4章数据特征

数据的分组和图形表示主要是为了从中发现数据所代表的变量(指标)变化的规律性。什么是数据最基本的规律性呢?今举一例说明。今年(2004)夏季我国气温偏高,如果某城市的气象部门经过对气温数据的分析告诉你这个城市7月份的平均气温是C?

32,气

变化范围是C

26,你是否可对偏高的气温有了一个具体的了?38

C?

-

解呢?

气象部门的回答指出了气温数据的两个特征,第一个是气温的中心位置特征C?

32,第二个是气温的变化范围或分散程度的特征26。这两种特征概括了数据的基本规律性。这一节主要介?38

-

C?

C

绍这两种特征及其计算方法。

§4.1 数据的中心位置特征

中心位置特征有三种,即众数(mode)、中位数(madian)和均值(mean)。对总体而言,也就是总体的位置参数。

一、众数

众数是数据中出现次数最多的值,用

M表示,反映的是一组数

o

据的中心位置特征或集中趋势。

例如:在一固定街口观测来往车辆10个小时,共通过14000辆车,分布情况如下:

小轿车卡车巴士拖车

9200 2840 510 1450

此时,我们仅能回答的是最经常看到的是轿车。这是一组定类数据,按定义出现次数最多的是小轿车,因此这组数据的众数是“小轿车”。众数是定类数据仅能使用的中心位置特征,但众数也可用于定量数据。例如,对于例3.10中的统计学成绩数据,众数是75和82(都出现4次),可见众数不一定唯一。

下面看一组数据

1,2,3,21,22,23,24,40,40

87

88 虽然按定义,40是这组数据的众数,但明显40不能反映这组数据的中心位置或集中趋势。由于样本观测值出现的随机性,当样本容量较小时,会有上述情形出现。因此,众数更适合于度量分组数据的集中趋势或峰值。单项式分组数据的众数的计算如上,极易求得,下面给出区间式分组数据众数的近似值的计算公式:

首先确定众数所在组,记为m 组,即m f 最大。然后再用比例插值法推算众数的近似值。其计算公式为

下限公式:d a M m o ?+=+-2

11

1??? (4.1)

或,上限公式:d a M m o ?-

=+2

11

???

式中, 1-m a 和m a 分别表示众数所在m 组的下限和上限;

11--=?m m f f 表示众数组次数与前一组次数之差;

12+-=?m m f f 表示众数组次数与后一组次数之差;

1--=m m a a d 表示众数所在组的组距。 读者只需记忆下限公式即可,因为众数的下限公式和上限公式是等价的,即用两个公式计算的结果完全相同,因为

d a d d a d

a d a M m m m m ?-=?-+=?-+=?+=?+???+??-?+??

-?+??-2

12

2122

12

2111110)1(

众数不象平均数,众数(包括分位数)是由位置确定,不必每个数据参与运算,因此不必由组中值替代,而计算结果也不受极端值影

响。

众数的两个计算公式的几何解释,见文献 [11 ]。

例4.1 试计算例3.10中某学院学生的统计成绩分组数据的众数。 解:众数所在组4=m ,即244=f 最大

8031==-a a m 是众数所在组的下限,108090=-=d

2341=-=-=2224f f ?,10542=-=?f f

89

表4.1 统计成绩分组数据

667.8110802

10210211

=?+=?+=∴+?+??

-d a M m 二、中位数

中位数是按大小顺序排列处于中心位置上的值。这一特征不适用于定(性)类数据,因其没有大小顺序。

对于一组n 个定量数据n x x x ,,,21 将其按由小到大的顺序排列为:

()()()n x x x ≤≤≤ 21 则这组数据的中位数(记以e M )由下式给出:

?

?

?

??=++==++)

(22)(12)

1()()1(为偶数时为奇数时k n x x k n x M k k k e (4.2)

这个公式也可以看作是定量数据中位数的定义。

考虑一组数据2,6,3,5,4,排序后为2,3,4,5,6。现在

1225+?==n 是奇数,所以2=k 。按公式算出中为数为

()()431===+x x M k e 再看一组数据8,3,6,7,5,4,排序后为3,4,5,6,7,8,现在326?==n 是偶数,所以3=k 。按公式算出中位数为

()()

()()

5.52

652

2

431=+=+=

+=

+x x x x M k k e

90 这个例子可以看出,偶数个数据没有真正中心位置上的数据,因此采用接近中心位置的两个数据加以折中是合理的,这样,原数据中≤中位数和≥中位数的数据一样多,即原数据除中位数外,按大小被等分为2部分。

有时,还考虑其它分位数,如四分位数(甚至八分位数等),即除分位数外,按大小被等分为4 部分,先将原数据排序并求中位数,中位数左端数据的“中位数”,称为(原数据)的第一四分位数,中位数右端数据的“中位数”,称为(原数据)的第三四分位数,由此可知,中位数就是第二四分位数,第i 四分位数用i Q 表示,其位置大体在

4

n i ?处,数据分组时不区分n 是奇数还是偶数。

例如数据组1,2,3,21,22,23,24,40,40的中位数是22,

第一四分位数是=1Q 2.5,而第三四分位数是=3Q 32。

关于单值式分组,如例3.8(数据见表3.5)中,三口之家的户数最多,因此该例的众数o M =3;由于总户数是158户,而()79x =()80x =3,故中位数e M =3。同理可以确定=1Q 2,=3Q 4。

关于区间式分组数据的四分位数的计算,如同众数的计算,首先确定四分位数所在组m ,然后按比例插值确定四分位数,其一般(下限)公式为

3,2,1,14

1=?-+

=-?-i d

f S a Q m

m n i m i (4.3)

其中4

4

n i j

i f

?=

∑是第i 四分位数大体位置,∑

-=-=1

1

1m j j m f S 是中位数所

在组以前各组的累积频数,其余d a m ,1-的定义同前。

注意到m n

i m S S ≤≤

?-4

1,且将m m m f S S -=-1代入(4.3)

,并仿照众数的上、下限公式的关系,可得分组数据四分位数的上限公式(留

91

作习题):

3,2,1,4

=?-+

=?i d

f S a Q m

m n

i m i

例4.2 试计算例4.1中某学院学生的统计成绩分组数据的各个四分位数。

解:先依次确定各四分位数的所在组,分别在2,3,4组,

70106016

4202

14

11=?+=?-+

=-d f S a Q n (分)

中位数09.7909.970107022

20402=+=?+

==-Q M e (分)

5.785.780108024

24603=+=?+=-Q (分)

计算结果表明约有50%的学生的统计成绩在70~87之间。

三、平均数

1.算术平均数

算术平均数也称均值,是数据集中趋势的最主要的度量。

一组定量数据n x x x ,,21的算术平均数称为数据的均值,记为x ,即

∑=

++=

i n x n

n x x x x 1

21 (4.4)

这是刻画定量数据中心位置最常用的度量。通常所说的平均温度,平

均分数,平均工资等,都指的是这里的均值。

例4.3 用x 表示例3.10中的统计学考试成绩,那里的80=n ,求 得80个分数之和是

62608021=+++x x x 因此它们的均值是

25.7880

6260==

x (分)

92 现在看分组数据如何求均值的问题。先看单值式分组如表4.2 因为在全部数据中每个数据值i x 不止一个而是i f 个,所以这一小组中数据之和应为i i x f ,从而全部数据的总和为

==+++k

i i i k k x f x f x f x f 1

2211

再除以数据的总数

∑=

++=i k f f f f n 21

就得到均值为

∑==+++++=k i i

n f

k

k k x f f f x f x f x f x i 1

212211 (4.5)

这一公式只是前面一般公式在频数分布数据情况下的一种表现形式。这种形式称为加权算术平均值,其中

n

f f f i j

i

=

∑ 是i x ,k i ,,1 =

的权数,本教程也称之为由0≥i f ,k i ,,1 =,生成的一组权数,或由频数生成的频率。

权数(频率)体现了不同数据值在总和所占份额或重要程度的不同。在经济数据分析中不少问题用到加权平均值。例如,股票的综合指数就是一种加权平均值,用它可以表示一个证券交易所所有股票价格的总水平,其中权数可以由各个股票的总股本或流通股本生成,用来体现大小盘股票在全部股票中所占份额的差异。

93

对于区间式分组数据,怎样求均值呢?

现在每个小组中没有具体数据而只有个范围,那么第i 组中的i f 个数据用什么值来计算呢?一种合理的考虑是认为它们均匀地分布在

1-i a 和i a 之间,而以这一区间的中点

2

1i

i i a a m +=

- 作为它们共同的代表。这个i m 称为第i 组的组中值。以i m 代替公式(4.5)中的i x ,就得到了区间式分组情况下计算均值的公式为:

i i n

k

i i n

f f f f m f m f m f m f m x i k

k

k ∑∑

==

=

=+++++1

1

212211 (4.6)

例4.4 对于例4.1中用区间式分组给出的统计学成绩的数据,先求出各组的中值m ,记于表4.4

表4.4 统计学成绩分组数据的平均值计算

这样,数据总和为

94 9514852475226516554=?+?+?+?+?(分)

从而均值为

5.7880

6280==

x (分/人)

这个值与例4.3中的25.78相差很少。应该说,25.78是准确的均值,而5.78只是个近似值。但是,频数分布不仅对数据的表示带来好处,而且也使均值等的计算变得简单。特别是数据总数n 非常大(例如,中国人口13亿)时,用原始数据计算均值的工作量非常庞大,而是用频数分布则异常简单。因此在统计工作中,频数分布人们还是喜欢使用的。

再考虑在线性变换下均值的计算:

b

a m i i y -=,或 a y

b m i i +?= ,K i ,,2,1 = (4.7)

于是 a f y f m f x i n

i i n

b

i i n ∑∑

+==

1

1

a y

b x +?= (4.8)

就得到原数据的均值与新数据均值的关系,显然上式对不分组数据的新旧均值间的关系同样成立。对于本例,取10b 75a ==,,变换后的数据也列于表4.4 ,得到新数据的均值 350y 80

28.==

故a y b x +?==10×0.35+75=78.5(分)

当数据量大,数值也大且需手工计算均值时,这种变换既减少计算量也增加了准确性。

2.几何平均数

对于定量数据有时也采用几何平均数求其平均值,主要用于计算平均发展速度(详见第6章)。几何平均值的定义为;变量X 的n 项观察值n x x x ,,21的乘积的n 次根。这也是一种刻画中心位置的度量。其公式为

95

n n M x x x G ???= 21 (4 .9)

对以上等式的两边取对数,有

())Log()Log()Log(Log 21n n

1M x x x G +++= 因此几何平均数可利用对数来计算。 3.调和平均数

前面介绍了算术平均和几何平均数,都刻画数据的取值的集中趋势,或数据的中心位置。下面再介绍调和平均数,又称“倒数平均的倒数”,它是各个数据(指标值)倒数的平均的倒数。设有单项式分组数据k x x ,,1 ,相应的频数为k f f ,,1 ,由频数构造的权数

n

f f f i i j

i

p =

=

∑(频率),其中∑=j f n ,

则数据的加权调和平均h x 为

=

=∑

=

i

i

i

x f x i

x h f

f

f p x 11

1 (4.10)

如果1f f n === 1,这时得到简单调和平均数 ∑

=∑

=

i

i

x x n

h n

x 1111

(4.11)

在实际数据分析中,直接用调和平均数的时候很少,而往往在计算某些平均时,以调和平均的形式出现。

例4.5 某投资者,在3个不同时间分别以每股6元,5元和4元各购买了6万元的甲股票,如果不计交易成本,求该投资者拥有甲股票的每股平均持仓成本x 。

如果投资者,在3个不同时间分别以每股6元,5元和4元各购买了1.2万股的甲股票,这时该投资者的每股平均持仓成本呢?

解:投资者的投资总额是6+6+6=18(万元) 投资者在3个不同时间购买的甲股票总量是

96

4

60000

560000660000++ 故每股平均持仓成本

865.437000

180********

60000600004

60000

5

600006

60000

==

++++=

x (元 / 股)

对照公式(4.11),其中321,,x x x 分别为3个时期的价格,每股6元, 5元和4元,60000f i ≡股,每股平均持仓成本x ,以调和平均的形式出现。

第2种情况,x = 购买总金额 ÷ 购买总量

=5)(2

.12.12.12.142.152.16=++=

++?+?+?6543

1(元 / 股)

而上式恰是不同时期价格的算术平均。

由于调和平均小于算术平均,投资时不同股价下,购买同样金额的股票,将能降低持仓成本。对于本例,同样18万元前者拥有3.7万股,后者拥有3.6万股。此外,如果3个时期股价差异越大,不同投资策略,持仓成本差异越大(见习题4.2 )

四、各种中心位置之间的相互关系

1.算术平均数、几何平均数和调和平均数三者的关系

例如,有数据4、5、8、10,对其计算三种平均数,得X =6.75,G

X =6.32,h X =5.926。可见,用同一组数据n x x ,,1 计算结果是,

几何平均数大于调和平均数而小于算术平均数,它们的关系用不等式表示为

X X X G h ≤≤ (4.12) 只有当所有变量值都相等时,这三种平均数才相等。

证明:下面对2=n 的情形给出证明(对一般的n 可用数学归纳证明)。设有两个不等的大于零的数值21,X X ,则

(

)02

212122

1≥-+=-X X X X X X

97

212

2

1X X X X ≥+,即G X X ≥ 又

2

1212

1212

X X X X X X X X =

+,即

2

1212

12

X X X X X X ≥

+

2

111

2

1212

221X X X X X X X X ++=

也即h G X X ≥

因此,X X X G h ≤≤成立。

2.算术平均数、众数和中位数三者的关系

当总体的密度曲线是单峰时,大体有3种情况,即对称、右偏和左偏分布,其图形大体如图

图4.1a

对称分布

图4.1 b 右偏分布 图4.1 c 左偏分布

三种中心位置的关系,与总体分布的特征有关,可以分为以下三种表现情况:

(1) 当总体分布呈对称状态时,三者合而为一,即

98 e M M X ==0

(2) 当总体分布呈右偏时,则:X M M e <<0 (3) 当总体分布呈左偏时,则:0M M X e <<

以上第2、3种情况均为总体分布呈非对称状态的偏态情形,这时,三者之间就存在着一定的差别,愈不对称,差别愈大。英国统计学家卡尔·皮尔逊认为,当分布只是适当偏态时,三者之间的数量关系近似为

e M X M X -≈-30 (4.13)

并且,对于分组数据,由于得到的是近似值,以上结论,可能不总成立。

§4.2 数据的分散程度特征

仅有数据的中心位置还不足以较为全面地描述一组数据的规律性,特别是还缺少关于数据的分散程度或变动性的刻画。

例如,有二组数(9.9,10,10.1),(8,10,12)(单位:mm ),分别是两名工人加工的螺钉的直径,加工标准是10 mm ,它们的均值都是10mm ,但甲工人加工的零件都合格,乙工人加工的2个零件是废品,即二组数的分散程度则是不同的,后面的比前面的更为分散,这好比一个人头在冰箱里脚在火炉上。而平均温度“感觉良好”。 分散程度对一组数据也是一个重要的度量。

例如,两种股票五年的年均增长率和最低最高增长率如表4.5

看平均值虽然A 大,但风险也大;B 平均值小但可稳获8%左右。 再比如,工厂生产的毛线衡量其质量的重要指标是均匀程度,而不是它的平均直径。

一个好的衡量一组定量数据分散程度的度量,一般应满足以下三个条件:

99

1.独立于均值,也就是说当所有的数据同时加上或减去一个常数时并不影响到这一度量的值。

2.充分利用全部数据。 3.它既能反映典型情况又便于计算。

下面分别介绍几种衡量数据分散程度的度量,其中最常用的是方差。

一、极差与四分位差

极差又称为全距,它是定义为数据中最大值与最小值之差。极差通常用符号R 表示,对于数据n x x x ,,,21 其公式为:

)m in()m ax (i i x x R -=()()1x x n -= (4.14) 对于上面给的二组数,极差分别为0.2和2,第二组极差大,数据分散。 极差虽然可以简单的衡量数据的离散程度,但是由于它仅决定于两个极端值,而不满足前面所说的条件2,因此显得较为粗糙。

有时也用四分位差,它是两个四分位数之差,以Q.D 表示.其计算公式为

13..Q Q D Q -= (4.15)

对于学生统计学考试成绩的四分位差(见例4.2)为 17.57087.5..13=-=-=Q Q D Q

二、方差和标准差

对于一组数据n x x x ,,,21 ,既然可以用均值x 表示它们的中心位置,那么对每个数据i x 来说,用它与中心x 的距离来衡量它的分散程度就是顺理成章的了。就像一个城市中远离市中心的地方就属于偏远地区。我们称每个数据i x 与均值x 之差x x i -为此数据的离差(deviation )。绝对离差x x i -即是i x 与x 的距离,它就可以用来表示i x 的分散程度。分散程度显然是个整体的概念,如果仅有一个数就无分散可言了。对于全组数据,我们可以将各个距离综合平均,用以衡量平均分散程度,为此我们可以使用平均绝对离差(mean absolute

100 deviation )

∑-=

x x n

MAD i 1 (4.16)

作为一种分散程度的度量。

但是绝对值运算在数学处理上(特别对使用微积分工具)是非常不便的,而不取绝对值又会出现正、负离差相互抵消而不能实现综合。因此人们采用取平方运算代替绝对值,而用平均平方离差,即样本方差

()

2

2

22

x

x x x s

i

n

1i

n

1∑∑-=

-=

(4.17)

因此,“样本方差=平方的平均—平均的平方”。作为衡量一组数据

n x x x ,,,21 的分散程度的度量。取平方运算保证方差值是非负的,使用2s 的记号表示方差意味它的正平方根

()

∑-=

2

x x s i

n

1

(4.18)

是有意义的。我们称s 为样本标准差(standard deviation )。

方差和标准差都可用来衡量分散程度,但在量纲上标准差与原数据一致而方差则不一致。

对同一组数据资料,所求的平均绝对离差要比标准差要小,即AD M σ≤,证明如下:

设X X y i i -=

()

2

2

2

21

22

2

??

????-=

??

????-=

-=∑-∑-∑-∑-∑

n X X n

X X n X X n

X

X i n y

i i i i y

y σ

即0)

(2

2

2≥-=AD M x y

σσ

2

2

)(AD M x ≥∴σ,即AD M σ≤

手工计算方差,采用表格的方式较为方便。下面举一个例子。 例4.6 一组10=n 的数据列于表4.6的第2列,求均值与方差。

解:10个数的和是200,因此算出均值20=x

101

表(4.6)中第3列和第4列是算出的离差及其平方,经累加得到

()∑=-2

x x i

436

从而求得方差为

6.432

=s

标准差为

6.66.43==

s

本例的x 是一整数,手算时如上列表较简单,当原数据是整数,x 是小数点后位数较多的非整数时,可按

2

2

2

x

x s

i

n

1

∑-=

计算方差。

对于单值式频数分布形式的数据,方差的公式是加权平均的形式

()∑

-=

2

2x x f s i i n

1 (4.19)

对于区间式频数分布形式的数据,则以中值i m 代替i x ()∑

-=

2

2x m f s i i n

1 (4.20)

102 再以例4.1中统计学成绩的频数分布数据说明方差的计算。

例4.7 前面已求得5.78=x ,由此算出各组的离差列在表4.7第5列,求其平方列在最后一列。乘频数并求和得到

()∑

=-2

x m f i i 10220

从而算出方差、标准差分别为

75.1272

=÷=8010220s

, 3.1175.127==s

同前作线性变换,a y b m i i +?= ,K i ,,2,1 =,a y b x +?= 于是 ()()∑

+?-+?=-=

2

2

2)

(a y b a y b f x m f s i i n 1

i i n

1

103

()2

y 2i i n 1

s b y b y b f =?-?=∑

2

即在线性变换(4.7)下(加减常数方差不变),样本方差是新数据样本方差的2b 倍。对于本例,取10b 75a ==,,关于新数据350y .=,样本方差的计算列于表4.8(对照表4.4)

, 2775.1=÷=80102.20s 2

y , 131s y .= 75.127.2=?==27751100s 100s

2

y , 11.3s =

三、离散系数

分散与集中是一个问题的两个方面。方差和标准差作为分散程度的度量,如果它的值比较小,仅说明数据是较为集中的,这时均值对数据来说就更具有代表性。

以上计算的各种离散程度的量,包括全距、四分位差、平均差、标准勘都是绝对指标,都与原始数据有相同的计量单位。各种离散程度的数值大小,不仅受离散程度的影响,而且还受数据的量纲与数量级的影响。

例如标准差是有量纲的,如果数据是金额,以万元为单位3=σ,改用元为单位就变成30000=σ ,因此不能简单的根据绝对数值判断它的大小。特别,两组数据间的分散程度,如果量纲或数量级不同,就难以比较了。

离散系数(CV)是一种反映数据分散程度的相对指标,它定义为

x

σ

=

CV (4.21)

这是个无量纲的数。用以反映样本或总体数据的相对离散程度就较为合适了。对于例4.4的统计学成绩,

14.05

.783.11CV ==

看来成绩还是不太分散的。

衡量分散程度的量,一般都是正数,但当原始数据负数较多x <0

时,按(4.21)式计算时离散系数会出现负值,这是不合理的,因此,

104 离散系数的公式应为

x

σ

=

CV

)(4.21

' 例 4.8 有一工程队的两个小组在施工时遇到不同的土层,这两组完成的土方(立方)分别为:

甲组:50,55,60,65,70 乙组:2, 4, 6, 8, 10 由此计算得:甲X =60方,甲σ =7.07方 乙X =6方, 乙

σ=2.83方

若根据甲

σ

>乙σ而断言,甲组离散程度大于乙组,或乙组的平均数代

表性高于甲组,都是不妥的。因为这两组数据的数量级相差悬殊,应

通过其离散系数来比较: 118.060

07.7==

甲CV , 472.06

83.2==乙CV

计算结果表明,乙组离散程度大于大于甲组,或者说,甲组的人均日土方量的代表性强于乙组的代表性。从管理角度看,若象乙组遇到硬土层,施工方法的改进潜力大,将极大提高施工进度。

§4.3 数据的图形特征

数据的中心位置和分散程度固然是数据分布的两个重要特征,但有时要想全面地了解数据的分布特点,还需要知道数据的分布是否对称、偏斜的程度和分布的扁平程度,对于总体而言,指密度曲线的图形特征,对于样本而言,指直方图的特征,因此引入了偏度与峰度对这些分布特征进行描述。

一、偏度

偏度是对分布偏斜方向和程度的一种度量,总体分布的偏斜程度可用总体参数偏态系数来衡量,实际应用中用样本矩作相应估计,其

105

计算公式如下:

()∑-=

3

3

31x x s

n i

α (4.22)

其中上式中的()

∑-=

2

x x s i

n

1,从上式可以判断,当分布完全对称

时3α的分子等于0,则3α等于0;当分布不对称时,正负离差不能抵消,即分子不为0,就形成了正或负的偏态系数,当3α为正时,我们称分布为正偏态或右偏态,反之3α为负时,称分布为负偏态或左偏态。不论正、负哪种偏态,偏态系数的绝对值越大表示偏斜的程度越大,反之偏斜程度越小。

二、峰度

如果某分布与标准正态分布相比较其形状更瘦更高,则称为尖峰分布,反之比正态分布更矮更胖,则称为平峰分布,又称厚尾分布。厚尾分布相对于尖尾分布偏离均值的概率要大些,因此峰度是分布集于均值附近的形状。峰度的高低用总体参数峰度系数来衡量。其样本矩估计的计算公式如下: ()∑-=

4

4

41x x s

n i

α (4.23)

由于标准正态分布的峰度系数为3,因此当某一分布的峰度系数

34

>α时,

称其为尖峰分布;当峰度系数34<α时,称其为平峰分布。 例4.9 今给四组数据都是10=n ,

1 2 3 3 3 3 3 3 4 5 1 1 2 2 2 3 3 4 4 5 1 2 2 3 3 4 4 4 5 5 1 1 2 2 3 3 4 4 5 5

由此算出各组数据的两种系数如下:

03=α,

4.34

=α 28.03=α, 97

.14

106 28

.03-=α,97.14=α

03=α, 7.14=α

由此可知,第一组数据和第四组数据都是对称的,但是第一组数据是尖峰的,而第四组数据是平峰的。同样的第二组数据和第三组数据是不对称的,第二组数据为右偏斜,第三组数据为左偏斜。

综上讨论可知偏度与峰度刻画的是总体分布的图形形状,偏度系数和峰度系数适合于样本容量较大时使用,分组数据时的公式也可类似地写出,此外,还可验证在线性变换下,偏度系数和峰度系数不变。

例4.10 对于统计学成绩的分组数据,计算其偏度系数3α和峰度系数4α。

解:同例4.4的线性变换,新数据的偏度系数和峰度系数分别用3

~α和4

~α表示,计算中间结果列于表4.8,注意到新数据标准差131s y .=,故

3α=197

03

13

1807422.~..3-==

÷-α,4α=17424

13

18051283.~..4==

÷α

计算结果表明统计学成绩是负(左)偏的,平峰的。

例4.1,4.2,4.3分别计算了统计学成绩的众数667.810=M ,中位数09.792==Q M e 和均值5.78=x ,这也验证当分布是左偏时,三个位置参数满足

o e M M x <<

最后,继续例3.14的讨论,计算并分析这段时间内,我国证券投资市场的回报情况。

例4.11 上海证券交易所从1999年5月18日到2005年6月3日,共1454 个交易日的上证指数数据计算的证券市场投资回报率,其分组情况由例3.14给出,按分组数据综合计算着组数据的数据特征。

解:最后确定分11组,区间端点分别是

-5.285,-4.12,-2.955,-1.791,-.626

第四章统计学综合指标课后习题

二、单项选择题 1.加权算术平均数的大小( ) A受各组次数f的影响最大B受各组标志值X的影响最大 C只受各组标志值X的影响D受各组次数f和各组标志值X的共同影响 2,平均数反映了( ) A总体分布的集中趋势B总体中总体单位分布的集中趋势 C总体分布的离散趋势D总体变动的趋势 3.在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数( ) A接近于标志值大的一方B接近于标志值小的一方C不受权数的影响D无法判断4.根据变量数列计算平均数时,在下列哪种情况下,加权算术平均数等于简单算术平均数( ) A各组次数递增B各组次数大致相等C各组次数相等D各组次数不相等 5.已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 6.已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 7.计算平均数的基本要求是所要计算的平均数的总体单位应是( ) A大量的B同质的C差异的D少量的 8,某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是( ) A计划产值B实际产值C工人数D企业数 9.中位数和众数是一种( ) A代表值B常见值C典型值D实际值 10.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( ) A各组的次数必须相等B各组标志值必须相等 C各组标志值在本组内呈均匀分布D各组必须是封闭组 11.四分位数实际上是一种( ) A算术平均数B几何平均数C位置平均数D数值平均数 12.离散趋势指标中,最容易受极端值影响的是( ) A极差B平均差C标准差D标准差系数 13.平均差与标准差的主要区别在于( ) A指标意义不同B计算条件不同C计算结果不同D数学处理方法不同 A 7万元 B 1万元 C 12 万元 D 3万元 15.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( ) A25% B 30% C 40% D 50% 17.方差是数据中各变量值与其算术平均数的( ) A离差绝对值的平均数B离差平方的平均数 C离差平均数的平方D离差平均数的绝对值 18.一组数据的偏态系数为1.3,表明该组数据的分布是( ) AlE态分布B平顶分布C左偏分布D右偏分布 19.当一组数据属于左偏分布时,则( )

《统计学》 第四章 统计综合指标

第四章统计综合指标(一) (一)填空题 1、总量指标是反映社会经济现象的统计指标,其表现形式为绝对数。 2、总量指标按其反映总体的内容不同,分为总体的标志总量和总体单位总量;按其反映的时间状况不同,分为时期结构和时点结构。 反映总体在某一时刻(瞬间)上状况的总量指标称为时点结构,反映总体在一段时期内活动过程的总量指标称为时期结构。 3、相对指标的数值有两种表现形式,一是有名数,二是无名数。 4、某企业中,女职工人数与男职工人数之比为1:3,即女职工占25%,则1:3属于比例相对数,25%属于结构相对数。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、银行系统的年末储蓄存款余额是( D ) A. 时期指标并且是实物指标 B. 时点指标并且是实物指标 C. 时期指标并且是价值指标 D. 时点指标并且是价值指标 2、某企业计划规定本年产值比上年增长4%,实际增长6%,则该企业产值计划完成程度为( B ) A、150% B、101.9% C、66.7% D、无法计算 3、总量指标具有的一个显著特点是( A ) A. 指标数值的大小随总体范围的扩大而增加 B. 指标数值的大小随总体范围的扩大而减少 C. 指标数值的大小随总体范围的减少而增加 D. 指标数值的大小随总体范围的大小没有直接联系 4、在出生婴儿中,男性占53%,女性占47%,这是( D ) A、比例相对指标 B、强度相对指标 C、比较相对指标 D、结构相对指标 5、我国1998年国民经济增长(即国内生产总值为)7.8% ,该指标是( C ) A. 结构相对指标 B. 比例相对指标 C. 动态相对指标 D. 比较相对指标 6、某商店某年第一季度的商品销售额计划为去年同期的110%,实际执行的结果,销售额比去年同期增长24.3%,则该商店的商品销售计划完成程度的算式为( B ) A. 124.3%÷210% B. 124.3%÷110% C. 210%÷124.3 D. 条件不够,无法计算 7、下面属于时点指标的是( A ) A. 商品库存量 B. 商品销售量 C. 婴儿出生数 D. 平均工资 8、将粮食产量与人口数相比得到的人均粮食产量指标是( D ) A、统计平均数 B、结构相对数 C、比较相对数 D、强度相对数 9、某工业企业总产值计划比去年提高8%,实际比去年提高10%,则实际总产值比计划的任务数提高( B ) A. 2% B. 1.85% C. 25% D. 101.85% 10、某企业产值计划完成程度为102%,实际比基期增长12%,则计划规定比基期增长( A ) A. 9.8% B. 10% C. 8.5% D. 6%

统计学第四章答案

五、计算题 1.某企业两个车间的工人生产定额完成情况如下表: .. 从表中看,各个技术级别的工人劳动生产率(人均完成工时定额)都是A车间低于B车间,试问:为什么A车间的平均劳动生产率又会高于B车间呢? 2.在某个核算年度内,两个建筑施工单位采购同一种建筑材料的价格和批量情况如下表。试分别计算两个施工单位的平均采购价格。并从平均数计算的角度说明,为什么两个施工单位的平均采购价格会有差别? .. 3.根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格尔系数)分组后,得到如下的频数分布资料: .. 要求:(1)据资料估计该城市恩格尔系数的中位数和众数,并说明这两个平均数的具体分析意义。(2)利用上表资料,按居民户数加权计算该城市恩格尔系数的算术平均数。

(3)试考虑,上面计算的算术平均数能否说明该城市恩格尔系数的一般水平?为什么? 4.某年某月份甲、乙两农贸市场某农产品价格及成交量、成交额的资料如下: 试问哪一个市场农产品的平均价格高,并说明其原因。 5. 2004年某月份某企业按工人劳动生产率高低分组的生产班组数和产量资料如下:.. 试计算该企业工人平均劳动生产率。 6. 某学院二年级两个班的学生英语统考成绩如下表。要求:(1)分别计算两个班的平均成绩; (2)试比较说明,哪个班的平均成绩更有代表性?哪个班的学生英语水平差距更大?你是用什么指标来说明这些问题的;为什么? .. 7. 利用上题资料,试计算A班成绩分布的极差与平均差,并与标准差的计算结果进行比较,看看三者之间是何种数量关系。 8. 根据某城市居民家计调查结果,将500户居民按年收入水平分组后,分别观察其食品开支占全部消费开支的比重,整理得到如下的复合分组资料,试以恩格尔系数作为考察变量,利用资料(即恩络尔系数)分别计算该变量的总方差,平均组内方差、组间方差,并验证三者之间的数量关式:

统计学综合指标

统计学综合指标 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

第四章 统计综合指标 一、单选题 1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划完成度的( A ) A. % B. 140% C. % D. 2% 2.某月份甲工厂的工人出勤率属于( A ) A. 结构相对数 B. 强度相对数 C. 比例相对数 D. 计划完成相对数 3.按全国人口平均的粮食产量是( B ) A. 平均指标 B. 强度相对指标 C. 比较相对指标 D. 结构相对指标 5.若某总体次数分布呈轻微左偏分布,则有( B )成立。 A. x > e M >o M B. x o M >e M D. x

6.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为5500元,该企业职工消费支出分布属于( A ) A.左偏分布 B.右偏分布 C.对称分布 D.J形分布 7.用组中值代表组内变量值的一般水平有一定的假定性,即( B ) A.各组的次数必须相等 B.变量值在本组内的分布是均匀的 C.组中值能取整数 D.各组必须是封闭组 8.加权算术平均数不但受标志值大小的影响,而且也受标志值出现的次数多少的影响。因此,下列情况中对平均数不发生影响的是( D ) A.标志值比较小而次数较多时 B.标志值较大而次数较小时 C.标志值较大而次数较多时 D.标志值出现的次数相等时 9.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本相同的情况下,计算平均价格可采取的平均数形式是( C ) A.简单算术平均数 B.加权算术平均数 C.简单调和平均数 D.加权调和平均数

统计学第四章课后题及答案解析

第四章 一、单项选择题 1.由反映总体单位某一数量特征的标志值汇总得到的指标是() A.总体单位总量 B.质量指标 C.总体标志总量 D.相对指标 2.各部分所占比重之和等于1或100%的相对数() A.比例相对数B.比较相对数C.结构相对数D.动态相对数 3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为() A.104.76% B.95.45% C.200% D.4.76% 4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度() A.14.5% B.95% C.5% D.114.5% 5.在一个特定总体内,下列说法正确的是( ) A.只存在一个单位总量,但可以同时存在多个标志总量 B.可以存在多个单位总量,但必须只有一个标志总量 C.只能存在一个单位总量和一个标志总量 D.可以存在多个单位总量和多个标志总量 6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是() A.大量的 B.同质的 C.有差异的 D.不同总体的

7.几何平均数的计算适用于求() A.平均速度和平均比率 B.平均增长水平 C.平均发展水平 D.序时平均数 8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是() A.3 B.13 C.7.1 D.7 9.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是() A.方差 B.极差 C.标准差 D.变异系数 10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( ) A.两个总体的标准差应相等 B.两个总体的平均数应相等 C.两个总体的单位数应相等 D.两个总体的离差之和应相等 11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用() A.简单算术平均数 B.加权算术平均数 C.加权调和平均数 D.几何平均数 12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。在对称的钟形分布中() A.算术平均数=中位数=众数 B.算术平均数>中位数>众数 C.算术平均数<中位数<众数 D.中位数>算术平均数>众数 二、多项选择题 1.下列属于时点指标的有() A.某地区人口数B.某地区死亡人口数C.某地区出生人口数

统计学综合指标

第四章统计综合指标 一、单选题 1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划完成度的(A) C.比较相对指标 D.结构相对指标 5.若某总体次数分布呈轻微左偏分布,则有(B)成立。 A.x> M>o M e B.x< M

C.x> M>e M o D.x< M

A.简单算术平均数 B.加权算术平均数 C.简单调和平均数 D.加权调和平均数 10.若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均 A.缩小到原来的1/2 B.缩小到原来的1/4 C.不变 D.不能预期其变化 13.如果单项式分配数列的各个标志值都增加一倍,而频数均减少一

半,那么中位数(A) A.增加一倍 B.减少一半 C.不变 D.不能预期其变化 A.减少 B.增加 C.不变 D.无法确定 19.不同总体间的标准差不能进行简单对比,这是因为(D) 4

A.平均数不一致 B.离散程度不一致 C.总体单位不一致 D.离差平方和不一致 20.两个总体的平均数不等,但标准差相等,则(B) B.0.5 C.0.3 D.0.1 23.如果偏度值a小于零,峰度值β小于3,可判断次数分布曲线为(C) A.左偏分布,呈尖顶峰度

统计学综合指标

第四章 统计综合指标 一、单选题 1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划完成度的( A ) A. 97.9% B. 140% C. 10 2.2% D. 2% 2.某月份甲工厂的工人出勤率属于( A ) A. 结构相对数 B. 强度相对数 C. 比例相对数 D. 计划完成相对数 3.按全国人口平均的粮食产量是( B ) A. 平均指标 B. 强度相对指标 C. 比较相对指标 D. 结构相对指标 5.若某总体次数分布呈轻微左偏分布,则有( B )成立。 A. x > e M >o M B. x o M >e M D. x

6.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为5500元,该企业职工消费支出分布属于( A ) A.左偏分布 B.右偏分布 C.对称分布 D.J形分布 7.用组中值代表组内变量值的一般水平有一定的假定性,即( B ) A.各组的次数必须相等 B.变量值在本组内的分布是均匀的 C.组中值能取整数 D.各组必须是封闭组 8.加权算术平均数不但受标志值大小的影响,而且也受标志值出现的次数多少的影响。因此,下列情况中对平均数不发生影响的是( D ) A.标志值比较小而次数较多时 B.标志值较大而次数较小时 C.标志值较大而次数较多时 D.标志值出现的次数相等时 9.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本相同的情况下,计算平均价格可采取的平均数形式是( C ) A.简单算术平均数 B.加权算术平均数 C.简单调和平均数 D.加权调和平均数 10.若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数( A )

《统计学》_第四章__统计综合指标(补充例题)

第四章统计综合指标 (五)计算题 例1、某集团公司所属各拖拉机厂某月生产情况如下表所示: 厂别类型每台马力数产量(台) 第1厂履带式3675 履带式18105 轮式28400第2厂履带式7585 轮式1594 轮式12150第3厂履带式4540 履带式7525 轮式2450 要求按产品类型和功率核算有关总量指标。 解:【分析】通常总量指标中首选核算实物量。 这里可以核算自然实物量、双重单位实物量和标志单位实物量。 从下面两表看出核算的过程及结果: (1)按自然单位和双重单位核算: 产品类型产量(台)产量(台/马力) 履带式330330/14640 轮式694694/15610 合计10241024/30250(2)按标准单位核算(以15马力拖拉机为标准单位): 产品类型与功率产量(台)换算系数标准台数(1)(2)(3)=(1)÷15(4)=(2)×(3)履带式

18马力105126 36马力75180 45马力40120 75马力110550 小计330—976轮式 12马力150120 15马力9494 24马力5080 28马力400747 小计694—1041合计1024—2017 例2、下面是某市年末户籍人口和土地面积的资料: 单位:人 户籍人口数 2001年2002年 人口总数 男 女1343599 682524 661075 1371588 695762 675826 已知该土地面积1565平方公里,试计算全部可能计算的相对指标,并指出它们属于哪一种相对数。 解:计算结果列表如下: 2001年2002年人口总数13435991371588

男 女 (1)男性人口占总人口比重(%) (2)女性人口占总人口比重(%) (3)性别比例(%)男:女 (4)人口密度(人/平方公里) (5)人口增长速度(%) 682524 661075 103 858 — 695762 675826 102 876 在所计算的相对指标中:(1)、(2)为结构相对数,(3)为比例相对数,(4)为强度相对数,(5)为动态相对数。 例3、某服装公司产量如下: 单位:万件 2002年 2003年 计划 实际 重点企业产量 成人的 儿童的 合计 计算所有可能计算的相对指标,并指出它们属于哪一种相对指标。 解:下面设计一张统计表,把所计算的相对指标反映在表中: 2002年 2003年 2003年比2002 年增长 (%) 产量 比重 (%) 计划 实际 产量计划 完成 (%) 重点企业 产量 比重(%) 产量 比重 (%) 产量 比重 (%) (甲) (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 成人的 儿童的 56 44 61 39 61 39 65 35

统计学综合指标

第四章统计综合指标一、单选题 1?某企业某种产品计划规定单位成本降低 度的(A ) 5%,实际降低了7%,则实际生产成本为计划完成 A.97.9% B.140% C.102.2% D.2% 2?某月份甲工厂的工人出勤率属于(A) A.结构相对数 B.强度相对数 C.比例相对数 D.计划完成相对数 3?按全国人口平均的粮食产量是(B) A.平均指标 B.强度相对指标 C.比较相对指标 D.结构相对指标 5?若某总体次数分布呈轻微左偏分布,则有( B )成立。 A.x > M e> M 0 B.x< M e< M0 C.x> M o> M e D.x

9. 已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本 相同的情况下,计算平均价格可采取的平均数形式是( C ) A. 简单算术平均数 B. 加权算术平均数 C. 简单调和平均数 D. 加权调和平均数 10. 若各个标志值都扩大 2 倍,而频数都减少为原来的 1/3,则平均数( A ) A. 扩大 2 倍 B. 减少到 1/3 C. 不变 D. 不能预期平均值的变化 11. 假定各个标志值都减去 20 个单位,那么平均值就会( A ) A. 减少 20 B. 减少到 1/20 C. 不变 D. 不能预期平均值的变化 12. 如果单项式分配数列的各个标志值和它们的频数都缩小到原来的 1/2 ,那么众数( A ) A. 缩小到原来的 1/2 B. 缩小到原来的 1/4 C. 不变 D. 不能预期其变化 14. 如果变量值中有一项为零,则不能计算( B A. 算术平均数 B. 调和平均数和几何平均数 C. 众数 D. 中位数 15. 计算标准差时,如果从每个变量值中都减去任意数 A. 变大 B. 变小 C. 不变 D. 可能变大也可能变小 16. 假如把分配数列的频数换成频率,则标准差( A. 减少 B. 增加 C. 不变 D. 无法确定 19. 不同总体间的标准差不能进行简单对比,这是因为 A. 平均数不一致 B. 离散程度不一致 13. 如果单项式分配数列的各个标志值都增加一倍, A. 增加一倍 B. 减少一半 C. 不变 D. 不能预期其变化 而频数均减少一半, 那么中位数 ( A ) a,计算结果与原标准差相较(

统计学综合指标

统计学综合指标 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第四章 统计综合指标 一、单选题 1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划完成度的( A ) A. 97.9% B. 140% C. 102.2% D. 2% 2.某月份甲工厂的工人出勤率属于( A ) A. 结构相对数 B. 强度相对数 C. 比例相对数 D. 计划完成相对数 3.按全国人口平均的粮食产量是( B ) A. 平均指标 B. 强度相对指标 C. 比较相对指标 D. 结构相对指标 5.若某总体次数分布呈轻微左偏分布,则有( B )成立。 A. x > e M >o M B. x o M >e M

D. x

统计学统计综合指标补充例题

统计学统计综合指标补充 例题 The latest revision on November 22, 2020

第四章统计综合指标 (五)计算题 例1、某集团公司所属各拖拉机厂某月生产情况如下表所示: 厂别类型每台马力数产量(台)第1厂履带式36 75 履带式18 105 轮式28 400 第2厂履带式75 85 轮式15 94 轮式12 150 第3厂履带式45 40 履带式75 25 轮式24 50 要求按产品类型和功率核算有关总量指标。 解:【分析】通常总量指标中首选核算实物量。 这里可以核算自然实物量、双重单位实物量和标志单位实物量。 从下面两表看出核算的过程及结果: (1)按自然单位和双重单位核算: 产品类型产量(台)产量(台/马力) 履带式330 330/14640 轮式694 694/15610 合计1024 1024/30250 (2)按标准单位核算(以15马力拖拉机为标准单位): 产品类型与功率产量(台)换算系数标准台数(1)(2)(3)=(1)÷15 (4)=(2)× (3) 履带式 18马力105 126 36马力75 180 45马力40 120 75马力110 550 小计330 —976 轮式 12马力150 120 15马力94 94 24马力50 80 28马力400 747 小计694 —1041 合计1024 —2017

例2、下面是某市年末户籍人口和土地面积的资料: 单位:人 户籍人口数 2001年 2002年 人口总数 男 女 1343599 682524 661075 1371588 695762 675826 已知该土地面积1565平方公里,试计算全部可能计算的相对指标,并指出它们属于哪一种相对数。 解:计算结果列表如下: 2001年 2002年 人口总数 男 女 (1)男性人口占总人口比重(%) (2)女性人口占总人口比重(%) (3)性别比例(%)男:女 (4)人口密度(人/平方公 里) (5)人口增长速度(%) 1343599 682524 661075 103 858 — 1371588 695762 675826 102 876 在所计算的相对指标中:(1)、(2)为结构相对数,(3)为比例相对数,(4)为强度相对数,(5)为动态相对数。 例3、某服装公司产量如下: 单位:万件 2002年 2003年 计划 实际 重点企业产量 成人的 儿童的 合计 计算所有可能计算的相对指标,并指出它们属于哪一种相对指标。 解:下面设计一张统计表,把所计算的相对指标反映在表中: 2002年 2003年 2003 年比 2002 年增 长 (%) 产量 比重 (%) 计划 实际 产量计划完成(%) 重点企业 产量 比重(%) 产量 比重(%) 产量 比重(%) (甲) (1) (2) (3) (4) (5) (6) (7) (8) (9) (10 ) 成人 56 61 61 65

《统计学》第四章统计综合指标

《统计学》第四章统计综合指标 第四章统计综合指标(一) (一)填空题 1总量指标是反映社会经济现象的统计指标,其表现形式为 绝对数。 2、总量指标按其反映总体的内容不同, 分为总体的标志总量 和总体单位总量;按其反映的 时间状况不同,分为时期结构和时点结构。 反映总体在某一时刻 (瞬间)上状况的总量指标称为 时点结构,反映总体在一段时期内活 动过程的总量指标称为时期结构。 3、 相对指标的数值有两种表现形式,一是 有名数,二是无名数。 4、 某企业中,女职工人数与男职工人数之比为 1:3,即女职工占25%则1:3属于比例相对 数, 25%属于结构相对数。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、 银行系统的年末储蓄存款余额是 (D ) A. 时期指标并且是实物指标 B. 时点指标并且是实物指标 C. 时期指标并且是价值指标 D.时点指标并且是价值指标 2、 某企业计划规定本年产值比上年增长 4%实际增长 6%则该企业产值计划完成程度为 (B ) A 150% B 、101.9% C 、66.7% D 、无法计算 3、 总量指标具有的一个显著特点是 (A ) A. 指标数值的大小随总体范围的扩大而增加 B. 指标数值的大小随总体范围的扩大而减少 C. 指标数值的大小随总体范围的减少而增加 D. 指标数值的大小随总体范围的大小没有直接联系 4、在出生婴儿中,男性占 53%女性占47%这是( D ) A 、比例相对指标 B 、强度相对指标 C 、比较相对指标 D 、结构相对指标 5、我国1998年国民经济增长(即国内生产总值为) 7.8%,该指标是(C ) A. 结构相对指标 B. 比例相对指标 C. 动态相对指标 D. 比 较相对指标 6、某商店某年第一季度的商品销售额计划为去年同期的 110%实际执行的结果,销售额比 去年同期增长24.3%,则该商店的商品销售计划完成程度的算式为 (B ) A. 124.3% - 210% B. 124.3% - 110% 8、将粮食产量与人口数相比得到的人均粮食产量指标是( D ) A 、统计平均数 B 、结构相对数 C 、比较相对数 9、某工业企业总产值计划比去年提高 8%实际比去年提高10%贝U 实际总产值比计划的任 务数提高(B ) A. 2% B. 1.85% C. 25% D. 101.85% 10、 某企业产值计划完成程度为 102%实际比基期增长12%则计划规定比基期增长(A ) A. 9.8% B. 10% C. 8.5% D. 6% 11、 已知某市有各种经济类型的工业企业 3128个,工业总产值为 210亿元,则在该资料中 总 体标志总量是(C ) C. 210% - 124.3 D. 7、下面属于时点指标的是 A.商品库存量 B. 条件不够,无法计算 (A ) 商品销售量 C. 婴儿出生数 D. 平均工资 D 、强度相对数

统计学综合指标习题

第四章 综合指标 一、单选题 1.某企业某种产品计划规定单位成本降低5%,实际降低了7%,则实际生产成本为计划的( ) A. % B. 140% C. % D. 2% 2.某月份甲工厂的工人出勤率属于( ) A. 结构相对数 B. 强度相对数 C. : D. 比例相对数 E. 计划完成相对数 3.按全国人口平均的粮食产量是( ) A. 平均指标 B. 强度相对指标 C. 比较相对指标 D. 结构相对指标 4.受极大值影响较大的平均数是( ) A. 位置平均数 B. 几何平均数 C. } D. 算术平均数 E. 调和平均数 5.若某总体次数分布呈轻微左偏分布,则有( )成立。 A.x > e M >o M B. x o M >e M D. x

D.各组必须是封闭组 8.加权算术平均数不但受标志值大小的影响,而且也受标志值出现的次数多少的影响。因此,下列情况中对平均数不发生影响的是() A.标志值比较小而次数较多时 B.标志值较大而次数较小时 C.( D.标志值较大而次数较多时 E.标志值出现的次数相等时 9.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本相同的情况下,计算平均价格可采取的平均数形式是() A.简单算术平均数 B.加权算术平均数 C.简单调和平均数 D.加权调和平均数 10.若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数() A.扩大2倍 B.减少到1/3 C.( D.不变 E.不能预期平均值的变化 11.假定各个标志值都减去20个单位,那么平均值就会() A.减少20 B.减少到1/20 C.不变 D.不能预期平均值的变化 12.如果单项式分配数列的各个标志值和它们的频数都缩小到原来的1/2,那么众数() A.缩小到原来的1/2 B.缩小到原来的1/4 C.) D.不变 E.不能预期其变化 13.如果单项式分配数列的各个标志值都增加一倍,而频数均减少一半,那么中位数() A.增加一倍 B.减少一半 C.不变 D.不能预期其变化 14.如果变量值中有一项为零,则不能计算() A.算术平均数 B.调和平均数和几何平均数 C.《 D.众数 E.中位数 15.计算标准差时,如果从每个变量值中都减去任意数a,计算结果与原标准差相较() A.变大

《统计学》 第四章 统计综合指标

第四章统计综合指标(一) (一)填空题 1、总量指标就是反映社会经济现象得统计指标,其表现形式为绝对数。 2、总量指标按其反映总体得内容不同,分为总体得标志总量与总体单位总量;按其反映得时间状况不同,分为时期结构与时点结构。 反映总体在某一时刻(瞬间)上状况得总量指标称为时点结构 ,反映总体在一段时期内活动过程得总量指标称为时期结构。 3、相对指标得数值有两种表现形式,一就是有名数,二就是无名数。 4、某企业中,女职工人数与男职工人数之比为1:3,即女职工占25%,则1:3属于比例相对数,25%属于结构相对数。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、银行系统得年末储蓄存款余额就是( D ) A、时期指标并且就是实物指标 B、时点指标并且就是实物指标 C、时期指标并且就是价值指标 D、时点指标并且就是价值指标 2、某企业计划规定本年产值比上年增长4%,实际增长6%,则该企业产值计划完成程度为( B ) A、150% B、101、9% C、66、7% D、无法计算 3、总量指标具有得一个显著特点就是( A ) A、指标数值得大小随总体范围得扩大而增加 B、指标数值得大小随总体范围得扩大而减少 C、指标数值得大小随总体范围得减少而增加 D、指标数值得大小随总体范围得大小没有直接联系 4、在出生婴儿中,男性占53%,女性占47%,这就是( D ) A、比例相对指标 B、强度相对指标 C、比较相对指标 D、结构相对指标 5、我国1998年国民经济增长(即国内生产总值为)7、8% ,该指标就是( C ) A、结构相对指标 B、比例相对指标 C、动态相对指标 D、比较相对指标 6、某商店某年第一季度得商品销售额计划为去年同期得110%,实际执行得结果,销售额比去年同期增长24、3%,则该商店得商品销售计划完成程度得算式为( B ) A、 124、3%÷210% B、 124、3%÷110% C、 210%÷124、3 D、条件不够,无法计算 7、下面属于时点指标得就是( A ) A、商品库存量 B、商品销售量 C、婴儿出生数 D、平均工资 8、将粮食产量与人口数相比得到得人均粮食产量指标就是( D ) A、统计平均数 B、结构相对数 C、比较相对数 D、强度相对数 9、某工业企业总产值计划比去年提高8%,实际比去年提高10%,则实际总产值比计划得任务数提高( B ) A、 2% B、 1、85% C、 25% D、 101、85% 10、某企业产值计划完成程度为102%,实际比基期增长12%,则计划规定比基期增长( A ) A、 9、8% B、 10% C、 8、5% D、 6% 11、已知某市有各种经济类型得工业企业3128个,工业总产值为210亿元,则在该资料中总体标志总量就是( C ) A、各种经济类型得工业企业共3128个 B、其中国有工业企业所占得百分比 C、工业总产值210亿元 D、平均每个工厂得产值为671万元

统计基础知识第四章综合指标习题及答案(3)说课讲解

第四章综合指标 一、单项选择题 1.按反映的时间状况不同,总量指标可分为( B )(2012年1月) A.时间指标和时点指标 B.时点指标和时期指标 C.时期指标和时间指标 D.实物指标和价值指标 2.计算相对数的平均数时,如果掌握了分子资料而没有掌握分母资料,则应采用( C )(2012年1月) A.算术平均数 B.几何平均数 C.调和平均数 D.算术平均和调和平均都可以 3.某企业今年计划劳动生产率比去年提高10%,而实际却提高了5%,则劳动生产率的计划完成程度为( D )(2011年10月) A.5% B.50% C.-5% D.95.45% 4.某企业计划2008年产值达到5000万元,但实际产值完成了5500万元,则该企业产值计划完成相对指标为( D ) (2011年1月) A.10% B.90.9% C.100% D.110% 5.强度相对指标表现出的两种形式是指( B ) (2011年1月) A.复名数和无名数 B.有名数和无名数 C.复名数和单名数 D.重名数和单名数 6.第一批产品不合格率为1.5%,第二批不合格率为2%,第三批不合格率为4%,第一批产品占总数的40%,第二批占20%,则这三批产品的平均不合格率为( B ) (2011年1月)A.1.5% B.2.6% C.4.5% D.5.1% 7.平均差与标准差的主要区别是( C ) (2010年10) A.意义有本质的不同 B.适用条件不同 C.对离差的数学处理方法不同 D.反映了变异程度的不同 8.某企业计划2008年产值达到5500万元,但实际产值完成了5000万元,则该企业产值计划完成相对指标为( B )(2010年1) A.10% B.90.9% C.100% D.110% 9.第一批产品不合格率为1%,第二批不合格率为1.5%,第三批不合格率为2%,第一批产品占总数的35%,第二批占40%,则这三批产品的平均不合格率为( B )(2010年1) A.1.5% B.1.45% C.4.5% D.5.1%

统计学--第三章综合指标---复习思考题

第三章综合指标 、填空题 1.总量指标按其反映的时间状况不同可以分为指标和 标。 2. 相对指标是不同单位(地区、国家)的同类指标之比。 3. 相对指标是两个性质不同而有联系的指标之比。 4.某企业某年计划增加值达到500万元,实际为550万元,则增加值的计划完成 相对指标为 5.某企业某年计划单位产品成本为40元,实际为45元,则单位产品成本的计划 完成相对指标为 6.某车间5名工人的日产量(件)为10 10 11 12 14,则日产量的中位数 7.市场上某种蔬菜早、中、晚的价格(元)分别为、1、,早、中、晚各买1元, 则平均价格为 8.在两个数列平均水平时, 可以用标准差衡量其变异程度。 9. (X X) 、判断题年我国人口出生数是一个时点指标。(年我国国内生产总值是一个时期指标。 年我国人均国内生产总值是一个平均指标。 4.我国第三产业增加值在国内生产总值所占比重是一个结构相对指标。 5.某企业某年计划劳动生产率比去年提高4%,实际上提高了5%,则劳动生产率的计划完成相对指标为5%/ 4%。( 6.某企业某年计划单位产品成本比去年降低3%,实际上提咼了 %, 则单位产品成本的计划完成相对指标为1+%/1+3%0 ( 7.某车间7名工人的日产量(件)为22 23 24 24 24 25 26,则日产量的众数是24。( 8.三个连续作业车间的废品率分别为% % %,则平均废品率为 V0.5% 0.8% 0.3%。(

C 甲数列的变异程度比乙数列小 D.不能确定两个数列变异程度的大小 9.当 A B 时,则说明A 数列平均数的代表性比B 数列强。( 10. 全距容易受极端值的影响。( 11. 某企业人均增加值是一个强度相对指标。 12. 某企业月末库存额是一个时点指标。 13. 平均指标反映现象的离散程度。( 14. 变异指标反映现象的集中趋势。( 15. 总体中的一部分 数值与另一部分数值之比得到比例相对指标。 ( 16.报告期水平与基期水平之比得到比较相对指标。( 17.总体中的一部分数值与总体数值之比得到结构相对指标。 18.加权算术平均数的大小仅受变量值大小的影响。 ( 19.当两个数列的平均水平 相等时,可以用平均差反映平均水平的代表性。 20.当两个数列的平均水平不相等时,可以用标准差系数反映平均水平的代表性。 三、单项选择题 1?某地区有80万人口,共有8000名医生。平均每个医生要服务 800人,这个指 标是( 2. 某商场某种商品价格第一季度是连续上升的。1月份单价20元,销售额12万 元;2月份单价25元,销售额10万元;3月份单价30元,销售额13万元。则 第一季度的平均单位商品价格为( A.平均指标 B.强度相对指标 C 总量指标 D.比较相对指标 )。 B. 20 12 25 10 30 13 12 10 13 C. ^20 25 30 D 12 10 13 D. 12 卫 13 20 25 30 3. 有甲、乙两个数列,若( )。 A.甲数列的变异程度比乙数列大 B 甲数列的平均数的代表性比乙数列小

统计学第4章综合指标

第四章 综合指标 14、某服装公司产量如下: 单位:万件 2002年 2003年 计划 实际 重点企业产量 成人的 儿童的 6.4 5.1 8.8 5.7 9.4 6.1 4.3 2.3 合计 11.5 14.5 15.5 6.6 计算所有可能计算的相对指标,并指出它们属于哪一种相对指标。 解:下面设计一张统计表,把所计算的相对指标反映在表中: 2002年 2003年 2003年比2002年增长(%) 产量 比重 (%) 计划 实际 产量计划完成(%) 重点企业 产量 比重(%) 产量 比重(%) 产量 比重(%) (甲) (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 成人的 儿童的 6.4 5.1 56 44 8.8 5.7 61 39 9.4 6.1 61 39 106.8 107.0 4.3 2.3 65 35 46.9 19.6 合计 11.5 100 14.5 100 15.5 100 106.9 6.6 100 34.8 所计算的相对指标中(2)、(4)、(6)、(9)均为结构相对数,(7)为计划完成程度相对数,(10)为动态相对数。此外,还可把“成人的”产量与“儿童的”产量对比,计算比例相对数;把重点企业产量与全公司产量对比,计算结构相对数。 15、某工厂1995年上半年计划招待情况如下: 材料 单位 全年进货计划 第一季度进货 第二季度进货

计划 实际 计划 实际 生铁 吨 2000 500 500 600 618 钢铁 吨 1000 250 300 350 300 水泥 吨 500 100 80 200 180 计算和分析: (1) 各季度进货计划完成程度 (2) 上半年进货计划完成情况 (3) 上半年累积计划执行情况 解:1)第一季度进货完成程度 生铁一季度进货完成程度%100%100500500 =?= 钢铁一季度进货完成程度%120%100250300 =?= 水泥一季度进货完成程度%80%100100 80 =?= 第二季度进货完成程度: 生铁第二季度进货完成程度%103%100600618 =?= 钢铁第二季度进货完成程度%7.85%100350300 =?= 水泥第二季度进货完成程度%90%100200 180 =?= 2) 上半年进货完成程度: 生铁上半年进货完成程度%6.101%100600500618 500=?++= 钢铁上半年进货完成程度%100%100350250300 300=?++= 水泥上半年进货完成程度%3.93%100200 100180 80=?++= 3)上半年累积执行情况: 生铁上半年累积执行情况%9.55%1002000 618 500=?+=

统计学基础-第四章--综合指标

统计学基础第四章综合指标 【教学目的】 1.掌握总量指标的概念及其种类 2.掌握相对指标的概念及其计算方法 3.掌握平均指标的概念、特点及其计算方法 4.掌握变异指标的概念及其计算方法 【教学重点】 1.总量指标的概念及其种类 2.相对指标的概念及其计算方法 3.平均指标的概念、特点及其计算方法 4.变异指标的概念及其计算方法 【教学难点】 1.总量指标的分类辨析 2.各种相对指标的区别及其计算方法 3.平均指标的概念、特点的理解,计算方法的运用 4.变异指标的概念的理解,计算方法的运用 【教学时数】 教学学时为14课时 【教学容参考】 第一节总量指标 一、总量指标的意义 总量指标是反映总体的规模、水平的指标,是最基本的指标,又称绝对数。 【案例】 例如,2008年全国社会消费零售总额达到108488亿元;全国固定资产投资总额为172291亿元;全国粮食总产量达到52850万吨。这些指标都属于总量指标。通过上述总量指标数值的大小,就可以对我国社会消费品零售总额、固定资产投资额、粮食总产量等情况有一个直观的认识。总量指标数值的大小随总体围的大小而增加或减少,总体围大,指标数值就大;总体围小,指标数值就小。 有时总量指标也表现为同一总体在不同的时间、空间条件下的差数。 【案例】 2007年我国粮食总产量为50160.3万吨,2008年我国粮食总产量比2007年增加了2689.7万吨,这一增加量也是总量指标。总量指标作为增加量时,其数值表现为正值;作为减少量时,其数值表现为负值。 总量指标是我们认识社会经济现象的起点。了解现象的基本情况一般先从总量开始。 【案例】 要了解2008年省文化事业基本情况,通过明晰下列总量指标即可:年末全省共有艺术表演团体65个,文化馆、艺术馆123个,公共图书馆128个,博物馆37个,档案馆153个。全年出版报纸123种,出版量19.1亿份;出版杂志324种,出版量0.8亿册;出版图书8884种,出版量1.7亿册。年末有广播电台15座,电视台16座,有线电视用户680.8万户,比上年增加86.2万户,其中,数字电视用户166.5万户,比上年增加62.1万户。同时,总量指标也是计算其他指标的基础,相对指标和平均指标都是以总量指标为基础派生的指标。 【能力训练】 (1)你认为总量指标的意义主要体现在哪里?

相关文档
相关文档 最新文档