文档库 最新最全的文档下载
当前位置:文档库 › 空间统计学

空间统计学

空间统计学
空间统计学

Statistics for spatial data; Noel A.C. Cressie, Wiley& Sons,1991

空间统计学 0 引言 0.1定义

空间统计学由于许多学科的需求发展迅速。

空间统计学涉及的领域:生物学、空间经济学、遥感科学、图像处理、环境与地球科学( 大地测量、地球物理、空间物理、大气科学等等)、生态学、地理学、流行病学、农业经济学、林学及其它学科

空间过程或随机场定义:

{}(),Z s s =∈Z S (1) 式中S 是空间位置s 的集合,可以是预先确定的,也可以随机的,2d d ?=S R 是二维欧

氏空间;()Z s 取值于状态空E 。 空时过程:如考虑时间,则

{}

(,),,(,)d Z s t s s t +

=∈∈?Z S R R

式中S 是空间位置s 的集合,可以是预先确定的,也可以随机的;t +

∈R ;()Z s 取值于状态空E 。

注意:上述为标量值过程,但也可扩展为向量过程。 0.2 空间数据类型

0.2.1 连续型地学统计数据(Geostatistical data ) 此时, 2d

d ?=S R 是连续欧氏子空间,即连续点的集合,随机场{}

(),Z s s ∈S 在实值空间E 上的n 个固定位置n s s s ,,,21 取值。如图为连续型空间数据

(a )降雨量分布图;(b) 土壤孔穴分布图。(符号大小正比于属性变量值)

Geostatistical (spatial) data is usually processed by the geostatistical method that has been set out in considerable detail since Krige published his important paper. In summary, this method consists of an exploratory spatial data analysis, positing a model of (non-stationary) mean plus ( intrinsically stationary) error, non-parametrically estimating variogram or covariogram, fitting a valid model to the estimate, and kriging ( predicting )unobserved parts from the available data. This last step yields not only a predictor, but a mean squared prediction error.

0.2.2 离散型格网数据(Lattice data )

此时, 2d

d ?=S R 是固定的离散空间点,非随机点集合,随机场{}(),Z s s ∈S 在

2d

d ?=S R 的空间点采样。空间点可以是给定邻接图关系、表示成网状的地理区域,

如图2-a 。()Z s 是在s 观测的某种感兴趣的值状态空间可以是、也可以不是实值的,比如GDP 、工业产值、农业产值、房产价格;在遥感图像分析领域,空间点就是规则的像元(pixel)集合图2-b 。

Goals for these types of data includes constructing and analyzing explicative models, quantifying spatial correlations, classification, segmentation, prediction and image restoration

(a) A 型血人口百分比分布图;(b) 256*256 相元灰度分布图

0.2.3 点数据(point data )

此时, 观测位置(sites)的集合, 12(,,,)

n x x x =x ,d i x ∈?S R 是随机的, 观测位置

(sites)的个数()n n =x 也是随机的; x 是空间点过程在窗口S 的观测结果。如果在每个位置i x 记录一个值,则称过程为一个记号或标志过程(marked process )

。 如图3-a 所示,在显微镜下看到的一个组织切片(histological section )的细胞中心位置;如图3-b 所示,森林中松树的位置和大小(直径)

(a )组织切片细胞中心分布;(b ) 松树位置和直径大小分布

1 Second-order spatial models and geostatistics 1.1 随机过程背景知识 定义1.1. 随机过程

随机过程是在状态空间E 中取值的一族随机变量{}(),Z Z s s S =∈,S 是空间位置s 的集合。

定义1.2. 二阶过程

对所有s S ∈,如果2(())E Z s <∞ ,则Z 是一二阶过程。均值是从S 到R 的映射,即

()(())m s E Z s =。对所有 (,)s t S S ∈?, Z 的协方差是函数 :c S S R ?→,即(,)((),())

c s t C o v Z s Z t =。 非负定:1

11

(())()(,)0m

m m

T

i i i j i j i i j Var a Z s Var a a c s s =====≥∑∑∑a Z

正定:1

11

(()()(,)0m

m m

T

i i i j i j i i j Var a Z s Var a a c s s =====>∑∑∑a Z

定义1.3. 高斯过程(正态过程)

如果随机过程{}(),Z Z s s S =∈是一高斯过程,则1()m

i i i a Z s =∑是高斯随机变量,

12((),(),,())T m Z s Z s Z s =Z ,12()((()),(()),,(()))T m E E Z s E Z s E Z s ==m Z ,是随

机向量,方差协方差为((,))i j m m c s s ?=Z Σ,概率密度为

1/2

/211

()(2)exp(2()())m T f π----=---Z

Z Z ΣZ m ΣZ m

一维布朗运动:(0)0Z =,()()~(0,),0Z t Z s N t s t s -->≥,对disjoint interval,是一独立增量过程,协方差((),())min(,)Cov Z t Z s t s =。 可以扩展到二维:

1.2 平稳过程

1.2.1 定义

定义1.4 二阶平稳过程

常数均值,协方差满足平移不变性,即 期望:()(())m s E Z s ==constant

协方差:((),())((),())()Cov Z t h Z s h Cov Z t Z s c s t ++==-

相关函数:()()/(0)h c h c ρ=

定义1.5 Isotropic covariance

对任意两点,s t S ∈,((),())Cov Z s Z t 仅依赖于s t -,而与位置和方向无关。 1.3 Intrinsic processes and variograms 1.3.1 定义

定义1.6 Intrinsic processes

对每个h S ∈,{}()():,Z Z +-∈s h s s h S 是二阶平稳过程,则{}(),Z Z =∈s s S 是一内蕴过程,其半变异函数( semi-variogram) 为

2()var(()())h Z Z γ=+-s h s ,h =h

条件负定性:给定1

0m i i a ==∑ ,有11

(,)0m m

i j i j i j a a s s γ==<∑∑ 。

Proof

1

11

1111

11(()()(,)(0)(,)(,)0

m

m m

T

i i i j i j i i j m m

m m

i j i j i j i j i j m m

i j i j i j Var a Z s Var a a c s s c a a a a s s a a s s γγ===========∑∑∑=-∑∑∑∑=->∑∑a Z

1.3.2 Variogram for stationary processes

具有协方差的平稳随机过程()Z s ,也为具有变异函数的内蕴过程,满足

2()2((0)())C C γ=-h h

性质:0

lim ()(0)C γ→=h h ,0

lim ()0C →=h h ,(0)var(())sill C Z ==s

如果()Z s 是具有γ的内蕴过程,()εs 是具有方差2

σ的独立白噪声过程,则随机过程

()()()Y Z ε=+s s s 满足:

22()2((0)())Y Y Y h C C h γσ=--=ε,

()εs 称为具有方差2

σ的块金效应。

变程(Range ):()(0)r a n g e s i l l C γ==;()0C range =

二阶平稳过程的统计方法既可以用协方差,也可以用变异函数。Geostatistics 喜欢后者;

统计学家喜欢前者。

图1.1-a 是有块金效应的变异函数图;图1.1-b 是无块金效应时的变异函数图。

1.3.3 Examples of covariance and variogram Isotropic variograms 变异函数 常用模型: 块金效应(Nugget effect ):

222(;),0;(;)0,for otherwise γσσγσ=>=h h h

指数(Exponential): {}

22

(;,)1exp(/)a a γσσ=--h h

球状(Spherical): {}232

21.5/0.5(/),(;)a a if a

if a σγσσ?-<=?>?

h h h h h

-广义指数(generalized exponential ): {}

22(;,)1exp((/))a a α

γσσ=--h h

-马特龙(Matern ): {

}

122

2

(;,,)1(/)(/)a a a ν

ννγσνσκ-=-h h h ,(/)a νκh 是改进白

塞尔函数,1(2;227;200)ν

>-

幂函数(power ):(;

,)c

bc b γ=h h

如果空间过程是k 个不相关的内蕴过程的和,则该过程是一嵌套过程,有

1

1

2()2(),()()k k

j j j j C C γγ====∑∑h h h h

1.3.4 Anisotropy( 各向异性)

上节所讲变异函数与空间位置与方向无关,本节与方向有关,与位置无关,即

()v a r (()(

h Z h Z γ=+-e s e s 式中1=e 是单位方向向量,当方向不同时,函数不同。

几何各向异性(Geometric anisotropy ):由各向同性模型0()γh (平面上为一等值圆)变形而来,即

1/200()()(())T T γγγ==h Ah h A Ah

式中A 为与方向有关的变形矩阵。平面上为一等值椭圆,如图1.4-a

1.5 Spatial modeling using convolution( 用卷积方法建立空间过程模型) 1.5.1 连续卷积 1.5.2 离散卷积

1.6 Spatio-temporal models ( 空时模型)

设{}

(,),,,(,)d d Z s t s t s t ++

=∈?∈∈?Z S R R R R 是实值随机过程,S 表空间,t 表时间,

Z 是二阶平稳过程,协方差为

112212121212((,),(,))(,)(,)Cov Z t Z t C t t C t t =--=--s s s s s s

可分形式

(a) Additive :(,)()()S T C s t C s C t =+, Separable space +time covariance (b) Factorizing: (,)()()S T C s t C s C t =, Separable space ? time covariance 可分乘积形式:

随机过程空时采样格式: 1212(,,,)(,,,)n m S T s s s t t t ?=? , 112

1112((,),(,),,(,),,(,),(,),,(,))

T

n m m

n

m Z s t Z s t Z s t Z s t Z s t Z s

t =Z 协方差矩阵:ov()C =ΣZ 。根据(b) 的可分形式,有

{}ov()(,)T S

T S mn mn

C C k l ?==⊕=ΣZ ΣΣΣ,

式中((,))T T m m C k l ?=Σ,((,))S S n n C k l ?=Σ

不可分形式

1.7 Spatial autoregressive models ( 空间自回归模型) 1.7.1 平稳 MA 和ARMA

MA 模型:由一维时间序列扩展而成,与时间序列类似,只是将时间维换成位置向量,空间d

R 取自然整数格网,即(,1,0,1,)d d R =- 。

()d

s R

Z c η-∈=∑s t s t 是无穷滑动平均过程

式中,(,1,0,1,)d d R ∈=-t s ,η是独立白噪声过程,方差为2

ησ,过程的协方差及

其谱密度分别为

2()d R

C c c ησ+∈=∑t t h t h

2

22

(2)(2)()T T d d d d

d

i i R R

R

f c c e

c e

η

η

σσππ+∈∈∈==∑∑∑u t

u t

t t h t h t t u

ARMA 模型:由一维时间序列扩展而成,将时间换成位置向量。

()()d d

N

M

Z a Z c ηη-∈∈=-++∑∑s t s t s s s t t s

式中(,1,0,1,)d d R ∈=-t ,,(,1,0,1,)d d d d

N M R ?=- 是ARMA 的支撑。等价地:

(,1,0,1,),()()()d d R P B Z Q B η?∈=-=t t t

式中()1,()1,d

d

s

s

d

s s s N s M P z a z Q z c z z C ∈∈=-=+∈∑∑是d 维复值变量。

谱密度:

因为:11()()()()()d

s s

s R Z P B Q B P z Q z c z η--∈==∑t

t

协方差函数的谱密度为:222

2

(2)(2)()()T

d

d

d

Q i i s P

s R f c e

e η

η

σσππ∈=

=∑u s

u

u

1.7.2 Stationary simultaneous autogression( 平稳同时发生自回归)SAR 模型

()()d

N

Z a Z η∈=-+∑s t s t t s ,≠s 0

纵坐标是时间轴,横坐标是空间轴 图1.6 (a)Semi-causal space-time models

(,)(,1)((1,)(1,))(,)Z s t Z s t Z s t Z s t s t αβε=-+-+++ 图(b)

220

(,)2(1,)(2,)(1,1)(1)(,1)(,)

j j Z s t Z s t Z s t Z s t Z s j t s t δδδδδδε≥=-+----+-+-+∑(c)Isotropic four nearest neighbor SAR models on grid network (一阶四邻域)

(,)((1,)(1,)(,1)(,1))(,)Z s t Z s t Z s t Z s t Z s t s t αε=-+++-+++

(d )二阶8邻域:加上四个对角

Factorizing SAR (1) models

(,)(1,)(,1)(1,1))(,),1Z s t Z s t Z s t Z s t s t and αβαβεαβ=-+----+<

上式等价于: 12(1)(1)(,)(,)B B Z s t s t αβε--=,12,B B 是延迟算子

(,)Z s t 的可分协方差为:2(,)s s t t C s s t t σαβ''

--''--=, 222121(1)(1)εσσαβ--=--

1.7.3

Stationary conditional autoregression (CAR )

{}(),(,1,0,1,)d d

Z R =∈=-Z s s

是一中心化

(零均值)二阶平稳过程,谱密度为f ,如果1

1((,1,0,1,))d f

L -∈- ,Z 有无穷非因果线性表达式: {}

\()()d R Z c Z e ∈=

-+∑s t s 0t t s

式中s s c c -=,e t 是条件残差,即对≠s t , cov(,())0e Z =t s , ()0E e =t

例:22()(2)()()(2)s s s s Z c Z c Z c Z c Z e --=++-+++++t t t s t s t s t s ,22,s s s s c c c c --==

SAR 和CAR 的区别: 1、 系数对称约束,s s c c -=

2、 e t 并不要求白噪声,一般为有色噪声(相关)

3、 对≠s t ,cov(,())0e Z =t s

例子: 如图1.7-(a)

1、Causal AR model:

{}

(,)(1,)(,1)(,)

(1,0),(0,1)Z s t Z s t Z s t s t R αβε=-+-+=

{}1,00,11,12222221,00,11,12221

(,)(1,)(,1)(1,1)(,)

(1,0),(0,1),(1,1),,,(1)e Z s t c Z s t c Z s t c Z s t s t L c c c εεακβκαβκσκσκαβ-+--=-+-++-+=-===-==++ 2、如图1.7-(b)

{}

(,)((1,)(1,))((,1)(,1))(,)

(1,0),(1,0),(0,1),(0,1)Z s t a Z s t Z s t b Z s t Z s t s t R ε=-+++-+++=--

{}

1,00,12,00,21,11,1222222221,00,12,00,21,11,1(,)(1,)(,1)(2,)(,2)(1,1)(1,1)(,)

(1,0),(2,0),(1,1),(0,1),(0,2),(1,1)2,2,2,2,2,e Z s t c Z s t c Z s t c Z s t c Z s t c Z s t c Z s t s t L c a c b c a c b c c ab εκκκκκσκ-+-=-+-+-+-++-+--+=-======-=222221

(122)a b εσκ-=++

1.7.4

有限网络上非平稳自回归模型

有限网点{}1,2,,S n = ,*

n

R ∈X 随机向量,

**(),E ==-X μX X μ, *()()Cov Cov ==ΣX X

1(()),n t t S ε?=∈ε,()Cov =εΓ

MA : ,(),,T t s

s t S X t b or ε∈===∑X B εΣB ΓB

AR :11,:()(),,()T t s t s S s t

X t a X s or

ε--∈≠=+==∑AX εΣA ΓA

ARMA :11,,:()(),,()T t s t s s s S s t

t S

X t a X s b or

ε--∈≠∈=+==∑∑AX B εΣA B ΓA B

Local one-parameter SAR representation

,:()(),t s t s S s t

X t w X s or

ρερ∈≠=+=+∑X WX ε

式中,,()t s t s S w ∈=W 可以是空间邻接权矩阵,由元素1和零组成。 Markov CAR representation ,:()()t s t s S s t

X t c X s e ∈≠=+∑

2()0,()0,((),)0t t t s E e Var e Cov X t e with s t σ==>=≠

=+X CX e

2

1()()()

((()))(())

()()()T T T i i i i E E E diag E e X i diag E e e diag σ-=+=+=+=+=-==-XX C XX eX ΣC ΣΣC ΣΣC ΣD

D I C ΣD ΣI C D

Markov Gaussian random fields

~(,)N Z μΣ

我们总可以将()Z t 排第一,\t S t ?=,即

1,,,,,()t t

t t s t n n t t t t q

q -???????

===????

q Q Σq q ((),)T T

t Z t ?=Z Z ,(1)1((),,)t n Z s s t s S ?-?=≠∈Z

条件分布为:

1(()/)exp((()(()/))(()/)(()(()/)))T t t t t f Z t Z t E Z t D Z t Z t E Z t -????∝---Z Z Z Z 11,,1,,(()/))((),)()(())

(())

(())

t t t t t t t t t t t t t t t t t s s s t

E Z t Cov Z t Var E q E q q Z s μμμμ-?????-???-≠=+-=--=--∑Z Z Z Z Z q Z Z 1,(()/)(()/)t t t t Var Z t D Z t q -??==Z Z =

,11,,()(()),()t t t t t t s s t t s t

Z t q q Z s e Var e q μμ--≠-=--+=∑

1.7.5

具有协变量的自回归模型

ργ=+++X WX Z βWZ ε

Kyriakidis, P.C., Journel, A.G.: Geostatistical space-time models: a review. Mathematical Geology 31, 651–684 (1999)

Kolovos, A., Christakos, G ., Hristopulos, D.T., Serre, M.L.: Methods for generating nonseparable spatiotemporal covariance models with potential environmental applications. Advances in Water Resources 27, 815–830 (2004)

Le, N.D., Zidek, J.V.: Statistical Analysis of Environmental Space-Time Processes. Springer, New York (2006) Mardia, K.V., Goodall, C., Redfern, E.J., Alonso, F.J.: The Kriged Kalman filter (with discussion).Test 7, 217–252 (1998)

Jones, R., Zhang, Y.: Models for continuous stationary space-time processes. In: T.G. Gregoire, D.R. Brillinger, P.J. Diggle, E. Russek-Cohen, W.G. Warren, R.D. Wolfinger (eds.)Modelling Longitudinal and Spatially Correlated Data, Lecture Notes in Statistics 122, pp. 289–298. Springer, New York (1997)

Higdon, D.: Space and space-time modeling using process convolutions. In: C. Anderson,

V. Barnett, P.C. Chatwin, A. El-Shaarawi (eds.) Quantitative Methods for Current Environmental Issues, pp. 37–56. Springer-Verlag, London (2002)

Stroud, J.R., Müller, P., Sansó, B.: Dynamic models for spatio-temporal data. Journal of the Royal Statistical Society, Series B 63, 673–689 (2001)

Wikle, C.K., Cressie, N.A.C.: A dimension-reduced approach to space-time Kalman filtering. Biometrika 86, 815–829 (1999)

Higdon, D.: Space and space-time modeling using process convolutions. In: C. Anderson, V. Barnett, P.C. Chatwin, A. El-Shaarawi (eds.) Quantitative Methods for Current Environmental Issues, pp. 37–56. Springer-Verlag, London (2002) Gneiting, T., Genton, M.G., Guttorp, P.: Geostatistical space-time models, stationarity, separability

and full symmetry. In: B. Finkenstadt, L. Held, V. Isham (eds.) Statistical Methods for Spatio-Temporal Systems, pp. 151–175. Chapman & Hall/CRC, Boca Raton: FL (2007)

Brown, P.E., K?resen, K.F., Roberts, G.O., Tonellato, S.: Blur-generated non-separable space-time models. Journal of the Royal Statistical Society, Series B 62, 847–860 (2000)

Cressie, N.A.C., Huang, H.C.: Classes of nonseparable, spatio-temporal stationary covariance functions. Journal of the American Statistical Association 94, 1330–1340 (1999)

Gneiting, T.: Nonseparable, stationary covariance functions for space-time data. Journal of the American Statistical Association 97, 590–600 (2002)

E., P.P., Deutsch, S.J.: Identification and interpretation of first order space-time arma models.Technometrics 22, 397–408 (1980)

Pfeifer, P.E., Deutsch, S.J.: A three-stage iterative procedure for space-time modeling. Technometrics 22, 93–117 (1980)

统计学原理 - 1

文案大全 1某公司48名工人某年月平均生活费支出(元)如下,试根据此资料编制组距式分布数列。并绘制直方图。 352、312、336、257、408、321、234、268、204、358、270、466、328、347、369、349、397、386、318、382、430、300、484、289、523、476、315、377、294、458、326、365、492、209、446、446、302、277、548、334、400、424、282、308、371、363、337、302 解:统计分组 (1)组数7lg 322.31log log 12 10 N 10 ≈+=+=N K (2)507 204548=-== K R d (3)确定组限 最小组的下限从最小值204向下延伸4个单位确定为200,最高组的上限从最大值548向上延伸2个单位确定为550. (4)计算各组次数或频率形成分布数列

直方图略 2、试根据如下资料绘制茎叶图。 72、75、60、52、65、90、95、85、76、86 92、63、75、53、87、77、69、85、86、64 63、66、71、78、84、98、79、62、57、76 茎叶 5 2 3 7 6 0 2 3 3 4 5 6 9 7 1 2 5 5 6 6 7 8 9 8 4 5 5 6 6 7 9 0 2 5 8 文案大全

文案大全 3、算术平均数、中位数和众数三者之间有何关系? (1)如果数据的分布是对称的,则众数、中位数、和均值完全相等O e M M X == (2)如果数据是左偏分布O e M M X << (3)如果数据是右偏分布O e M M X >> (4)当数据分布的偏斜程度不是很大时,算术平均数到众数的距离是算术平均数到中位数距离的3倍。即: )(3e o M X M X -=- 4、选择题 (1)不同数列的标准差不能简单进行对比,这是因为不同数列的(A ,D ) A 平均数不同 B 标准差不同 C 个体数不同 D 计量单位不同 (2)某居民区家庭人口数的分布资料如下: 家庭人口数(人) 1 2 3 4 5 6 7 户 数(户) 10 50 80 60 30 20 10 该居民区家庭人口数的中位数是:(C) A 130户 B 130.5户 C 3人 D 4人

统计学期末试卷与答案

2014统计学试卷与答案 一、填空题(每空1分,计10分) 1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。 2、无论采用何种调查方法进行调查,首先都要制定 。 3、质量指标是反映 的指标。 4、8名队员的身高(单位:CM )由低到高排序为: 181,182,182,183,184,185,186,186,身高的中位数是 CM 。 5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。 6、变量之间完全相关,则其相关系数为 。 7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。(上升,不变,下降)。 8、回归分析中OLS (普通最小二乘法)的原理是 。 9、编制综合指数的特点是 。 10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。 二、判断题(每题1分,计10分,请填入“√”或“?”) (× )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来; ( ×)2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确; ( × )3、凡是离散型变量都适合编制单项式数列; ( × )4、任何变量数列都存在众数; ( √)5、如果o e m m x <<,则变量分布为左偏; ( ×)6、判定系数越大,估计标准误就越大; ( ×)7、正相关是指两个变量的数量变动方向都是上升的; ( √ )8、统计的本质就是关于为何统计,统计什么和如何统计的思想; ( × )9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列; ( √ )10、同度量因素在起到同度量的同时,还具有一定的权数作用。 三、单项选择题(每题1分,计10分)

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学原理简答题答案

《统计学原理》简答题答案 第一章总论 1.统计一词有几种含义?它们之间的关系? 答:三种。统计工作、统计资料、统计学。 (1)统计工作:即统计实践活动,是指从事统计业务的机关、单位利用科学的统计方法,搜集、整理分析和提供有关客观现象的数据资料、研究数据的内在特征,并预测事物的发展方向等一系列工作过程的总称。 (2)统计资料:是统计实践过程的取得的各项数据资料以及和它相联系的其他资料的总称。 (3)统计学:统计工作和统计资料的关系是统计活动即过程和统计成果的关系,统计工作和统计学的关系是统计实践和统计理论的关系 2.社会经济统计的特点有哪些? 答:社会经济统计是社会现象的一种调查分析活动,它具有以下特点: a)数量性 b)总体性 c)变异性 d)社会性 3.什么是统计总体、统计单位、标志、变异、变量和变量值?并举例说明。答:(1)统计总体,简称总体,是指客观存在的在同一性质基础上结合起来的许多个别事物的整体。例如,研究某班学生的情况时,该班全体学生就是一个统计总体。 (2)统计单位,是指构成统计总体的个别事物。例如,以我国全部普通高等院校为总体,每一个普通高等院校就是总体单位。 (3)标志,是指总体单位所共同具有的某种属性或特征。例如,工人作为总体单位,他们都具备性别、工种、文化程度、工会、工资等属性或特征。 (4)变异是变动的标志,具体表现在各个单位的差异,包括量(数值)的变异和质(性质、属性)的变异。如:性别表现为男、女,这是属性变异;年龄表现为18岁、25岁、28岁等这是数值上的变异。 (5)变量,就是可变的数量标志。例如,商业企业的职工人数、商品流转额、流动资金占用额等数量标志,在各个商业企业的具体表现都是不尽相同的,是一个变动的量,这些变动的数量标志就称作变量。 (6)变量值,就是变量的具体表现,也就是变动的数量标志的具体表现。例如,企业的职工人数是一个变量,甲企业职工人数100人,乙企业职工人数150人,丙企业职工人数200人等等,100人、150人、200人都是职工人数这个变量的变量值(标志值)。 4.总体好和总体单位有什么关系? 答:总体和总体单位是相对而言的。随着研究目的和范围的变化,同一事物在不同的情况下可以是总体单位,也可以转化为总体

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

大学统计学试卷及答案3套

2011年12月考试统计学第一次作业 一、单项选择题(本大题共45分,共 15 小题,每小题 3 分) 1. 对单项数列,其满足左偏斜分布时有( )。(X为均值) A. B. C. D. 2. 报告期总量加权的平均指数在计算形式上主要采取() A. 综合指数形式 B. 算术平均形式 C. 调和平均形式 D. 固定构成指数形式 3. 红星企业的2010年的产值比去年上升了8%,则8%为() A. 平均数指标 B. 总量指标 C. 相对数指标 D. 离散指标 4. 对某种连续生产的产品进行质量检验,要求每隔一小时抽出10钟的产品进 行检验,这种抽查方式是() A. 简单随机抽样 B. 类型抽样 C. 整群抽样 D. 等距抽样 5. 若销售量增加,销售额不变,则物价指数() A. 降低 B. 升高 C. 不变 D. 无法确定 6. 某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择() A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 7. 根据各年的月份资料计算的季节指数其平均数为() A. 100% B. 1200% C. 120% D. 400% 8. 直接反映总体规模大小的指标是() A. 平均指标 B. 相对指标 C. 总量 指标 D. 变异指标 9. 说明回归直线拟合程度的统计量主要是() A. 相关系数 B. 回归系数 C. 判定系数 D. 估计标准误差 10. 如果调查对象之中包含的单位很多,而且缺少原始记录可供参考,这种情 况应用() A. 抽样调查 B. 重点调查 C. 普查 D. 统计报表 11. 某连续性变量的分组中,其末组为开口组,下限为200,又知其邻组的组 中值为170,则末组的组中值为()。 A. 260 B. 215 C. 230 D. 185 12. 当已知时,总体均值μ的1- 置信水平下的置信区间为()。 A. B. C. D. 13. 计算平均指标时,最常用的方法和最基本的形式是()。 A. 中位数 B. 众数 C. 调和平均数 D. 算术平均数 14. 若已知是的3倍,

华南理工 2016网络统计学原理随堂练习(全对版)

统计学随堂练习题 第一章统计学概述 判断题 1.统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。√ 2.描述统计学是研究如何根据样本数据去推断通体数量特征的方法。× 3.描述统计学是整个统计学的基础,推断统计学是现代统计学的主要内容。√ 4.推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。 5.统计数据的计量尺度分为定类尺度、定序尺度、定距尺度和定比尺度。√ 6.定量数据说明的是现象的数量特征,是能够用数值来表现。√ 7.定性数据说明的是现象的品质特征,是不能用数值来表现。√ 8.统计指标表现为绝对数、相对数和平均数三种形式。√ 9.产品产量是时期数。√ 10.股票价格是时点数。√ 11.考试成绩分为优、良、中、及格、不及格,这是按定类尺度划分的。× 12.考试成绩用“百分制”度量,这是按定比尺度划分的。× 13.将全部人口分为男女两部分,男性所占比重就是比率相对数。× 14.动态数列就是将某同时期的各指标数值按照组别进行排序得到的数列。× 15.“企业数”、“年龄”都是离散变量。× 16.“性别”、“产品等级”属于数量变量。×

17.数据的加工处理方法、数据分布特征的概括与分析方法等属于描述统计学的内容。√ 18.人的身高、体重、机器设备台数等都是连续变量。× 19.离散变量的变量值只能按整数计算,不可能有小数。× 20.价值单位是以货币形式对现象进行度量,如国民生产总值、商品销售额等。√第二章数据的收集和整理 判断题 1.统计数据的直接来源主要有专门组织的调查和科学试验两个渠道。√ 2.由《中国统计年鉴》获得的数据属于直接的统计数据。×√ 3.普查具有调查费用低、时效性高、适应面广、准确性高等特点。× 4.普查一般要规定统一的标准调查时间,以避免调查数据的重复或遗漏。√ 5.普查是为某一特定目的而专门组织的经常性的全面调查,普查能够获得各个领域的全面、广泛的数据。× 6.为消除组距不同对频数分布的影响,需要计算频数密度。频数密度才能准确反映频数分布的实际情况。√ 7.由于组距不同,频数密度不能准确反映频数分布的实际情况。× 8.等距分组由于各组的组距相等,各组频数的分布不受组距大小的影响。√ 9.等距分组各组频数的分布受组距大小的影响。× 10.使用组中值作为该组数据的代表值时,必须假定各组数据在本组内呈均匀分布或者在组距中值两侧呈对称分布。√ 11.只有在组距中值两侧呈对称分布,才能使用组中值作为该组数据的代表值。× 12.邮寄调查是一种标准化调查。√

统计学试卷五及答案

统计学原理试卷 一、单选题 1.调查某大学2000名学生学习情况,则总体单位是() A 、2000名学生B、2000名学生的学习成绩C、每一名学生D、每一名学生的学习成绩 2.标志是说明( ) A、总体单位的特征的名 B、总体单位量的特征的名称 C、总体质的特征的名称 D、总体量的特征的名称 3.某些不能够或不宜用定期统计表搜集的全面统计资料,一般应采取的方法是() A、普查 B、重点调查 C、典型调查 D、抽样调查 4.下面属于品质标志的是()。 A、工人年龄 B、工人性别 C、工人月工资 D、工人体重 5.下列指标中属于时点指标的是() A、国内生产总值 B、流通费用率 C、人均利税额 D、商店总数 6.某产品单位成本计划1997年比1996年降低10%,实际降低15%,则计划完成程度为() A、150% B、94.4% C、104.5% D、66.7% 7.指标数值随研究范围的大小而增减的综合指标是()。 A、相对指标 B、质量指标 C、平均指标 D、总量指标 8.下列指标属于比例相对指标的是() A、工人出勤率 B、农轻重的比例关系 C、每百元产值利税额 D、净产值占总产值的比重9.下列指标属于总量指标的是() A、人均粮食产量 B、资金利税率 C、产品合格率 D、学生人数 10.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为() A、 600元 B、 533.33元 C 、466.67元 D、 500元 11.标志变异指标是反映同质总体的()。 A、集中程度 B、离中程度 C、一般水平 D、变动程度 12.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1‰人口,则抽样误差() A、两者相等 B、前者大于后者 C、前者小于后者 D、不能确定 13.当可靠度大于0.6827时,抽样极限误差() A、大于抽样平均误差 B、小于平均误差 C、等于抽样平均误差 D、与抽样平均误差的大小关系依样本容量而定 14.下列等式中,不正确的是() A、发展速度=增长速度+1 B、定基发展速度=相应各环比发展速度的连乘积 C、定基增长速度=相应各环比增长速度的连乘积 D、平均增长速度=平均发展速度-1 15.编制动态数列的基本原则是要使动态数列中各项指标数值具有() A、可加性 B、可比性 C、一致性 D、同质性 16.在物价上涨后,同样多的人民币少购买商品3%,则物价指数为( ) A、97% B、103.09% C、3% D、109.13% 17.若销售量增加,销售额持平,则物价指数( ) A、降低 B、增长 C、不变 D、趋势无法确定

最新统计学试题及答案

一、填空题(在括弧内填上适当文字)(本大题共5小题,每小题2分,总计10分) 1、“统计”一词有三个含义,即( 统计资料 )、(统计工作 )和统计学。 2、相对指标是用来说明社会经济现象之间(数量对比关系 )的统计指标;平均指标是用来说 明总体某一数量标志值分布(集中趋势 )的统计指标。 3、中位数是位于数列(中间位置 )的那个标志值,众数则是在总体中出现次数(最多 )的某一标志值。 4、变异指标主要有极差、平均差、( 标准差 )和( 方差 )。 5、时间序列的种类包括:绝对数时间序列、(相对时间序列 )和(平均数时间数列 )。 二、单项选择题(在每个小题四个备选答案中选出一个正确答案,填在题末的括号中)(本大题共10小 题,每小题1分,总计10分) 1、统计调查方案中的调查期限是指( )。 A 调查工作的起迄时间; B 收集资料的时间; C 时期现象资料所属的时间; D 时点现象资料所属的时间。 2、重点调查中重点单位是指( )。 A 标志总量在总体中占有很大比重的单位; B 具有典型意义或代表性的单位; C 那些具有反映事物属性差异的品质标志的单位; D 能用以推算总体标志总量的单位。 3、分布数列是说明( )。 A 总体单位数在各组的分配情况; B 总体标志总量在各组分配情况; C 分组的组数; D 各组的分布规律。 4、研究某市工业企业生产设备使用情况,那么统计总体是:( )。 A 全部工业企业; B 一个工业企业; C 全部工业企业每台设备; D 工业企业的全部设备。 5、计算平均指标最常用的方法和最基本的形式是( )。 A 中位数; B 众数; C 算术平均数; D 调和平均数。 6、在平均指标指数中,包含结构变动因素的指数是( )。 A 可变构成指数; B 固定构成指数; C 结构变动影响指数; D 平均数指数。 7、某车间月末员工数资料见表 则该车间上半年的平均人数约为( )。 A 110;B 112;C 114;D 116。

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样 总体则是不确定的。(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。 (X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。(X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。(X ) 6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准 确程度的范围;两者既有区别,又有联系。( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。(V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。( V ) 10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。 (X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为 原来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误 差等于30。(X) 18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概 率保证程度。(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

统计学期末考试试题(含答案)分解

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、% 104% 105 C 、%96% 95 D 、%4%5

华南理工大学2018统计学原理随堂练习

第一章绪论 1. 统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。 参考答案:√ 2. 描述统计学是研究如何根据样本数据去推断通体数量特征的方法。 参考答案:× 3. 描述统计学是整个统计学的基础,推断统计学是现代统计学的主要内容。 参考答案:√ 4. 推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。 参考答案:√ 5. 统计数据的计量尺度分为定类尺度、定序尺度、定距尺度和定比尺度。 参考答案:√ 6. 定量数据说明的是现象的数量特征,是能够用数值来表现。 参考答案:√ 7. 定性数据说明的是现象的品质特征,是不能用数值来表现。 参考答案:√ 8. 统计指标表现为绝对数、相对数和平均数三种形式。 参考答案:√ 9. 产品产量是时期数。 参考答案:√ 10. 股票价格是时点数。 参考答案:√ 11. 考试成绩分为优、良、中、及格、不及格,这是按定类尺度划分的。 参考答案:× 12. 考试成绩用“百分制”度量,这是按定比尺度划分的。 参考答案:× 13. 将全部人口分为男女两部分,男性所占比重就是比率相对数。 参考答案:× 14. 动态数列就是将某同时期的各指标数值按照组别进行排序得到的数列。 参考答案:× 15. 15. “企业数”、“年龄”都是离散变量。 参考答案:× 16. 16. “性别”、“产品等级”属于数量变量。 参考答案:× 17. 17. 数据的加工处理方法、数据分布特征的概括与分析方法等属于描述统计学的内容。参考答案:√ 18. 18. 人的身高、体重、机器设备台数等都是连续变量。 参考答案:× 19. 19. 离散变量的变量值只能按整数计算,不可能有小数。

统计学试题库及答案

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变 量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相 同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。

《统计学》试题及答案

统计学试题及答案 1.女性是品质标志。错 2.指标都是用数值表示的,而标志则不能用数值表示。错 3.数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。错 4.一般而言指标总是依附在总体上,而总体单位则是标志的直接承担者。对 5.统计学是对统计实践活动的经验总结和理论概括。对 6.统计学和统计工作的研究对象是完全一致的。错 1.各种调查方法结合运用,容易造成重复劳动,故不宜提倡。错 2.调查对象是调查项目的承担者。错 3.典型调查中典型单位的选取可以不遵循随机原则。对 4.统计报表中的资料主要来源于基层单位的原始记录、统计台帐和基础的内部报表。对 5.统计报表一般属于经常性的全面调查。对 6.一般而言,全面调查的结果更全面、准确,所以得到普遍应用。错 1.为了了解某商业企业的期末库存量,调查人员亲自盘点库存,这种方法C A.大量观察法大量观察法大量观察法 B.采访法 C.直接观察法 D.报告法 2.第2章对百货商店工作人员进行普查,调查对象是(B) A.各百货商店

B.各百货商店的全体员工 C.一个百货商店 D.每位工作人员 3.重点调查的重点单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重。对 4.普查可以得到全面、详细的资料,但需要花费大量的人力、物力、财力及时间,因此在统计调查中不宜频繁组织普查。对 5.对统计总体中的全部单位进行调查称为普查。对 6.由于直接观察法能保证资料的真实性和可靠性,因而在进行大规模调查时,应采用这种方法。错 1.能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。错 2.统计整理就是对统计资料进行汇总、加工处理。错 3.次数分布有两种表现方法,一种是用表格表示,另一种是用图表示。错 4.所谓“上限不在内”原则,是指当某单位的标志值恰好等于某组上限时,就把该单位归入该组。错 5.连续型变量只能作组距式分组,且组限只能是重叠组限表示法。对 6.在编制变量数列时,若资料有特大或特小的极端数值,则宜采用开口组表示。对 7.统计表的横行标题表示各组的名称,一般应写在统计表的(B) A.上方 B.左方 C.右方

空间统计分析实验报告

空间统计分析实验报告 一、空间点格局的识别 1、平均最邻近分析 平均最邻近距离指点间最邻近距离均值。该分析方法通过比较计算最邻近点对的平均距离与随机分布模式中最邻近点对的平均距离,来判断其空间格局,分析结果如图1所示。 图1 平均最邻近分析结果图最邻近比率小于1,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0

计算结果共有5个参数,平均观测距离,预期平均距离,最邻近比率,Z 得分,P值。 P值就是概率值,它表示观测到的空间模式是由某随机过程创建而成的概率,P 值越小,也就是观测到的空间模式是随机空间模式的可能性越小,也就是我们越可以拒绝开始的零假设。最邻近比率值表示要素是否有聚集分布的趋势,对于趋势如何,要根据Z值和P值来判断。 本实验中的最邻近比率小于1 ,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0,该结果说明省详细居民点的分布是聚集分布的,不存在随机分布。 2、多距离空间聚类分析 基于Ripley's K 函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可汇总一定距离围的空间相关性(要素聚类或要素扩散)。 本实验中第一次将距离段数设为10,距离增量设为1,第二次将距离段数设为5,距离增量同样为1,得到如图2和图3所示的结果。 从图中可以看出,小于3千米的距离,观测值大于预测值,居民点聚集,大于3千米,观测值小于预测值,居民点离散。且聚集具有统计意义上的聚集,离散并未具有统计意义上的显著性。 图2 K函数聚类分析结果1

统计学试题(一)及其答案

统计学试题(一)及其答案 一、单项选择题(每小题2分,共20分) 1.社会经济统计的数量特点表现在( D )。 A.它是一种纯数量的研究 B.它是从事物量的研究开始来认识事物的本质 C.它是从定性认识开始以定量认识为最终目的 D.它是在质与量的联系中研究社会经济现象的数量方面 2.若不断重复某次调查,每次向随机抽取的100人提出同一个问题,则每次都能得到一个回答“是”的人数百分数,这若干百分数的分布称为:( D )。 A.总体平均数的次数分布B.样本平均的抽样分布 C.总体成数的次数分布D.样本成数的抽样分布 3.当变量数列中各变量值的频数相等时(C )。 A.该数列众数等于中位数B.该数列众数等于均值 C.该数列无众数D.该众数等于最大的数值 4.描述数据离散程度的测度值中,最常用的是( B )。 A.全距B.平均差 C.标准差D.标准差系数 5.计算无关标志排队等距抽样的抽样误差,一般近似采用(B )。 A.多阶段抽样的误差公式B.简单随机抽样的误差公式 C.分层抽样的误差公式D.整群抽样的误差公式 6.将报告期两个城市物业管理费用的物价水平进行综合对比,属于(D )。 A.强度相对数B.动态相对数 C.结构影响指数D.静态指数 7.某地区商品销售额增长了5%,商品零售价格平均增长2%,则商品销售量增长( C )。 A.7% B.10% C.2.94% D.3% 8.对于有线性相关关系的两变量建立的直线回归方城Y=a+bx中,回归系数b (B )。 A.肯定是正数B.显著不为0 C.可能为0 D.肯定为负数 9.若产品产量增加,生产费用不变,则单位产品成本指数( B )。 A.上升B.下降C.不变D.不确定

统计学试题及答案解析

统计学原理试卷1(专科) 05工商管理 一、单项选择题(每题1分,共20分) 1。下面属于品质标志得就是( ) A、工人年龄 B、工人性别 C、工人月工资 D、工人体重 2。某工厂有100名职工,把她们得工资加总除以100,这就是对100个( )求平均数 A、变量 B、标志 C、变量值 D、指标 3.统计设计得核心问题就是( ) A、搜集统计资料方法得设计 B、统计分类与分组得设计 C、统计指标与指标体系得设计D、统计工作各个环节得具体设计 4.统计调查按组织方式得不同可以分为() A、全面调查与专门调查 B、定期调查与连续性调查 C、连续性调查与一次性调查 D、统计报表与专门调查 5。为了了解城市职工家庭得基本情况,以作为研究城市职工收入水平及生活负担得依据,需要进行一次专门调查,最为适合得调查组织形式就是 ( ) A、重点调查 B、典型调查 C、抽样调查 D、 普查 6、非全面调查中最完善、最有科学根据得方式方法就是( ) A、重点调查 B、典型调查 C、抽样调查 D、非全面报表 7。某工业企业产品年生产量为10万件,期末库存量为3、8万件,它们( )。 A、就是时期指标B、就是时点指标 C、前者就是时期指标,后者就是时点指标 D、前者就是时点指标,后者就是时期指标 8。加权算术平均数得大小( )。 A、受各组次数得影响最大 B、受各组标志值得影响最大 C、受各组标志值与次数得共同影响 D、不受各组次数得影响 9。时间数列中所排列得指标数值( )。 A、只能就是绝对数 B、只能就是相对数 C、只能就是平均数 D、可以就是绝对数,也可以就是相对数或平均数 10.发展速度与增长速度得关系就是( )。 A、环比增长速度等于定基发展速度-1 B、环比增长速度等于环比发展速度-1 C、定基增长速度得连乘积等于定基发展速度 D、环比增长速度得连乘积等于环比发展速度 11、抽样调查得目得在于( )。

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样总 体则就是不确定的。( V ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。 ( X ) 3.在抽样推断中,作为推断的总体与作为观察对象的样本都就是确定的、唯一 的。(X ) 4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。( X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。( X ) 6.抽样平均误差就是表明抽样估计的准确度,抽样极限误差则就是表明抽样估 计准确程度的范围;两者既有区别,又有联系。 ( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。( V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。 ( V ) 10.抽样推断就是利用样本资料对总体的数量特征进行估计的一种统计分析方 法,因此不可避免的会产生误差,这种误差的大小就是不能进行控制的。 (X ) 11.重复抽样时,其她条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。(X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号就是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为原 来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度与总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0、9545,则抽样平均误差等 于30。(X) 18.抽样估计置信度就就是表明抽样指标与总体指标的误差不超过一定范围的 概率保证程度。(V ) 19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

相关文档
相关文档 最新文档