文档库 最新最全的文档下载
当前位置:文档库 › 第二讲习题 统计数据的描述

第二讲习题 统计数据的描述

第二讲习题 统计数据的描述
第二讲习题 统计数据的描述

一、单项选择题

1.美国10家公司在电视广告上的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。下列图示法不宜用于描述这些数据的是( )。

A.茎叶图B.散点图C.直方图D.饼图

2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。对样本均值可作如下解释( )。

A.大多数女性MBA的起薪是54 749美元

B.最常见到的起薪是54 749美元

C.样本起薪的平均值为54 749美元

D.有一半的起薪低于54 749美元

3.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。对样本中位数可作如下解释( )。

A.大多数女性MBA的起薪是47 543美元

B.最常见到的起薪是47 543美元

C.样本起薪的平均值为47 543美元

D.有一半女性的起薪高于47 543美元

4.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。对样本标准差可作如下解释( )。

A.最高起薪与最低起薪之差是10 250美元

B.大多数的起薪在44 499美元和64 999美元之间

C.大多数的起薪在37 293美元和57 793美元之间

D.大多数的起薪在23 999美元和85 499美元之间

5.对于右偏分布,均值、中位数和众数之间的关系是( )。

A.均值>中位数>众数B.中位数>均值>众数

C.众数>中位数>均值D.众数>均值>中位数

6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的离散程度的测度指标是( )。

A.方差B.极差C.标准差D.变异系数

7.根据下列样本数据3,5,12,10,8,22计算的中位数为( )。

A.9 B.10 C.12 D.11

8.根据下列样本数据3,5,12,10,8,22计算的标准差为( )。

A。45.2 B.6.’72 C.6.13 D.37.67

9.在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是( )。

A.对称的B.左偏的C.右偏的D.无法确定

10.用极差度量离散程度的缺陷是( )。

A.基于均值计算离散程度B.基于绝对值计算,不易使用

C.易于计算D.没有使用所有数据的信息

11.下列叙述中正确的是( )。

A.如果计算每个数据与均值的离差,则这些离差的和总是等于零

B.如果考试成绩的分布是钟形的,均值为75,标准差为12,则考试成绩在63和75分之间的比例大约为95%

C.均值和中位数相等

D.中位数大于均值

12.如果数据的分布是左偏的,下列叙述中正确的是( )。

A.均值在中位数的右侧

B.均值等于中位数

C.分布的“尾部”在图形的右边

D.均值在中位数的左侧

13.除了( )之外,下列都是中位数的特征。

A.中位数是一组数据中的大小数值的平均

B.中位数是数据集中趋势的一种度量

C.中位数的位置由公式(n+1)/2确定,其中n是数据的个数

D.中位数等于第二个四分位数

14.下图是表示定量数据的( )的一个例子。

10 2 8

20 5 5 7 9

31 3 5 6 8 8

44 4 6 8

A.饼图B.直方图C.散点图D.茎叶图

15.研究人员在分析数据时,他通常需要对数据的离散程度或( )进行定量描述。

A.均值B.众数C.方差D.集中趋势

16.度量集中趋势最常见的指标是( ),用所有数据的和除以数据个数即可得到。

A.中位数B.标准差C.众数D.算术平均数

17.现有数据:3,3,1,5,13,12,ll,9,7。它们的中位数是( )。

A.3 B.11 C.7.1 D.7

18.下列数据是某班.的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,55,95,86,78,86,85,87,92,73,82。这些成绩的极差是( )。

A.78 B.84 C.80 D.40

19.当( )时,均值只受变量值大小的影响,而与次数无关。

A.变量值较大而次数较小B.变量值较大且次数较大

c.各变量值出现的次数相等D.变量值较小且次数较小

20.如果分布是左偏的,则( )。

A.众数>均值>中位数B.众数>中位数>均值

C.均值>中位数>众数D.均值>众数>中位数

21.当数据分布有对称的集中趋势时,其均值( )。

A.趋于变量值大的一方B.趋于变量值小的一方

C.趋于权数大的变量值D.趋于哪方很难判定

22.在离散程度的测度中,最容易受极端值影响的是( )。

A.极差B.四分位数C.标准差D.方差

23.变异系数为0.4,均值为20,在标准差为( )。

A.80 B.0.02 C.4 D.8

24.某校9个英语班的学生人数分别为12,15,9,12,13,12,14,11,10。据此计算的结果是( )。

A.均值=中位数=众数B.众数>中位数>均值

C.中位数>均值>众数D.均值>中位数>众数

25.有8个变量值,它们对数值6的离差分别为—3,—2,0,0,4,3,4,2。由此可知( )。

A.这8个数中有负数B.这8个数的均值为0

C.这8个数的均值为7 D.这8个数的均值为6

26.在数据集中趋势的测量中,不受极端值影响的测度是( )。

A.均值B.几何平均数

C.调和平均数D.众数

27.在比较两组数据的离散程度时,不能直接比较它们的方差,因为两组数据的( )。

A.标准差不同B.方差不同

C.数据个数不同D.计量单位不同

28.已知一组数据的均值为500,变异系数为0.3,则方差为( )。

A.225 B.500 C.50 000 D.22 500

29.

30.某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是( )。

A.众数>中位数>均值B.均值>中位数>众数

C.中位数>众数>均值D.中位数>均值>众数

31.某城市对1 000户居民的一项调查显示,人均收入在2 000~3 000元的、家庭占24%,在3 000~4 000元的家庭占26%,在4 000~5 000元的家庭占29%,在5 000~6 000元的家庭占10%,在6 000~7 000元的家庭占7%,在7 000元以上的家庭占4%。从此数据可以判断,该城市收人数据是( )。

A.右偏的B.左偏的C.对称的D.正态的

32.某城市对1 000户居民的一项调查显示,人均收入在2 000~3 000元的家庭占24%,在3 000~4 000元的家庭占26%,在4 000~5 000元的家庭占29%,在5 000~6 000元的家庭占10%,在6 000~7 000元的家庭占7%,在7 000元以上的家庭占4%。从此数据可以判断,用( )描述该城市的收入状况较好。

A.均值B.中位数C.众数D.极差

33.某企业有两个生产车间,共有工人50人。据统计,A车间人均日加工产品数为78件,标准差为8件;B车间人均日加工产品数为72件,标准差为10件。如果两个车间的工人数相等,则该企业工人人均日加工产品数为( )件。

A.75 B.80 C.85 D.70

34.两组工人生产相同的零件,A组日产零件数为32,25,29,28,26。B组日产零件数为30,25,22,36,27。哪组工人日产零件数的离散程度大?( )。

A.A组B.B组

C.两组的离散程度相同D.无法确定

35.直方图一般可用于表示( )。

A.次数分布的特征B.累积次数的分布

C.变量之间的函数关系D.数据之间的相关性

36.若基尼系数为0,表示收入分配( )。

A.比较平均B.绝对平均

C.绝对不平均D.无法确定

37.下列关于集中趋势的测度中,易受极端值影响的是( )。

A.均值B.众数C.中位数D.众数和中位数

38.某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12。据此数据计算的结果是( )。

A。均值=中位数=众数B.众数>中位数>均值

C.中位数>均值>众数D.均值>中位数>众数

39.离散程度的测度中最易受极端值影响的是( )。

A.极差B.方差C.标准差D.变异系数

40.计算方差所依据的中心数据是( )。

A.众数B.中位数C.均值D.几何平均数

41.均值为20 ,变异系数为0.4,则标准差为( )。

A.50 B.8 C.0.02 D.4

42.两组数据的均值不等,但标准差相等,则( )。

A.均值小,差异程度大B.均值大,差异程度大

C.两组数据的差异程度相同D.无法判断

43.在数据集中趋势的测度中,不受极端值影响的测度是( )。

A.众数B.几何平均数

C.调和平均数D.算术平均数

44.一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤。据此数据可以判断( )。

A.男生体重的差异较大

B.女生体重的差异较大

C.男生和女生的体重差异相同

D.无法确定

45.对数据对称性的测度是( )。

A.偏度B.峰度C.变异系数D.标准差

46.从某地区抽取120家企业并按利润进行分组可知,其中19家企业的利润在200万~300万元之间,30家企业的利润在300万~400万元之间,42家企业的利润在400万~500万元之间,18家企业的利润在500万~600万元之间,11家企业的利润在600万元以上。这120家企业的平均利润为( )。

A.456.23 B.426.67 C.512.56 D.400.12

47.从某地区抽取120家企业并按利润进行分组可知,其中19家企业的利润在200万~300万元之间,30家企业的利润在300万~400万元之间,42家企业的利润在400万~500万元之间,18家企业的利润在500万~600万元之间,11家企业的利润在600万元以上。这120家企业利润的标准差为( )。

A.129.45 B.200.34 C.116.48 D.121.67

48.

49.当数据中出现零时,不宜计算( )平均数。

A.几何B.调和C.算术D.简单

85.在计算增长率的平均数时,通常采用( )。

A.几何平均数B.调和平均数

C.算术平均数D.简单平均数

50.

51.某股票在2000年、2001年、2002年和2003年的年收益率分别为4.5 %,2.1%,25.5 %,1.9%,则该股票在这四年的平均收益率为( )。

A.8.079%B.7.821%C.8.5%D.7.5%

52.一组数据的最大值与最小值之差被称为( )。

A.标准差B.方差C.平均差D.全距

53.

54.测度集中趋势的统计指标有( )。

A.标准差B.方差C.平均差D.众数

55.对于左偏分布,有( )。

A.均值大于中位数B.均值大于众数

C.均值小于众数D.均值大于方差

56.对于右偏分布,有( )。

A.均值小于中位数B.均值小于众数

C.均值大于方差D.均值大于中位数

57.下列叙述正确的是( )。

A.众数可以用于数值型数据

B.中位数可以用于分类数据

C.几何平均数可以用于顺序数据

D.均值可以用于分类数据

58.当偏态系数大于零时,分布是( )。

A.左偏的B.右偏的C.对称的D.无法确定的

59.当偏态系数小于零时,分布是( )。

A.左偏的B.对称的C.无法确定的D.右偏的

60.当峰态系数大于零时,表明分布是( )。

A.尖峰的B.扁平的C.左偏的D.右偏的

61.正态分布的峰态系数( )。

A.大于零B.等于零C.小于零D.大于或等于零

62.对10名成年人和10名幼儿的身高进行了抽样调查,其中成年人的身高为(单位:厘米):166,169,172,177,180,170,172,174,168,173;幼儿的身高为(单位:厘米):68,69,68,70,71,73,72,73,74,75。如果要比较成年人和幼儿的身高差异,应该采用的统计量是( )。

A.标准差B.方差C.极差D.变异系数

63.对10名成年人和10名幼儿的身高进行了抽样调查,其中成年人的身高为(单位:厘米):166,169,172,177,180,170,172,174,168,173;幼儿的身高为(单位:厘米):68,69,68,70,71,73,72,73,74,75。如果要比较成年人和幼儿的身高差异,结果是( )。

A.幼儿身高的差异较大

B.成年人身高的差异较大

C.幼儿和成年人身高的差异相同

D.幼儿和成年人身高的差异无法比较

64.一个总体由5个元素组成:3,7,8,9,13。该总体的方差为( )。

A.8 B.7.5 C.9.7 D.10.4

65.计算离散系数的目的之一是为了( )。

A.消除计量单位的影响B.简化计算过程

C.消除差异程度的影响D.消除标准差的影响

66.数据的离散程度越大,集中趋势的测度值对该组数据的代表性( )。

A.越差B.越好C.不变D.无法确定

67.各变量值与其( )的离差之和等于零。

A.中位数B.众数C.均值D.标准差

68.各变量值与其( )的离差平方和最小。

A.中位数B.众数C.标准差D.均值

69.下列关于众数的叙述,不正确的是( )。

A.一组数据可能存在多个众数B.众数主要适用于分类数据

C.一组数据的众数是唯一的D.众数不受极端值的影响

70.如果已知一组数据的众数小于中位数,中位数又小于均值,则可以判断该数据是( )。

A.右偏的B.左偏的C.对称的D.尖峰的

71.一组数据包含10个观察值,则中位数的位置为( )。

A.4 B.5 C.6 D.5.5

72.一组数据包含9个观察值,则上四分位数的位置为( )。

A.7 B.8 C.7.5 D.9.5

73、在全距一定的情况下,组距的大小与组数的多少成()

A、正比

B、反比

C、无比例关系

D、有时成正比有时成反比

74、统计表的横行标题表示各组的名称,一般应写在统计表的()

A、上方

B、左方

C、右方

D、均可以

75、在填写统计表时,当发生某项不应有数字时,用()符号表示

A、O

B、X

C、—

D、...

76、按某一标志分组的结果表现为()

A、组内同质性,组间同质性

B、组内同质性,组间差异性

C、组间差异性,组间同质性

D、组间差异性,组间差异性

77、累计次数或累计频率中的“向上累计”是指()

A、将各组变量值由小到大依次相加

B、将各组次数或频率由小到大依次相加

C、将各组次数或频率从变量值最低的一组向最高的一组依次相加

D、将各组次数或频率从变量值最高的一组向最低的一组依次相加

78、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,末组的组中值为()。

A、260

B、215

C、230

D、185

79.对于右偏分布,均值、中位数和众数之间的关系是()

A、均值> 中位数> 众数

B、中位数> 均值> 众数

C、众数> 中位数> 均值

D、众数> 均值> 中位数

80、某10位举重运动员体重分别为:101kg、102 kg、103 kg、108 kg、102 kg、105 kg、102 kg、110 kg、

105 kg、102 kg,据此计算平均数,结果满足()。

A.算术平均数=中位数=众数B.众数>中位数>算术平均数

C.中位数>算术平均数>众数D.算术平均数>中位数>众数

81、甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41,平均数为70,则()。

A.甲数列平均数代表性高;B.乙数列平均数代表性高;

C.两数列的平均数代表性相同;D.甲数列离散程度大;

二、计算题

1

要求:

(1)计算该企业职工平均工资

(2)计算标准差

(3)计算方差

2、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的

要求:(1)计算乙班考试成绩的众数、中位数、均值及标准差;

(2)比较甲乙两个班哪个班考试成绩的离散程度大?

3、甲企业生产的袋装食品采用自动打包机包装,每袋标准要求重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:

(2)若乙企业产品的离散系数为0.02,比较甲乙哪个企业的产品重量离散程度较大;

4、

要求:

(1)计算各班学生的平均成绩

(2)计算各班学生成绩的方差

(3)计算个班学生成绩的离散系数

(4)通过计算说明哪个班学生平均成绩的代表性强(4分)

5

要求:

(1)比较哪个企业职工年龄偏高

(2)比较哪个企业职工平均年龄更具代表性

6、某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):

152 124 129 116 100 103 92 95 127 104

105 119 114 115 87 103 118 142 135 125

117 108 105 110 107 137 120 136 117 108

97 88 123 115 119 138 112 146 113 126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;

(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。7

8、在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)企业数(个)

200~300 19

300~400 30

400~500 42

500~600 18

600以上11

合计120

计算120家企业利润额的均值和标准差。

9、对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组166 169 172 177 180 170 172 174 168 173

幼儿组68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?

(2)比较分析哪一组的身高差异大?

描述统计学思考题

1、调查问卷的结构? 2、多项选择题的编码?(多重响应) 3、多项选择排序题的编码? 4、缺失值有哪些处理方法? 5、离群值如何判断和筛选出来? 6、什么是问卷的信度和效度?怎样检验问卷的信度和效度? 7、问卷调查中的信度分析,有几种信度系数?写出三种信度的测 量方法。 8、问卷调查中的效度分析,有几种关于效度的测定方法? 9、信度与效度之间有什么关系? 10、条形图、直方图、茎叶图的区别。 11、箱线图中的离群点是哪些点?离群程度? 12、数据特征从哪几个方面进行描述?描述统计量分别是? 13、众数、中位数、均值的异同? 14、根据下表数据, (1)用描述统计的方法概括表中数据,并讨论你的结论。 (2)对变量数据的最大值、最小值、平均数以及适当的分位数进行评价和解释;通过这些描述统计量,你对亚太地区的商学院有何看法或发现? (3)对本国学生学费和外国学生学费进行比较。 (4)对要求或不要求工作经验的学校学生的起薪进行比较。 (5)对要求或不要求英语测试的学校学生的起薪进行比较。

(6)分析报告中如果有必要的图表,将更便于反映你希望反映的问题。(见下页)

表亚太地区25所知名商学院 商学院名称录取 名额 每系 人数 本国 学生 学费 ($) 外国 学生 学费 ($) 年龄 国外 学生 比例 (%) 是否 要求 GMAT 是否 要求 英语 测试 是否 要求 工作 经验 起薪 ($) 麦夸里商学院 (悉尼) 12 5 24420 29600 28 47 是否是71400 阿德莱德大学20 4 19993 32582 29 28 是否是65200 梅西大学(新 西兰,北帕默 斯顿) 30 5 4300 4300 22 0 否否否7100 墨尔本皇家工 商学院 30 5 11140 11140 29 10 是否否31000 马来西亚 Sains大学(槟 城) 30 4 33060 33060 28 60 是是否87000 澳大利亚国立 大学(堪培拉) 42 5 7562 9000 25 50 是否是22800 De La Salle大 学(马尼拉) 44 5 3935 16000 23 1 是否否7500 南洋理工大学 (新加坡) 50 6 6146 7170 29 51 是是是43300 香港理工大学60 8 2880 16000 23 0 否否否7400 拉合尔管理科 学院 70 2 20300 20300 30 80 是是是46600 香港大学90 5 8500 8500 32 20 是否是49300 柯廷理工学院 (珀思) 98 17 16000 22800 32 26 否否是49600 日本国际大学126 2 11513 11513 26 37 是否是34000 昆士兰大学 (布里斯本) 138 8 17172 19778 34 27 否否是60100 新加坡国立大 学 147 7 17355 17355 25 6 是否是17600 墨尔本商学院200 13 16200 22500 30 30 是是是52500 Chulalongkorn 大学(曼谷) 200 10 18200 18200 29 90 否是是25000 新南威尔士大 学(悉尼) 228 19 16426 23100 30 10 否否是66000 Jamnalal Bajaj 管理学院(孟 买) 240 15 13106 21625 37 35 否是是41400 亚洲管理学院300 7 13880 17765 32 30 否是是48900

第2章统计数据的描述

第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频数)频率% A1414 B2121 C3232 D1818

E1515 合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图: 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 (1)利用计算机对上面的数据进行排序;

统计学第二章数据收集、整理与显示

第二章数据搜集、整理与显示 Ⅰ.学习目的 本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求: 1.了解统计数据的类型及其搜集方法; 2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合; 3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。 Ⅱ.课程内容要点 第一节数据的搜集 一、数据搜集 数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。 数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。 数据的计量尺度有四种 定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。 定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度。定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。 定距尺度是对事物类别或次序之间间距进行的一种测度。定距尺度不仅

能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。 定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。 从不同方面数据划分为不同类型。 根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。 根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。 根据数据的搜集方法,可以将数据分为观察数据和实验数据。 根据数据的来源渠道,可以将数据分为直接数据和间接数据。 二、数据搜集的方法 数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。 三、统计调查的形式 普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。 统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。 抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。 重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。重点调查的前提是必须存在重点单位。 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。典型调查有解剖麻雀型和划类选典型两种类型。

数据分段整理和统计练习题及答案

2019数据分段整理和统计练习题及答案 第1课时数据分段整理和统计 不夯实基础,难建成高楼. 1. 下面是四(2)班女生身高记录单.(单位:cm) 先用画“正”字的方法整理这个班女生身高分布状况,再把整理的结果填入统计表. 身高(cm) 人数 140及以下 141~144 145及以上 四(2)班女生身高情况统计表 身高(cm) 140及以下141~144 145及以上 人数 这个班女生身高在( )厘米范围内的人数最多,这个班女生的平均身高大约是( )厘米(保留整厘米数). 重点难点,一网打尽. 2. 四(1)班上学期数学期末考试成绩如下: 学号分 数 学 号 分 数 学 号 分 数 学 号 分 数 1 88 8 9 2 15 89 22 96

2 86 9 94 16 9 3 23 54 3 90 10 100 17 97 2 4 78 4 8 5 11 99 18 99 25 89 5 79 12 98 19 100 2 6 87 6 96 13 96 20 79 2 7 98 7 92 14 97 21 65 28 68 (1) 分数段人数 100 80-99 60-79 60分以下 (2)四(1)班上学期数学期末考试成绩统计表 年月 分数段合计100 80-99 60-79 60分 以下 人数 (人) (3)从上面的统计表中你知道了什么? 举一反三,应用创新,方能一显身手! 3. 下面是任意抽取的四年级某班20名学生的体重记录单.(单位:kg)

(1)根据上面的数据填写下面的统计表. 四年级某班20名学生体重统计表 年月 (2)人数最多的是( )kg 范围内的人,这20名学生的平均体重大约是( )kg.(保留整千克数.) (3)你的体重在哪一段?你对自己现在的体重评价是什么?

数据统计练习题包括答案

数据统计 满分: 班级:_________ 姓名:_________ 考号:_________ 一、单选题(共13小题) 1.初二(1)班有48位学生,春游前,班长把全班学生对春游地点的意向绘制成了扇形统计图,其中“想去苏州乐园的学生数”的扇形圆心角600,则下列说法正确的是() A.想去苏州乐园的学生占全班学生的60%B.想去苏州乐园的学生有12人 C.想去苏州乐园的学生肯定最多D.想去苏州乐园的学生占全班学生的1/6 2.学校为了解七年级学生吃早餐情况,调查了一个班45名同学吃早餐的情况,在做这次统计调查中,样本是() A.七年级全体学生吃早餐情况B.每个学生吃早餐情况 C.45名学生吃早餐情况D.七年级全体学生 3.老师说“请大家选举一位同学,现在开始投票!”你认为老师在收集数据过程中最大的失误是() A.没有确定调查对象B.没有规定调查方法C.没有明确调查问题D.没有展开调查 4.下面哪项调查适合用选举的形式进行数据收集() A.谁在上届世界杯中进球最多B.5月1日是什么节 C.谁在入学考试中取得第一D.谁最适合当班长 5.下列调查必须用抽样调查方式来收集数据的个数是() ①检查一批灯泡的使用寿命;②调查某城市家庭收入状况; ③了解全班同学身高状况;④检查某种药品的疗效。 A.1B.2C.3D.4 6.北京市2007年5月份某一周的日最高气温(单位:℃)分别为25,28,30,29,31,32,28,这周的日最高气温的平均值为() A.28℃B.29℃C.30℃D.31℃ 7.下列调查工作需采用的普查方式的是() A.环保部门对淮河某段水域的水污染情况的调查 B.电视台对正在播出的某电视节目收视率的调查

统计与统计数据练习题

第二十三章统计与统计数据 一、单项选择题 1、以下属于定性变量的是()。 A、企业所属行业 B、考试人数 C、工资 D、销售额 2、下列统计变量中,属于顺序变量的是()。 A、原油价格 B、年末总人口 C、员工受教育水平 D、学生年龄 3、居民消费价格指数(CPI)是()。 A、观测数据 B、实验数据 C、间接数据 D、直接数据 4、主要用于了解处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据的统计调查方式是()。 A、普查 B、抽样调查 C、重点调查 D、典型调查 5、()是实际中应用最广泛的一种调查方式和方法。 A、重点调查 B、典型调查 C、抽样调查 D、普查 6、经济普查每()年进行()次,分别在每逢年份的末位数字为3、8的年份实施。 A、10,1 B、10,2 C、5,2 D、4,1 7、()能以较少的投入、较快的速度取得某些现象主要标志的基本情况或变动趋势。 A、重点调查 B、典型调查 C、抽样调查 D、普查 8、与普查等全面调查相比,抽样调查()。 A、具有较强的时效性

B、具有较差的时效性 C、时效性完全相同 D、时效性相差不大 9、对人口的出生、死亡的调查属于()。 A、全面调查 B、非全面调查 C、连续调查 D、不连续调查 10、以下关于统计的说法中,错误的是()。 A、统计学是关于收集、整理、分析数据和从数据中得出结论的科学 B、描述统计和推断统计的作用只能分开发挥 C、参数估计是利用样本信息推断总体特征 D、描述统计的内容包括如何用图表或数学方法对数据进行整理和展示 二、多项选择题 1、下列数据中,通常属于数值型数据的有()。 A、商品销售额 B、上班出行方式 C、家庭收入 D、居住地区 E、年龄 2、统计数据按其收集方法可以分为()。 A、观测数据 B、一手数据 C、间接数据 D、实验数据 E、二手数据 3、抽样调查的特点包括()。 A、经济性 B、时效性强 C、适应面广 D、准确性高 E、需要规定统一的标准调查时间 4、经济普查每10年进行两次,分别在每逢年份的末位数字为()的年份实施。 A、0 B、3 C、6 D、7 E、8 5、按调查登记的时间是否连续,统计调查可以分为()。

统计学第二章数据的搜集

1 了解某年全国规模以上工业企业生产和销售情况,则调查对象为( )。 A、工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:D 我的答案:D得分:4.0分 2 了解某年全国规模以上工业企业生产和销售情况,则调查单位为( )。 A、每一个规模以上工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:A 我的答案:A得分:4.0分 3 统计调查可以收集的资料是( )。 A、数字资料 B、原始资料和次级资料 C、只能是原始资料 D、不能是次级资料 正确答案:B 我的答案:B得分:4.0分 4 按调查的组织形式分,统计调查可分为( )。 A、全面调查和非全面调查 B、连续调查和不连续调查 C、统计报表和专门调查 D、重点调查和典型调查 正确答案:C 我的答案:A得分:0.0分 5 乡镇企业局为总结推广先进管理经验,选择几个先进乡镇企业调查,这种调查为( )。 A、抽样调查 B、典型调查 C、重点调查 D、普查 正确答案:B 我的答案:B得分:4.0分 6 调查几个铁路枢纽,了解我国铁路货运量的基本情况和问题,这种调查方式属于( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 正确答案:C 我的答案:C得分:4.0分 7

抽样调查和重点调查的主要区别是( )。 A、原始资料来源不同 B、取得资料的方法不同 C、调查的单位数多少不同 D、抽取调查单位的方式方法不同 正确答案:D 我的答案:D得分:4.0分 8 经常性调查与一次性调查的划分,是以( )。 A、调查组织划分的 B、最后取得的资料是否全面来划分的 C、调查对象所包括的单位是否完全划分的 D、调查登记的时间是否连续来划分的 正确答案:D 我的答案:D得分:4.0分 9 重点调查的重点单位是指( )。 A、标志值很大的单位 B、这些单位的单位总量占总体全部单位总量的绝大比重 C、这些单位的标志总量占总体标志总量的绝大比重 D、经济发展战略中的重点部门 正确答案:C 我的答案:C得分:4.0分 10 在统计调查中,总体单位和调查单位( )。 A、是一致的 B、是不一致的 C、是一致或不一致的 D、一般是一致的 正确答案:C 我的答案:C得分:4.0分 二.多选题(共5题,20.0分) 1 统计调查( )。 A、取得的有原始资料和次级资料 B、调查中首先考虑的是取得第一手资料 C、调查的主要要求是经济性 D、可分为全面调查与非全面调查 正确答案:AD 我的答案:得分:0.0分 2 统计调查的要求是( )。 A、准确性 B、全面性 C、具体性 D、及时性 正确答案:ABD 我的答案:ABD得分:4.0分 3 普查属于( )。

统计第二章练习题

第二章统计数据的搜集、整理与显示 (一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.统计调查的基本要求是()。 ①准确性、及时性、完整性②准确性、整体性、及时性③全面性、及时性、完整性④全面性、准确性、完整性 2.在统计调查中,填报单位是()。 ①调查项目的承担者②构成调查对象的每一个单位③负责向上报告调查内容的单位④构成统计总体的每一个单位 3.在统计调查中,调查单位和填报单位之间()。 ①是一致的②是无区别的③是无关联的两个概念④一般是有区别的,但有时也一致 4.某地区对小学学生情况进行普查,则每所小学是()。 ①调查对象②调查单位③填报单位④调查项目 5.对百货商店工作人员进行普查,调查对象是()。 ①各百货商店②各百货商店的全体工作人员③一个百货商店④每位工作人员 6.对某停车场上的汽车进行一次性登记,调查单位是()。 ①全部汽车②每辆汽车③一个停车场④所有停车场 7.对国有工业企业设备进行普查时,每个国有工业企业是( )。 ①调查单位②填报单位 ③既是调查单位又是填报单位④既不是调查单位又不是填报单位 8.对工业企业生产设备进行普查,调查单位是( )。 ①所有工业企业②工业企业的所有生产设备 ③每个工业企业④工业企业的每台生产设备 9.在统计调查阶段,对有限总体()。 ①只能进行全面调查②只能进行非全面调查③既能进行全面调查,也能进行非全面调查④以上答案都对 10.统计调查按调查对象包括的范围不同,可分为( )。 ①定期调查和不定期调查②经常性调查和一次性调查 ③统计报表和专门调查④全面调查和非全面调查 11.经常性调查与一次性调查的划分( )。 ①是以调查组织规模大小来划分的②是以最后取得的资料是否全面来划分的 ③是以调查对象所包括的单位是否完全划分的 ④是以调查登记的时间是否连续来划分的 12.统计报表大多属于()。 ①一次性全面调查②经常性全面调查③经常性非全面调查④一次性非全面调查 13.为了了解某商业企业的期末库存量,调查人员亲自盘点库存,这种方法是( )。 ①大量观察法②采访法③直接观察法④报告法 14.问卷法属于()。 ①直接观察法②询问法③报告法④一次性调查 15.区别重点调查和典型调查的标志是()。

第1章 统计和统计数据习题教学内容

第1章统计和统计 数据习题

第一章习题 第二章.D 2.D 3.B 4.A 5.D 6.C 7.A 8.C 9.C 10.B 第三章11.D 12.D 13.B 14.A 15. A 16.A 17.D 18.D 19.C 20.C 第四章21.D 22.B 23.C 第五章 第六章 一、选择题 1.指出下面的数据哪一个属于分类数据( D ) A.年龄B.工资 C.汽车产量D.购买商品时的支付方式(现金.信用卡.支票) 2.指出下面的数据哪一个属于顺序数据( D ) A.年龄B.工资 C.汽车产量D.员工对企业某项改革措施的态度(赞成.中立.反对) 3.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的总体是( .B ) A.2000个家庭B.200万个家庭 C.2000个家庭的人均收入D.200万个家庭的总收入 4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的样本是( A )

A.2000个家庭B.200万个家庭 C.2000个家庭的总收入D.200万个家庭的人均收入 5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的参数是( D ) A.2000个家庭B.200万个家庭 C.2000个家庭的人均收入D.200万个家庭的人均收入 6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的统计量是( C ) A.2000个家庭B.200万个家庭 C.2000个家庭的人均收入D.200万个家庭的人均收入 7.一家研究机构从IT从业者中随即抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式市用信用卡。这里的总体是( A ) A.IT行业的全部从业者B.500个IT从业者 C.IT从业者的总收入D.IT从业者的消费支付方式 8.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据。这一数据属于( C ) A.分类数据B.顺序数据 C.截面数据D.时间序列数据 9.

描述性统计分析报告--Descriptive Statistics菜单详解

第六章:描述性统计分析-- Descriptive Statistics菜单详解 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程 频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。 和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并 不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示:

该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】 确定是否在结果中输出频数表。 【Statistics钮】 单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。 现将各部分解释如下:

统计学习题与答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指( 3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高 5%,职工人数增加 2%,则企 业工资总额增长( 2 )。 选项一: 10.0% 选项二: 7.1% 选项三: 7.0% 选项四: 7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了 1978 年以来历年我国人均 GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?( 2 ) 选项一:直方图 选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一: r=1

选项二: r=-1 选项三: r=0 选项四: r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组, 下限为 200,相邻组组中值为170,则末位组中值为 选项一: 230 选项二: 200 选项三: 210 选项四: 180 问题:若两变量的r=0.4 ,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。( 1 ) 。 选项一: 40%的点都密集分布在一条直线的周围 选项二: 40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是( 1 )选项一: SSA 选项二: SSE 选项三: 选项四: 问题:人口普查规定标准时间是为了 ( 1 ) 。 选项一:避免登记的重复与遗漏 选项二:将来资料具有可比性 选项三:确定调查单位 选项四:登记的方便 问题: SST的自由度是( 4 )。 选项一: r-1

统计学的发展历程

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计 学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”(Politcal arthmetic)阶段 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

统计学 第2章 统计数据的描述

第2章统计数据的描述 练习: 2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的 等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业, 105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 2.3某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 2.4为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果 如下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701

数据统计练习

数据统计19 1、某市为了了解市民对于“PM 2.5浓度升高时,对于户外活动的影响”的态度,随机抽取了部分市民进行调查.根据调查的相关数据,绘制的统计图表如下: PM2.5浓度升高时,对于户外活动公众态度统计表: 根据以上信息解答下列问题: (1)直接写出统计表中m 的值; (2)根据以上信息,请补全条形统计图; (3)如果该市约有市民400万人,根据上述信息,请你估计一下持有“影响很大,尽可能不去户外活动”这种态度的约有多少万人. 2、某校检测学生跳绳水平,抽样调查了部分学生的“1分钟跳绳”成绩,并绘制了下面的频 数分布直方图(每小组含最小值,不含最大值)和扇形图 (1)D 小组的人数是 人,补全频数分布直方图,扇形中m = ; (2)本次调查数据的中位数落在 组; (3)如果“1分钟跳绳”成绩大于等于120次为优秀,那么该校4500名学生中“1分钟跳 绳”成绩为优秀的大约有多少人? PM2.5浓度升高时对于户外活动 公众的态度的条形统计图

3、某学校为了提高学生学科能力,决定开设以下校本课程:A.文学院,B.小小数学家,C.小小外交家,D.未来科学家,为了解学生最喜欢哪一项校本课程,随机抽取了部分学生进行调查,并将调查结果绘制成了两幅不完整的统计图,请回答下列问题: (1) 这次被调查的学生共有_________人 (2) 请你将条形统计图(2)补充完整 (3) 在平时的小小外交家的课堂学习中,甲、乙、丙、丁四人表现优秀,现决定从这四名同学中任选两名参加全国英语口语大赛,则恰好同时选中甲、乙两位同学的概率为_________ 4、初三年级教师对试卷讲评课中学生参与的深度与广度进行评价调查,其评价项目为主动质疑、独立思考、专注听讲、讲解题目四项.评价组随机抽取了若干名初中学生的参与情况,绘制成如图所示的频数分布直方图和扇形统计图(均不完整),请根据图中所给信息解答下列问题: (1) 在这次评价中,一共抽查了名学生,请将频数分布直方图补充完整 (2) 在扇形统计图中,项目“主动质疑”所在的扇形的圆心角的度数为__________度 (3) 如果全市有6000名初三学生,那么在试卷评讲课中,“独立思考”的初三学生约有多少人?

描述统计学

2. 数据汇总Summarizing Data 频数分布与图形展示 本章和下一章讨论有关统计描述的问题。关于收集、组织、展示数值数据的方法。其中包括描述各种数据分布,各种统计图形的使用,描述数据的各种指标,如平均值、期望值、方差等等。 2.1 频数分布Frequency distribution 为了进行决策或推断,我们需要信息。例如,为了进行制定有关销售方面的决策需要了解员工的实际销售情况,或者说要获得有关销售的信息。获得了数据以后,就需要对数据进行组织,也就是将数据组织成容易观察的形式。然后就是展示数据,通常都是以图形的方式。最后就可以得出关于这一组数据的结论,并将这些结论用于决策。 一种常用的方式是首先获得一组原始数据。将这组数据组织成数组,即将数据从大到小或从小到大进行排序。然后将其总结成一组频数分布。也就是将这一数组按一定的间隔进行计数,清点出位于每一间隔中的数据出现的次数。这样就获得了频数表或频数分布。 频数分布就是一张显示一组数据位于每一独立区间间隔内的次数的数据表格。频数分布也称为频数表。 频数分布又可以划分为定性数据的频数分布和定量数据的频数分布。一般我们主要对定量数据进行频数分布研究。 为了建立一频数分布,我们需要确定: ? 间隔的数量, ? 间隔的长度(或宽度), ? 间隔的边界,或者说是划分间隔的位置 然后我们就可以清点落在每一间隔中的数值。 例: PP28表2-2显示了一个频数分布。 确定间隔长度(或宽度)的公式为: 间隔数量 最小值 最大值估计的间隔长度-= 在此,如果间隔数量选为8,则间隔的长度应该为: 813.88 26000 96500=-= 估计的间隔长度 当然,这个数值看起来不太好,所以可以取整为9000或10000。 如果我们不能确定应该用多少个间隔数量,则可以通过下列估计间隔长度的公式进行计算:

第二章 统计数据的描述

第二章统计数据的描述 一、填空题: 1.统计分组有等距分组与异距分组两大类。 2. 频率是每组数据出现的次数与全部次数之和的比值。 3. 统计分组的关键在于确定组数和组距。 4. 统计表从形式上看,主要由表头(总标题)、横行标题、纵栏标题和数字资料(指标数值)四部分组成。 5. 均值是测度集中趋势最主要的测度指标,标准差是测度离散趋势最主要的测度指标。 6.当平均水平和计量单位不同时,需要用变异系数(离散系数)来测度数据之间的离散程度。 7.众数是一组数据中出现次数最多的变量值。 8.对于一组数据来说,四分位数有 3 个。 二、单项选择题: 1. 次数是分配数列组成的基本要素之一,它是指( B )。 A、各组单位占总体单位的比重 B、分布在各组的个体单位数 C、数量标志在各组的划分 D、以上都不对 2. 某连续变量数列,其末组为600以上。又如其邻近组的组中值为560,则末组的组中值为 ( D )。 A、620 B、610 C、630 D、640 3. 变量数列中各组频率的总和应该是( B )。 A、小于1 B、等于1 C、大于1 D、不等于1 4. 某连续变量数列,其首组为500以下。又如其邻近组的组中值为520,则首组的组中值为 ( C )。 A、460 B、470 C、480 D、490 5. 在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响(D ) A、算术平均数和调和平均数 B、几何平均数和众数 C、调和平均数和众数 D、众数和中位数 6. 在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取(D )

A、9.3 B、9 C、6 D、10 7. 一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断( B) 用变异系数算 A、男生体重的差异较大 B、女生体重的差异较大 C、男生和女生的体重差异相同 D、无法确定 8. 某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是( A ) 众数12 中位数12 平均数12 A、均值=中位数=众数 B、众数>中位数>均值 C、中位数>均值>众数 D、均值>中位数>众数 9. 按连续型变量分组,最后一组为开口组,下限值为2000。已知相邻组的组距为500,则最后一组组中值为(B ) A、2500 B、2250 C、2100 D、2200 10. 下列数据是某班所有学生的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,85,95,86,78,86,45,87,92,73,82。这些成绩的极差是(B) A、78 B、50 C、45 D、40 11. 下列关于众数的叙述中,不正确的是( C ) A、一组数据可能存在多个众数 B、一组数据可能没有众数 C、一组数据的众数是唯一的 D、众数不受极端数值的影响 三、多项选择题: 1. 下列分组哪些是按品质标志分组?(BCDE ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有制分组 E、人口按地区分组 F、职工按收入水平分组 2. 下列分组哪些是按数量标志分组(AF )。 A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有志分组 E、人口按地区分组 F、职工按收入水平分组 3. 下列哪些属于离散程度的测度指标(BDE )。 A、几何平均数 B、极差 C、中位数 D、方差 E、离散系数 4. 下列哪些属于集中趋势的测度指标(AC )。

1统计和数据练习题

第一章统计和数据练习题 一、单项选择题 1、下列变量是定性变量的是() A、年龄 B、教育程度 C、居民的受教育年限 D、月收入 2、下列变更是定量变更的是()。 A、天气形势 B、籍贯 C、职业 D、天气温度 3、根据获取方法不同,数据可分为预测数据和()。 A、描述数据 B、实验数据 C、推断数据 D、分析数据 4、下列关于变量数据的说法错误的是()。 A、分类数据只能用来区分事物,不能用来表明事物间的大小、优劣 B、顺序数据具有数值特征,可以用于反映事物在数量上的差异 C、数值型数据的计量功能要大于分类数据和顺序数据 D、在统计学研究中,对数值型数据的研究是定量分析的主要内容 5、若产品质量由高到低划分为三个级别:1级、2级、3级,则下列说法中正确的是()。 A、1级品质量是2级品的两倍 B、2级产品的质量是1级品的两倍 C、产品质量级别是顺序数据 D、产品质量级别是定量数据 6、顺序数据()。 A、是一种定量数据 B、可以进行排序,表明事物之间的大小、优劣关系

C、可以反映事物在数量上的差异 D、其计算功能与数值型数据相同 7、首先将总体分成不同“层(或组)”,然后在每一层内进行抽样。此种抽样方法是()。 A、概率抽样 B、分层抽样 C、非概率抽样 D、整群抽样 8、当调查任务只要求掌握事物的基本状况与发展趋势,而不要求掌握全面的准确资料,下列调查中比较适宜的是()。 A、全面调查 B、典型调查 C、抽样调查 D、重点调查 9、大型企业每月月未需要向有关部门提供财务报表数据,这属于()。 A、统计报表 B、普查 C、重点调查 D、抽样调查 10、在总体中的名录框中每隔一定距离抽选一个被调查者的抽样方法是()。 A、概率抽样 B、分层抽样 C、等距抽样 D、整群抽样 11、研究搜集、处理和描述的统计学方法是()。 A、描述统计 B、推断统计 C、理论统计 D、应用统计 12、研究如何利用样本数据来推断总体特征的统计学方法是()。 A、描述统计 B、推断统计 C、理论统计 D、应用统计 13、下列关于数据类型的说法,错误的是()。 A、职业是定性变量 B、产品的质量等级是定量变量 C、教育程度是定性变量 D、某地区历年人口数是定量变量 14、通过统计调查得到的数据,一般称为()。 A、定性数据 B、定量数据 C、次级数据 D、观测数据

第二章 统计数据的搜集习题

第二章统计数据的搜集 练习题 一、填空题 1.常用的统计调查方式主要有、、、、等。 2.典型调查有两类:一是;二是。 3.统计调查按调查对象包括的范围不同可分为、。 4.确定调查对象时,还必须确定两种单位,即和。 5.重点调查是在调查对象中选择一部分进行调查的一种调查。 6.询问调查具体包括、、、、、等。 7.访问调查的方式有、。 8.邮寄调查的问卷发放方式有、、三种。 9.根据观察者是否使用科学的观察仪器,观察可分为和。 10.调查表一般由、和三部分组成。 11.就一般的统计数据而言,其质量评价标准为、、、、、。 二、单项选择题 1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。 A普查B典型调查C抽样调查D重点调查 2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。 A统计报表B重点调查C全面调查D抽样调查 3.人口普查规定统一的标准时间是为了( )。 A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便 4.以下哪种场合宜采用标准式访问( )。 A居民入户调查B座谈会C当事人或知情者个别采访D观察法 5.某地进行国有商业企业经营情况调查,则调查对象是( )。 A该地所有商业企业B该地所有国有商业企业 C该地每一国有商业企业D该地每一商业企业 6.以下哪种调查的报告单位与调查单位是一致的( )。 A 工业普查B工业设备调查C职工调查D未安装设备调查 7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。 A原始资料来源于基层单位,次级资料来源于上级单位 B次级资料是由原始资料加工整理而成 C原始资料与次级资料之间无必然联系 D原始资料与次级资料没有区别 8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。 A单一表和复合表B单一表和一览表

相关文档
相关文档 最新文档