文档库 最新最全的文档下载
当前位置:文档库 › 统计学作业题

统计学作业题

统计学作业题
统计学作业题

统计学作业题

专业:——————

年级:——————

班级:——————

姓名:——————

第1章导论

1.某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英以上的高度。经估计,森林公园生长着25 000棵成年松树,该研究需要从中机抽取250棵成年松树井丈量它们的高度后进行分析。该研究的总体是( )。

A. 250棵成年松树

B.公同中25 000棵成年松树

c.所有高于60英尺的成年松树 D.森林公园中所有年龄的松树

2.某森林公园的-项研究试图确定成年松树的高度。该研究需要从中随机抽取250棵成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是( )。

A.森林公园巾松树的年龄

B.森林公园中松树的高度

c.森林公园中松树的数量 D.森林公园中树木的种类

3.推断统计的主要功能是( )。

A.应用总体的信息描述样本

B.描述样本中包含的信息

c.描述总体中包含的信息 D.应用样本信息描述总体

4.对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是( )的结果。

A.定性变量

B.试验

c.描述统计 D.推断统计

5.一名统计学专业的学生为了完成其统计作业,在图书馆找到的一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告为来源于( )。

A.试验

B.实际观察

c.随机抽样 D.已发表的资料

6.某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据收集方式可以认为是( )。

A.观察研究

B.设计的试验

c.随机抽样 D.全面调查

7.下列不属于描述统计问题的是( )。

A.根据样本信息对总体进行的推断

B.感兴趣的总体或样本

c.图、表或其他数据汇总工具 D.对数据模式的识别

8.下列不属于推断统计问题的是( )。

A.感兴趣的总体

B.对数据模式的识别

c.需要调查的变量 D.对总体推断结果的可靠性度量

9.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书

上的花费是250元。该研究人员感兴趣的总体是( )。

A.该大学的所有学生

B.所有的大学生

c.该大学所有的一年级新生 D.样本中的200名新生

10.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。在研究中,该研究人员感兴趣的变量是( )。

A.该大学-年级新生的教科书费用

B.该大学的学生数

c.该大学新生的年龄 D.大学生的生活成本

11. 1990年发表的一份调查报告显示,为了估计佛罗里达州有多少居民愿意支付更多的税金以保护海滩的环境不受破坏,共有2 500户居民接受了调查。

在该项调查中,最有可能采用的数据收集方法是( )。

A.设计的试验

B.公开发表的资料

c.随机抽样 D.实际观察

12.在下列叙述中,关于推断统计的描述是( )。

A.一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌

B.从一个果园中抽取36个椅子的样本,用该样本的平均重量估计果园中椅子的平均重量

C一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的条形图

13.在下列叙述中,不属于推断统计的描述是( )。

A.从总体中抽取一个样本

B.总体必须是己知的

c.需要对一个或若干个变量进行调查D.关于可靠性的度量无法确定

14.在下列叙述中,错误的是( )。

A.可以从公开发表的资料中获取数据

B.最主要的调查类型之一是民意调查,如美国盖洛普(Gallup)调查公司的民意调查

c.在医疗试验中,参加试验的个人被分成两组:控制组和治疗组

D.从调查中获得的数据通常比从试验中获得的数据更加可靠

15.美国盖洛普调查公司的一项民意调查需要确定年轻人愿意与其父母讨论的话题。46%的年轻人愿意与其父母讨论家庭财务状况,37%的年轻人愿意与其父母讨论有关教青的话题,30%的年轻人愿意与其父母讨论宗教问题。该调查基于一个从美国年轻人中随机抽取的包含505人的样本。在下列叙述中,正确的是( )。

A.该研究通过设计的试验完成

B.收集到的数据属于定性数据

c.该研究的结论可以用于推断所有美国的上述比率

D.如果抽样过程是正确的,上述样本与其他容量为505人的样本具有同等被抽中的机会

16.你询问了你们班的8位同学在去年的统计学成绩,这些成绩的平均数是65分。基于这种信息,你认为全班在去年的统计学平均成绩不超过70分。这个例子属于统计学的哪个分支( )?

A.参数统计

B.描述统计

c.推断统计 D.理论统计

17.根据样本计算的用于描述总体特征的度量工具(如均值)被称为( )。

A.参数

B.总体

c.样本 D.统计量

18.在下列叙述中,错误的是( )。

A.统计推断区别于算命的一个主要特点是可以进行可靠性度量

B.根据样本推断总体,无法确定可靠性

c.用样本推断总体,总是存在-定程度的不确定性

D.可靠性是关于统计推断不确定性的度量

19.在大学校园里停车变得越来越困难。后勤管理处希望掌握学生在校园里找到停车位的平均时间。一个管理人员眼踪了250名学生并记录下了他们的停车时间。该大学感兴趣的总体是( )。

A.管理人员跟踪过的250名学生

B.上午在大学校

园停车的学生 c.在大学校园停车的所有学生

D.在大学校园停车的教职工和学生

20.某机构十分关心小学生每周看电视的时间。该机构请求300名小学生家长对他们的孩子每周看电视的时间进行了估计。结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5。该机构收集数据的方法是( )。

A.调查

B.观察

c.试验 D.公开发表的资料

21.某手机厂商认为,如果流水线上组装的手机出现故障的比率每天不超过3%,则认为组装过程是令人满意的。为了检验某天生产的手机质量,厂商从当天生产的手机中随机抽取了30部进行检测。手机厂商感兴趣的总体

是( )。

A.当天生产的全部手机

B.抽取的30部手机

C.3%有故障的手机

D. 30部手机的检测结果

22.为了确定医生在过去5年因医疗事故被起诉的比率,从全国所有医生的名单中随机抽取了一个样本。在该项研究中,感兴趣的变量是( )。

A.在过去5年因医疗事故被起诉的医生

B.名单中的所有医生

c.医生的工作领域

D.医生的数量

23.最近发表的一份报告称,"由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车"。这是一个( )的例子。

A.随机样本

B.描述统计

c.总体 D.统计推断

24.一个研究者为了揭示在车祸中受伤的类型是否与系安全带有关,在图上绘制出了它们之间的关系。在这个例子中使用的统计属于( )。

A.推断统计

B.描述统计

c.既是描述统计,又是推断统计

D.既不是描述统计,也不是推断统计

25.一个研究者应用有关车祸的统计数据估计在车祸中死亡的人数,在这个例子中使用的统计属于( )。

A.推断统计

B.描述统计

c.既是描述统计,又是推断统计

D.既不是描述统计,也不是推断统计

26.一个学生对寄居在邻居家的一窝燕子很感兴趣。他每天观察并记录燕子飞出飞进的时间,以及它们喂养小燕子的习惯。在这个学生的研究中,描述这些燕子最准确的统计术语是( )。

A.总体

B.样本 c.抽样 D.调查

27.质量控制工程师从生产线上抽取样本并记录它们的重量,以保证产品重量不超出客户规定的规格范围。产品的这些规格被称为( )。

A.变量

B.样本 c.过程 D.度量

28.如果一个样本因人故意操纵而出现偏差,并对公众造成了误导,这属于

( )。

A.观察研究

B.设计试验

c.不道德的统计实践 D.调查

29.一个城市新生婴儿的男女性别比例为110 : 100,某研究者据此认为全国新生婴儿的男女性别比例偏高。这在统计上属于( )。

A.描述统计

B.推断统计 c.参数统计 D.随机抽样

30.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者感兴趣的总体是( )。

A. 100所中学

B. 20个城市

c.全国的高中学生 D. 100所中学的高中学生

31.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者最感兴趣的变量是( )。

A. 100所中学的学生数

B. 20个城市的中学数

c.全国高中学生的身高 D.全国的高中学生数

第2章统计数据的描述

2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历

表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。调查结果如下:

4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121

(1)制作一张频数分布表。

(2)绘制一张条形图,反映学历分布。

2.2在一项研究中,某调查公司为了解某品牌变速箱是否存在缺陷,从一家该汽车的维修公司

获得该汽车变速箱失效前行驶的实际里程数的资料数据如下:85092393236434274276744253783277539326098964161254 5946594219679984000111844473341774371168035981770209 9285710176925066792941381146409063436957747709864544 1213526992286813855865990285861698686934635662116269 53402324646560553500852883252466681672018934188798(1)对以上数据进行适当的分组并编制频数分布表和累积频数分布表。

(2)用直方图来表现数据的分布特征。

2.3为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信

用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):

地区企业形象客户期望质量感知价值感知客户总体满

意度

A 8.269504 7.51773 9.262411 7.914894 8.411348

B 7.447368 8.368421 8.973684 8.105263 7.394737

试用条形图反映将两地区的满意度情况。

2.4下面是一个班50个学生的经济学考试成绩:

88569179699088718279 988534744810075956092 83646569996445766369 68749481678184539124 84628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。

(2)用茎叶图将原始数据表现出来。

2.5如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。男149 160 176 180 210 310 80 95 108 140 140 144 145 150 150 150 160 168 188 210

210 210 210 105 210 210 210 110 168 175

210 356 460 210 210 210 210 210 310 210

210 210 210 210 210 210 375 375 380 380

388 450 560 600 650 120 30 120 75 210 女120 330 345 374 375 380 700 90 700 60 140 150 160 210 210 210 210 150 175 175

210 175 210 210 210 400 430 450 120 175

178 180 180 185 185 190 195 196 200 200

210 210 210 210 210 210 210 210 330 330

(2)用一张条形图将男女两组数据同时表现出来。

(3)分别绘制直方图,并对比男女近视度数的分布特征。

2.6为了研究各国第三产业的发展状况,我们需要分析各国的第三产业占其国内生产总值的比

重,下表中的数据为33个国家和地区的第三产业占其GDP的比重的数据。

单位%25.130.136.138.439.9424444.247.348.449.3 49.551.151.151.254.755.7575860.360.361.6 62.262.365.265.666.466.768.670.671.571.884.1

(1)请你对该数据进行适当分组

(2)制作直方图。

2.7一家连锁店拥有多家分店,为分析各家分店的销售状况,管理部门收集了两家规模相近的

分店的销售额数据,下面是A、B两家分店50天销售额数据的排序(单位:万元):

A分店:

44575960616162636365 66666769707071727373 73747474757575757576 76777777787879808082 85858686909292929396

B分店:

35394044444851525254 55565657575758596061 61626364666868707071 71737474798182838384 85909191949596100100100

(1)将两个分店的销售额用一个公共的茎制成茎叶图。

(2)比较两个分店销售额分布的特点。

123456789101112英语664439585234747151416451政治696658566840736562485864

专业课1 54252036214824228353919

专业课2 906285816454737868668075

专业课3 815645627063768665217473制作箱线图并分析各课成绩的分布特征。

2.9某公司招收推销员,要测定男女推销员的推销能力是否有差别,名随机抽选了8人,经过

一段时间销售,取得数据如下:

男推销员销售额(千元)女推销员销售额(千元)

31 35

12 27

52 24

51 22

20 55

19 49

28 14

29 44 (1)绘制箱线图比较男女推销员销售额数据的分布。

(2)并用描述数据集中趋势的测度值说明男女推销员销售额的差异。

1992199319941995199619971998199920002001

职工工资

增长指数

118.5 124.8 135.4 121.7 112.1 103.6 100.2 106.2 107.9 111.0 (%)

居民消费

价格指数

106.4 114.7 124.1 117.1 108.3 102.8 99.2 98.6 100.4 100.7 (%)

资料来源:《中国统计年鉴》中国统计出版社。

试根据上表数据比较我国1992年到2001年间职工工资增长指数与平均居民消费价格指数的平均增长速度。

2.11下表所给数据为某楼盘一年四个季度的出租情况:

社区外租套数

x

出租率(%)

f

租金

y

A 516 95 400

B 481 97 450

C 364 92 600

D 427 89 520

请根据上表提供数据计算平均租金和平均出租率。

2.12气象局为研究我国的气温变化,对我国北方两个城市1月份和2月份的气温作了记录。数

据如下表:

气温(℃)城市A的天数城市B的天数-30~-25 6 1

-25~-20 12 4

-20~-15 20 9

-15~-10 10 15

-10~-5 4 16

-5~0 3 7

0~5 3 4

5~10 1 3

合计59 59 (1)计算两城市的气温的均值。

(2)计算两城市气温的标准差。

(3)比较两城市气温离散程度的大小。

第3章 概率与概率分布

3.1 抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A 定义为:事件A=出现正面, 这

一事件的概率记作)(A P 。请说明概率21)( A P 的含义。

3.2 假定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?

3.3 考虑某离散型随机变量X ,若X ~B(100,0.2),试计算这100次贝努里试验中恰好有15次成功的概率。

第4章抽样与抽样分布

4.1已知某树苗培植园内的树苗的树茎直径服从正态分布,从中随机抽取了10株,测得其树茎

直径数据如下(单位:厘米):

10.1 8.9 7.6 11.3 10.7 9.4 9.9 10.2 10.5 11.7

(1)试求该批树苗直径的平均值及标准差。

(2)你能否推断该园内树苗直径的具体分布是什么?

4.2设一总体的由5个元素构成,其指标值为{}

3、

、。问:

7

13

9

8

(1)该总体的均值μ和方差2

σ是多少?

(2)若采用重复抽样的方法从该总体中抽取样本量为2的样本,则样本均值x的数学期望和方差是多少?

(3)若采用不重复抽样的方法从该总体中抽取样本量为2的样本,计算所有可能样本的x 及2s,计算E(x)并与第二问作比较。

4.3某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产

量的平均值为1700(百斤)标准差为200(百斤)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?

4.4某地区工人的平均工资是15元/小时,标准差为4元/小时。若从该地区抽取n=50个工厂,

问所取得样本的平均工资w的期望和方差各是多少?平均工资w的抽样分布是什么?

第5章参数估计

5.1一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务的

满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比例进行区间估计。

5.2 为了确定某大学学生配戴眼镜的比例,调查人员欲对该大学的学生进行抽样调查。而根据

以往的调查结果表明,该大学有75%的学生配戴眼镜。则对于边际误差E 分别为(1)5%;(2)10%;(3)15%时,抽取的样本量各为多少较合适?(05.0=α)

5.3 为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样

本均值为6.75小时,样本标准差为2.25小时。

(1)试对家庭每天平均看电视时间进行区间估计。

(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在第一问的水平,问此时需调查多少户才能满足要求?(05.0=α)

5.4 据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比

例p 的区间估计,在置信水平为10.0=α下,其边际误差E =0.08。则: (1)这80名受访者样本中为本地购房者的比例p 是多少?

α,则要保持同样的精度进行区间估计,需要调查多少名购房(2)若置信水平为05

.0

=

者。

5.5为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的

柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s=4.1分钟,则:

(1)其95%的置信区间是多少?

(2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少?

第6章假设检验

6.1电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视

机厂宣称其生产的显像管质量大大超过规定的标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命1245小时。能否说该厂的显像管质量显著地高于规定的标准?(1)给出上题的原假设和被择假设。

(2)构造适当的检验统计量,并进行假设检验,分析可能会犯的错误(取α=0.05)。(3)若要拒绝原假设,样本平均寿命至少要达到多少,此时可能会犯哪类错误,大小如何?

6.2由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂

家必须确信其所推荐新的生产方法能降低成本。目前生产中所用的生产方法成本均值为每小时200元。对某种新的生产方法,测量其一段样本生产期的成本。

(1)在该项研究中,建立适当的原假设和备择假设。

(2)当不能拒绝

H时,试对所做的结论进行评述。

(3)当可以拒绝

H时,试对所做的结论进行评述。

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

西南财大版统计学原理统计学作业练习题及答案。

第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表: 要求:(1)计算样本平均数和抽样平均误差。(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。 2.采用简单随机重复抽样方法,在2 000件产品中抽查200件,其中合格品190件。 要求:(1)计算合格品率及其抽样平均误差。(2)以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从 5 000个产品中抽取进行调查.其结果如下: 要求:试根据上述资料:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。(3)根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。 4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下: 抽查结果统计表 要求:(1)以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。(2)以同样的概率保证估计该批茶叶合格率范围。

5.某工厂生产一种新型灯泡5000只,随后抽取100只作耐用时间测试。结果表明,平均寿命为4500小时,标准差300小时,试在90%的概率保证下,估计该新式灯泡平均寿命时间,假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试。 6.调查一批机械零件合格率。根据过去资料,合格品率曾有过99%、97%、95%三种情况,现在要求误差不超过1%,要求估计的把握程度为95%,问需要抽查多少零件?(提示:总体方差取最大值) 7.某部门对职工进行家庭经济情况调查,取得年度项抽样资料如下,试以90%的概率保证程度,估计该部门职工的家庭月收入。 抽查结果统计表 8.某市有职工10万人,其中:职员4万人,工人6万人,现进行职工收入抽样调查,并划分职员与工人两类进行选样,要先按不同类型抽查40名职员与60名工人,结果如下:要求这次调查的极限误差不超过2元,概率保证程度 95.45%,试按类型抽样组织计算必要的抽样数目。 如果按简单随机抽样组织,试问:(1)同样的?和t,需按抽取多少样本单位数。(2)同样的样本单位数和概率保证程度,则会有多大的极限抽样误差。(3)同样的样本单位数和?应有多大的概率保证程度。 9.从某县的100个村中抽出10村进行各村的全户调查设平均每户饲养家禽35头,每村平均数的方差为16。 要求:(1)以90%的概率估计全县平均每户饲养家禽数。(2)如果极限误差 2.412 ?= x 则其概率保证程度如何?

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

统计学原理计算题及答案

2 ?采用简单重复抽样的方法从一批零件中抽取 200件进行检查,其中合格品 188件。要求: (1) 计算该批零件合格率的抽样平均误差; (2) 按95.45%的可靠程度(t=2,就是我们现在的Z )对该批零件的合格率作出区间估计。 解:n =200,n =188 (1)合格率 = 1?^ = 94% n 200 合格率的抽样平均误差 p(1 — p) 「0.94 x 0.06 J0.0564 . ---------- 0.000282 = 0.01679 = 1.679%(2)按95.45%的可靠程度对该批零件的 p i n , 200 \ 200 合格率作出区间估计 二Z 」p =2 1.68% =3.36% p - :p =94% -3.36% =90.64% p :P =94% 3.36% =97.36% 该批零件合格率区间为: 990.64%乞P 乞97.36% 要求: (1) 试计算各年的环比发展速度及年平均增长量。 (2) 如果从2006年起该地区的粮食生产以 10%的增长速度发展,预计到 2010年该地区的粮食产量将达到什么水平? 2006年起该地区的粮食生产以 10%的增长速度发展 x =1 10% =110% 71 预计到2010年该地区的粮食产量将达到 解: (1) 各年的环比发展速度 472 二 108.76% a 0 434 a 2 516 109.32 % 472 a g 584 a 2 516 = 113.18% 618 =105.82% a 4 年平均增长量 累计增长量 累计增长个数 …=618一434」84=46 4 4 4 (2)如果从

统计学原理计算题试题及答案

电大专科统计学原理计算题试题及答案 计算题 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下

试问哪一个市场农产品的平均价格较高?并说明原因。 解: 解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.145 .5/==∑∑=x m m X (元/斤) 乙市场平均价格325.14 3 .5==∑∑= f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为9.6件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1)

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学作业习题

第一章数据与统计学 简答题 1、统计研究对象的特点?如何理解其特点? 2、试举三例你日常生活中所接触的统计问题? 3、简述描述统计与推断统计的区别与联系? 4、试举一例具体证明统计总体,总体单位和样本之间的相互关系。 第二章描述统计 简答题 描述统计与推断统计有什么关系? 2、为什么我国统计调查方法的目标模式要以经常性的抽样调查为主体? 3、什么是变异指标?有什么作用?常用的变异指标是哪一个?为什么? 4、什么是统计分组?有什么作用? 计算 5、某车间有两个小组,每组都是7人,每人日产量件数如下 第一组:20、40、60、70、80、100、120 第二组:67、68、69、70、71、72、73 这两组工人每人平均日产量件数为70件,计算每人日产量的差异指标:①全距;②平均差; ③标准差,并用变异系数比较哪个组的平均数的代表性大? 6、某企业某班组工人日产量资料表所示:

根据上表指出: (1)上表变量数列属于哪一种变量数列; (2)上表中的变量、变量值、上限、下限、次数 (3)计算组距、组中值、频率 7、某企业50名职工月工资资料如下, 550 550 580 620 670 689 694 708 712 723 741 750 784 784 796 796 796 800 800 805 805 817 816 825 825 834 895 895 900 900 984 988 982 950 932 900 876 874 8i5 83l 815 792 780 733 721 668 654 620 612 580 根据上列资料编制组距变量数列,并用统计表列出各组频率。 案例题 8、联合食品公司客户的支付方式和支付金额 联合食品公司为了了解客户的支付方式和金额,作了抽样调查并得到100个客户的样本

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学练习题最新版

第一章 一、判断对错 1、社会经济统计的研究对象是社会经济现象总体的各个方面。 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。 3、社会经济统计学的研究对象是社会经济现象的数量方面, 但它在具体研究时也离不开对现象质的认识。 4、总体的同质性是指总体中的各个单位在所有标志上都相同 5、品质标志表明单位属性方面的特征,其标志表现只能用 文字表现,所以品质标志不能直接转化为统计指标。 6、品质标志说明总体单位的属性特征,质量指标反映现象 的相对水平或工作质量,二者都不能用数值表示。 答案?????? 二、单项选择题 1、构成统计总体的个别事物称为() A、调查总体 B、标志值 C、品质标志 D、总体单位 2、对某城市工业企业未安装设备进行普查,总体单位() A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 3、几位学生的某门课成绩分别是67分、78分、88分、89分、 96分,“学生成绩”是() A、品质标志 B、数量标志 C、标志值 D、数量指标 4、统计指标按所反映的数量特点不同可以分为数量指标和质量 指标两种。其中数量指标的表现形式是() A、绝对数 B、相对数 C、平均数 D、百分数 5、在全国人口普查中() A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 6、了解学生的学习情况,要调查足够多的学生, 这个方法称为() A、大量观察法 B、统计分组法 C、综合指标法 D、相关分析法 答案D B B A B A 三、多项选择题 1、要了解某地区全部成年人口的就业情况()ABD A、全部成年人是研究的总体 B、成年人口总数是统计指标 C、成年人口就业率是统计标志 D、某人职业是教师是标志表现 E、反映每个人特征的职业是数量指标 2、下列各项中,属于统计指标的有()ACD A、2010年全国人均国内生产总值 B、某台机床使用年限 C、某市年供水量 D、某地区原煤生产量 E、某学员平均成绩 3、在工业普查中()BCE A、工业企业总数是统计总体 B、每一个工业企业是总体单位 C、固定资产总额是统计指标 D、机器台数是连续变量 E、职工人数是离散变量 4.下列统计指标中,属于质量指标的有( ) BDE A、工资总额 B、单位产品成本 C、出勤人数

00974统计学原理练习题

00974统计学原理 一、单选 1、下列调查中,调查单位与填报单位一致的是( D )。 A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 2、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为: y c = 56 + 8x,这意味着( C ) 3、 A. 废品率每增加1%,成本每吨增加64元 B. 废品率每增加1%,成本每吨增加8% 4、 C. 废品率每增加1%,成本每吨增加8元 D. 废品率每增加1%,则每吨成本为56元 3、2005年某地区下岗职工已安置了万人,安置率达%,安置率是( D )。 A.总量指标 B.变异指标 C.平均指标 D.相对指标 4、下面现象间的关系属于相关关系的是( C )。 A. 圆的周长和它的半径之间的关系 B. 价格不变条件下,商品销售额与销售量之间的关系 C. 家庭收入愈多,其消费支出也有增长的趋势 D. 正方形面积和它的边长之间的关系 5、分配数列各组标志值和每组次数均增加15%,加权算术平均数的数值( B )。 A.减少15% B.增加15% C.不变化 D.判断不出 6、次数分配数列是( D)。 A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列 7、对于不同水平的总体不能直接用标准差比较其标志变异度,这时需分别计算各自的 ( A )来比较。 A.标准差系数 B.平均差 C.全距 D.均方差 8、企业按资产总额分组( B ) A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 9、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( B )。 A. 10% B. % C. 7% D. 11% 10、在进行分组时,凡是遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是 ( B )。

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学练习题

第一章 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1.在下列叙述中,不正确的是()。 A.“statistics”可以表示统计学 B.“statistics”可以表示统计数据 C.“statistics”可以表示统计资料 D.“statistics”可以表示统计检验 2.在下列叙述中,关于推断统计的描述是()。 A.一个饼图描述了某医院治疗的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个橘子的样本,用该样本的平均重量估计果园中橘子的平均重量 C.一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的条形图 3.连续变量()。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。在研究中,该研究人员感兴趣的变量是()。 A.该大学一年级新生的教科书费用 B.该大学的学生数 C.该大学一年级新生的教科书数量 D.大学生的生活成本 5.根据样本计算的用于描述总体特征的度量工具(如均值)被称为()。 A.参数 B.总体 C.样本 D.统计量 6.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,样本是()。 A.100所中学 B.20个城市 C.全国的高中生 D.100所中学的高中生 7.以一个企业作为总体,下列属于质量统计指标的是()。 A.商品销售额 B.产品合格率 C.商品库存量 D.产品产量 8.在某市工业设备普查中,调查单位是()。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 该市全部工业企业中的每一台工业生产设备 9.某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

统计学原理计算题

一、时间序列: 1.某公司某年9月末有职工250人,10月上旬的人数变动情况就是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍,同日又有3名职工辞职离 岗,9日招聘7名营销人员上岗。试计算该公司10月上旬的平均在岗人数。 解: 1.2562 12232 2591252225822623250=++++?+?+?+?+?= = ∑∑f af a 要求:(1)具体说明这个时间序列属于哪一种时间序列。 (2)分别计算该银行2001年第一季度、第二季度与上半年的平均现金库存额。 解: 2.(1)这就是个等间隔的时点序列 (2)n a a a a a a a n n 22 13210++++++=-K 第一季度的平均现金库存额: )(4803 2520 4504802 500万元=+ ++=a 第二季度的平均现金库存额: )(67.5663 2580 6005502 500万元=+ ++=a 上半年的平均现金库存额: 33.5232 67 .566480,33.52362580 6005504802 500=+==+ ++++=或K a 答:该银行2001年第一季度平均现金库存额为480万元,第二季度平均现金库存额为566、67 万元,上半年的平均现金库存额为523、33万元、 要求计算:①第一季度平均人数;②上半年平均人数。 解: 第一季度平均人数: )(10322 1221020 10501210501002人=+?++?+=a 上半年平均人数:

10233 21321008 102022102010501210501002=++?++?++?+=a 解: 解:产品总产量 ∑=+++++=)(210005000040003000400030002000件a 产品总成本 ∑=+++++=)(1.1480.346.279.214.286.216.14万元b 平均单位成本)/(52.70210001.148件元件 万元 总产量总成本= = ∑∑∑a b c 或:平均单位成本)(52.706 2100010000 61 .148万元=?= =a b c 答:该企业2001年上半年的产品平均单位成本为70.52元/件。 要求:(1)计算并填列表中所缺数字。 (2)计算该地区1997—2001年间的平均国民生产总值。 (3)计算1998—2001年间国民生产总值的平均发展速度与平均增长速度。 解: (1)计算表如下: 某地区1996--2000年国民生产总值数据 (2) )(88.545 9.61585.6811.459.40万元=++++== ∑n a a

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学练习题

1.设,,…,是从某总体X中抽取的一个样本,下面哪一个 不是统计量() A.= B. C. D. 2.下列不是次序统计量的是() A.中位数 B. 均值 C. 四分位数 D.极差 3.抽样分布是指() A.一个样本各观测值的分布 B. 总体中各观测值的分布 C. 样本统计量的分布 D.样本数量的分布 4.格局中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() A. B. C. D. 5.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() A. B. C. D. 6.从均值为、方差为(有限)的任意一个总体中抽取大小为n的样本,则() A. 当n充分大时,样本均值的分布近似服从正态分布 B. 只有当n<30时,样本均值的分布近似服从正态分布 C. 样本均值的分布与n无关 D. 无论n多大,样本均值的分布都为非正态分布 7.从一个均值=10、标准差=的总体中随机选取容量为n=36的样

本。假定该总体并不是很偏的,则样本均值小于的近似概率为()。 A. B. C. D. 8.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布为()。 A.服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D.服从分布 9.从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差() A.保持不变 B. 增加 C. 减小 D.无法确定 10.总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为()A. 50, 8 B. 50,1 C. 50,4 ,8 11.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250元,标准差为40元 B. 正态分布,均值为2500元,标准差为40元 C. 右偏,均值为2500元,标准差为400元 D. 正态分布,均值为2500元,标准差为400元 12.某班学生的年龄分布是右偏的,均值为22,标准差为。如果采取

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

《统计学原理》计算题

《统计学原理》计算题

《经济统计学》习题(计算题) 1. 有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件,乙组工人日产量资料如下: 日产量件数 工人数(人) 10~20 15 20~30 38 30~40 34 40~50 13 要求:(1)计算乙组平均每个工人的日产量和标 准差。 (2)比较甲、乙两生产小组哪个组的产量差异程度大? 解:计算结果如下表: 日产量计数 组中值x 工人数(人)f xf 2x f 10~20 15 15 225 3375 20~30 25 38 950 23750 30~40 35 34 1190 41650 40~50 45 13 585 26325 合计 - 100 2950 95100 (1) 乙组 平均每人日产量:件)乙 (5.29100 2950 ==∑∑= f xf x 标 准 差

)(99.85.29100 951002 2 2 2 件)()()(乙乙乙=-= -∑?∑= ∑-∑= x x x f f f f x σ (2)267.036 6 .9== = 甲 甲 甲x V σσ 305.05 .2999 .8== = 乙 乙 乙x V σσ ∵乙 甲 σσV V π ∴乙组的产量差异程度大 2.某企业2011年四月份几次工人数变动登记如 下: 4月1日 4月11日 4月16日 5月1日 1210 1240 1300 1270 试计算该企业四月份平均工人数。 解:4月份平均工人数15 51015 130051*********++?+?+?= ∑∑ =a af a =1260(人)——间隔不 等连续时点数列 3.某企业总产值和职工人数的资料如下: 月份 3 4 5 6 月总产值(万元) 1150 1170 1200 1370 月末职工人数(千人) 6.5 6.7 6.9 7.1

相关文档
相关文档 最新文档