文档库 最新最全的文档下载
当前位置:文档库 › 统计学练习题68461

统计学练习题68461

统计学练习题68461
统计学练习题68461

第一章

一、判断对错

1、社会经济统计的研究对象是社会经济现象总体的各个方面。

2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。

3、社会经济统计学的研究对象是社会经济现象的数量方面,

但它在具体研究时也离不开对现象质的认识。

4、总体的同质性是指总体中的各个单位在所有标志上都相同

5、品质标志表明单位属性方面的特征,其标志表现只能用

文字表现,所以品质标志不能直接转化为统计指标。

6、品质标志说明总体单位的属性特征,质量指标反映现象

的相对水平或工作质量,二者都不能用数值表示。

答案??????

二、单项选择题

1、构成统计总体的个别事物称为()

A、调查总体

B、标志值

C、品质标志

D、总体单位

2、对某城市工业企业未安装设备进行普查,总体单位()

A、工业企业全部未安装设备

B、工业企业每一台未安装设备

C、每个工业企业的未安装设备

D、每一个工业企业

3、几位学生的某门课成绩分别是67分、78分、88分、89分、

96分,“学生成绩”是()

A、品质标志

B、数量标志

C、标志值

D、数量指标

4、统计指标按所反映的数量特点不同可以分为数量指标和质量

指标两种。其中数量指标的表现形式是()

A、绝对数

B、相对数

C、平均数

D、百分数

5、在全国人口普查中()

A、男性是品质标志

B、人的年龄是变量

C、人口的平均寿命是数量标志

D、全国人口是统计指标

6、了解学生的学习情况,要调查足够多的学生,

这个方法称为()

A、大量观察法

B、统计分组法

C、综合指标法

D、相关分析法

答案 D B B A B A

三、多项选择题

1、要了解某地区全部成年人口的就业情况() ABD

A、全部成年人是研究的总体

B、成年人口总数是统计指标

C、成年人口就业率是统计标志

D、某人职业是教师是标志表现

E、反映每个人特征的职业是数量指标

2、下列各项中,属于统计指标的有() ACD

A、2010年全国人均国内生产总值

B、某台机床使用年限

C、某市年供水量

D、某地区原煤生产量

E、某学员平均成绩

3、在工业普查中() BCE

A、工业企业总数是统计总体

B、每一个工业企业是总体单位

C、固定资产总额是统计指标

D、机器台数是连续变量

E、职工人数是离散变量

4.下列统计指标中,属于质量指标的有( ) BDE

A、工资总额

B、单位产品成本

C、出勤人数

D、人口密度

E、合格品率

5.下列各项中,属于连续型变量的有( ) ACD

A、基本建设投资额

B、岛屿个数

C、国民生产总值中第三产业比例

D、居民生活费用价格指数

E、就业人口数

6.下列属于存量的统计指标有() BCD

A、人口出生数

B、年末人口数目

C、生产设备台数

D、流动资金余额

E、固定资产投资总额

7.下列各项标志属于品质标志的有()ACDE

A、性别

B、年龄

C、职业

D、民族

E、出生地

8.考察某单位专业技术人员状况,下列中属于指标的有()ABDE

A、具有高级职称的有150人

B、高级职称的平均年龄为45岁

C、高级职称人员中的最低年龄为28岁

D、高级职称人员中女性占33.6%

E、高级职称人员中有博士学位的58人

1.在全国人口普查中() BCE

A、全国人口总数是统计总体

B、男性是品质标志表现

C、人的年龄是变量

D、每一户是总体单位

E、人口的平均年龄是统计指标

2.以下属于离散变量的有() BCE

A、进口的粮食数量

B、洗衣机台数

C、医院病床数

D、人均粮食产量

E、城乡集市个数

3.设某地区五家国有企业的工业总产值分别为22万元、30万元、20万元、45万元、54万元,则()ABDE

A、“所有制”是企业的品质标志

B、“工业总产值”是企业的数量标志

C、“工业总产值”是企业的统计指标

D、“产值”是变量

E、22、30、20、45、54这几个数值是变量值

第二章

一、判断对错

1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。

2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。

3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。

4、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。

5、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。

答案?????

二、单项选择题

1、在统计调查中,调查内容的承担者是 ( )

A.调查对象

B.调查单位

C.填报单位

D.统计报表

2、对我国各铁路交通枢纽的货运量调查以了解铁路货运的总体状况,这属于( )

A.普查

B.重点调查

C.抽样调查

D.典型调查

3 、在国营工业企业设备普查中,调查单位是()

A.国营工业企业的每台设备

B.每个国营工业企业

C.国营工业企业的全部设备

D.所有国营工业企业

4、抽样调查是一种( )

A.非全面调查

B.周期性调查

C.全面调查

D.经常性调查

E.大量观察法

5、对一批商品进行质量检验,最适宜采用的方法是()

A. 全面调查

B. 抽样调查

C. 典型调查

D. 重点调查

6、下列调查中,调查单位与填报单位一致的是()

A. 企业设备调查

B. 人口普查

C. 农村耕地调查

D. 工业企业现状调查

7、抽样调查的主要目的是()

A. 计算和控制抽样误差

B. 推断总体数量特征

C. 对调查单位作深入研究

D. 广泛运用数学方法

答案 B B A A B D B

三、多项选择题

三、多项选择题

1、在工业设备普查中() BDE

A、工业企业是调查对象

B、每个工业企业是填报单位

C、每台设备是填报单位

D、每台设备是调查单位

E、工业企业的全部设备是调查对象

2、制定统计调查方案,应确定() ABCE

A、调查目的和调查对象

B、调查单位和填报单位

C、调查项目和调查表

D、调查资料的使用范围

E、调查的时间和时限

3、抽样调查和重点调查的共同点是() AB

A、两者都是非全面调查

B、两者选取单位都不受主观因素的影响

C、两者都按随机原则选取单位

D、两者都按非随机原则选取单位

E、两者都可以用来推断总体指标

4、调查单位是() CE

A、需要调查的总体

B、需要调查的总体单位负责人

C、调查项目的承担者

D、负责报告调查结果的单位

E、调查对象所包含的具体单位

1、普查属于() ACE

A、一次性调查

B、经常性调查

C、全面性调查

D、非全面性调查

E、专门调查

2、下列情况调查单位与填报单位不一致的是() ABD

A、工业企业生产设备调查

B、人口普查

C、工业企业现状调查

D、农产量调查

E、城市零售商店销售情况调查

3、我国按年序每逢“5”的一年进行1%的人口调查是() BCD

A、经常性调查

B、专门调查

C、一次性调查

D、抽样调查

E、典型调查

4、下面属于非全面调查的有() ACD

A、抽样调查

B、普查

C、典型调查

D、重点调查

E、专门调查

5、对某城市职工家庭生活情况进行调查,适宜采用() CE

A、全面调查

B、经常性调查

C、抽样调查

D、重点调查

E、采访法

6、第六次全国人口普查() BCDE

A、调查对象是每一户家庭

B、调查项目较多时应采用单一表

C、一览表可同时填列若干个调查单位

D、调查单位是每个人

E、我国人口普查属专门调查

1、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。

2、分配数列的实质是把总体单位总量按照总体所分的组进行分配。

3、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。

4、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。

5、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%。

6、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。

答案??????

1.某连续变量数列,末组为500以上,其邻组的组中值为480,则末组的组中值为()。

A、510

B、520

C、530

D、540

2.划分连续变量的组限时,相邻两组的组限必须()。

A、交叉

B、不等

C、重叠

D、间断

3、统计整理的关键是()。

A、对调查资料进行审核

B、对调查资料进行统计分组

C、对调查资料进行汇总

D、编制统计表

4、下列分组中属于按品质标志分组的是()。

A、学生按考试分数分组

B、产品按品种分组

C、企业按计划完成程度分组

D、家庭按年收入分组

5、有一个学生考试成绩为80分,在统计分组中,这个变量值

应归到()组。

A、60—70分

B、70—80分

C、80—90分

D、90—100分

6、某主管局将下属企业先按轻、重工业分组,再按规模分组,

这种分组属于()分组。

A、简单分组

B、复合分组

C、分析分组

D、结构分组

答案 B C B B C B

多项选择题

1、下列数列属于()。 BCDE

按生产计划完成程度分组(%) 企业数

80─90 15

90─100 30

100─110 5

合计 50

A、品质分配数列

B、变量分配数列

C、组距式变量分配数列

D、等距变量分配数列

E、次数分配数列

2、在次数分配数列中()。CDE

A、总次数一定,频数和频率成反比

B、各组的频数之和等于100

C、各组频率大于零,频率之和等于1

D、频率越小,则组的标志值所起的作用越小

E、频率表明各组标志值对总体的相对作用程度

3、一般属于钟型分布的变量分布有()。BCDE

A、人口的死亡比率

B、人的体重

C、人的身高

D、学生考试成绩

E、工人日产量

4、统计表从形式上看其构成为()。ABCD

A、总标题

B、横行标题

C、纵栏标题

D、数字资料

E、主词和宾词

1、下列数列中,属于分配数列的有()。ACDE

A、品质数列

B、动态数列

C、变量数列

D、单项式数列

E、异距数列

2、下列分组哪些是按品质标志分组()。 BCDE

A、职工按工龄分组

B、科技人员按职称分组

C、人口按民族分组

D、企业按所有制分组

E、人口按地区分组

3、频率()。 ABCD

4、统计表按主词的分组不同,可分为()。

A、登记表

B、计算表

C、简单表

D、简单分组表

E、复合分组表

4、统计表按主词的分组不同,可分为()。CDE

A、登记表

B、计算表

C、简单表

D、简单分组表

E、复合分组表

5、下列哪些分组是按数量标志分组()。ACD

A、企业按销售计划完成程度分组

B、学生按健康状况分组

C、工人按产量分组

D、职工按工龄分组

E、企业按隶属关系分组

第三章

例某年有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为19,307元,乙企业为27,994

元。

%69%10027994

19307相对数两企业劳动生产率比较=?= 说明甲企业劳动生产率比乙企业低31% 。

多 项 选 择 题

1.生猪存栏数是属于( )。 ADE

A 、总量指标

B 、相对指标

C 、时期指标

D 、数量指标

E 、时点指标

2.下列指标中属于总量指标的有( )。 ACE

A 、工资总额

B 、商业网点密度

C 、商品库存量

D 、人均国民生产总值

E 、进出口总额

3.下列指标属于强度相对数的有( )。 ABE

A 、每人平均国民收入

B 、出生率

C 、每人平均年龄

D 、每个职工平均工资

E 、每人平均国民生产总值

4.下列属于时点指标的有( )。 BCDE

A 、商品购进额

B 、商品库存量

C 、储蓄存款余额

D 、土地面积

E 、森林资源量

5.下列属于时期指标的有( )。 ACD

A 、工业总产值

B 、某县人口数

C 、工资额

D 、收购金额

E 、在校生人数

6.时点指标的特点有( )。 BDE

A 、可以连续计数

B 、只能间断计数

C 、数值可以直接相加

D 、数值不能直接相加

E 、数值的大小与时期的长短无关

7.总量指标的计量单位的主要形式有( )。 ABC

A 、实物单位

B 、劳动单位

C 、价值单位

D 、总体单位

E 、衡量单位

1、某地区2010年人均粮食产量1600千克,这是一个平均指标。

2、某年甲、乙两地社会商品零售额之比为1∶3,这是一个比例 相对指标。

3、某公司下属五个企业,已知每个企业的资金利润率和利润额,要计算该公司平均资金利润率,采用加权算术

平均数的方法计算。

4、设有8个学生,他们某科的成绩分别是:60、40、80、60、 90、 92、84、50,则成绩的中位数是75分。

5、某企业生产某种产品的单位成本,计划在上年的基础上降低 2%,实际降低了3%,则该企业没有完成计划任务。

6、某工厂有三个流水连续作业车间,某月份车间制品合格率依次为95%、 90%、85%,则平均合格率是 90%

7、某车间生产三批产品的废品率分别为1%,2%,1.5%,三批产品的产量占全部产品产量的比重分别为25%,35%,40%,该车间三批产品的平均废品率为 %5.13

%5.1%2%1=++ 8、当各组的单位数相等时,各组单位数所占比重相等,权数的作用相等,加权算术平均数就等于简单算术平均数。

9、 标志变异指标说明分布数列的集中趋势。

10、已知甲、乙两个城市的人均可支配收入分别为2000元,2500元,且σ 甲,σ乙分别为180元,200元,则两个城市平均数代表性甲比乙好。

判断改错题答案:

1、 答:错 改:是强度相对数。

2、 答:错 改:是比较相对指标。

3、 答:错 改:采用加权调和平均数的方法计算。

4、 答:错 改: 成绩的中位数是70分。

5、 答:错 改:该企业计划完成程度为98.98%,超额完成计划

6、 答:错 改: 平均合格率=%91.89%85%90%953=??

7、答:错 改:平均废品率=%.55.1%40%

5.1%35%2%25%1=?+?+? 8、答:对

9 、答:错 改:标志变异指标说明分布数列的的离中趋势

10、答:错 改:甲:09.02000180= 乙:0.02500

200= 甲标准差系数大,说明甲平均数的代表性差。

二、多 项选 择 题

1、平均数的种类有( )。 ABCDE

A 、算术平均数

B 、中位数

C 、众数

D 、调和平均数

E 、几何平均数

2、加权算术平均数的大小( )。 ABC

A 、受各组次数多少的影响

B 、受各组标志值大小的影响

C 、受各组标志值和次数的共同影响

D 、不受各组标志值和次数的影响

E 、与各组次数多少无关

3、受极端变量值影响的平均数有( )。 ADE

A 、算术平均数

B 、中位数

C 、众数

D 、调和平均数

E 、几何平均数

4、位置平均数指( )。 DE

A 、算术平均数

B 、调和平均数

C 、几何平均数

D 、众数

E 、中位数

5、下列标志变异指标中,用无名数表示的有( )。 DE

A 、全距

B 、平均差

C 、标准差

D 、平均差系数

E 、标准差系数

6、与变量计量单位相同的标志变异指标有( )。 ABC

A 、全距

B 、平均差

C 、标准差

D 、平均差系数

E 、标准差系数

7、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断 ( )。 ADE

A 、乙单位的平均数代表性大于甲单位

B 、甲单位的平均数代表性大于乙单位

C 、甲单位的工作均衡性好于乙单位

D 、乙单位的工作均衡性好于甲单位

E 、甲单位的标准差系数比乙单位大

三、计算题

1、某地区抽样调查职工月奖金资料如下:

6 10 20 30 40 240 60 20

426

试计算平均月奖金、中位数和众数。

2、有两组乳制品销售人员上周的销售记录:已知甲组人均销售量38(箱),

标准差10箱;乙组分组资料如下:

要求:(1)计算上周乙组的人均销售量;

(2)比较甲乙两组销售人员销售量的差异程度。

答案 1 )(95.61426

26390元f f

X X ==?=∑∑ 2、解:(1)乙组的人均销售量

人)

箱f xf

x /(3220

4

45835625215=?+?+?+?==∑∑ (2)乙组销售量标准差

箱)(9204)3245(8)3235(6)3225(2)3215(2222=?-+?-+?-+?-=

σ %32.263810==甲V σ %13.2832

9==乙V σ 乙组人员销售量差异大。

第四章 例 某成品库存量如下:

现假定:每天变化是均匀的;本月初与上月末的库存量相等。则各月平均库存量为:

)件(2960)274029903150(31第二季度平均库存量)件(27402

28002680月份6)件(2990226803300月份5)件(31502

33003000月份4=++=∴=+==+==+=

a a a )件(29603

274029903150 3

228002680226803300233003000第二季度平均库存量:

上面计算可合并简化为=++=+++++= "

首末折半法"这种计算方法称为 1

22 1

222般公式:

上面计算过程概括为一1321

32211

-+++++=-++++++=--n a a a a a n a a a a a a a n n n n ΛΛ 一、单 项 选 择 题

1、最基本的动态数列是( )。

A、时点数列

B、相对数动态数列

C、绝对数动态数列

D、平均数动态数列

2、动态数列中,各个指标数值可以相加的是()。

A、相对数动态数列

B、时期数列

C、平均数动态数列

D、时点数列

3、若已知某车间一月份平均人数80人,二月份平均人数75人,三月份平均人数82人,四月份平均人数85人,则一季度月平均人数为()

A

4

85 82

75

80+

+

+

B

382

75

80+

+

C

1

4

2

/ 85

82

75

2

/

80

-+

+ +

D

4

2

/

85

82

75

2

/

80+

+

+

4、已知某市工业总产值2012年比2011年增长8%,2013年比2012

年增长5%,2014年比2013年增长10%,则2014年比2011年增长()。

A、8%+5%+10%

B、8%×5%×10%

C、108%×105%×110%

D、108%×105%×110%-100%

答案 C B B D

二、多项选择题

1、构成动态数列的两个基本要素是()。DE

A、主词

B、宾词

C、次数

D、现象所属的时间

E、统计指标数值

2、将不同时间的发展水平加以平均而得到平均数称为ABD

A、平均发展水平

B、序时平均数

C、一般平均数

D、动态平均数

E、静态平均数

三、判析题

1、总体的同质性是计算平均数和平均速度都应遵守的原则之一。

2、把某大学历年招生的增加人数按时间先后顺序排列,形成的动态数列属于时点数列。

答案1 ? 2?时期数列

四、计算题

要求:(1)计算一季度月平均工业总产值;(2)计算一季度月平均工人数。

2、某商店2014年各月末商品库存额资料如下:

又知1月1日商品库存额为53万元。试分别计算上半年、下半年的平均商品库存额。

上半年平均商品库存额为

)万元(41.401

72/4030333845502/53=-++++++ 下半年平均商品库存额为

)万元(75.426

1)25850(3)25035(2)23540(=?++?++?+ 剩余计算题见PPT

第五章 一、单 项 选 择 题

1、因素分析法的依据是( )。

A 、指标体系

B 、指数体系

C 、拉氏指数

D 、派氏指数

2、按所反映现象的特征不同,统计指数分为( )。

A 、个体指数和总指数

B 、数量指标指数和质量指标指数

C 、定基指数和环比指数

D 、综合指数和平均指数

3、若产量增加,而生产费用不变,则单位成本指数( )。

A 、减少

B 、不变

C 、增加

D 、无法预期变化

4、若价格增长5%,销售量增长4%,则销售额增长( )。

A 、 20%

B 、 9%

C 、 9.2%

D 、8%

5、某企业总产值增长50%,价格增长25%,则产量增长( )。

A 、 25%

B 、 2%

C 、 75%

D 、20%

答案 B B A C D

二、多 项 选 择 题

1、下列属于质量指标指数的有( )。 ABDE

A 、价格指数

B 、单位成本指数

C 、销售量指数

D 、工资水平指数

E 、劳动生产率指数

2、同度量因素的作用有( )。 BCD

A 、比较作用

B 、权数作用

C 、媒介作用

D 、同度量作用

E 、平稳作用

3、公式 的经济意义是( )。 BC

A 、综合反映销售额变动的绝对额

B 、综合反映多种价格变动而增减的销售额

C 、由于价格变动使消费者增减的货币支出

D、由于销售量变动而增减的销售额

E、综合反映价格和销售量变动的绝对额

三、判析题

1、已知同样多的人民币,报告期比基期少购买7%的商品,则物价指数是7%。

答案:错误。改正:购买额指数=购买量指数×物价指数

物价指数=购买额指数购买量指数

=100% ÷(1-7%)

=107.5%

2、如果报告期商品价格计划降低5%,销售额计划增长10%,则销售量应提高15%。

答案:错误。改正:销售额指数=销售量指数销售价格指数

则销售量提高百分比=(销售额指数×销售价格指数)-1

=(110% ÷95%)-1

=15.79%.

计算题见PPT

第七章

一、单项选择题

1、下面现象间的关系属于相关关系的是( )。

A、圆的周长和它的半径之间的关系

B、价格不变条件下,商品销售额与销售量之问的关系

C、家庭收入愈多,其消费支出也有增长的趋势

D、正方形面积和它的边长之间的关系

2、判定系数等于0.81,回归系数等于-3时,则相关系数为()

A.0.9

B.0.27

C.-0.9

D.-0.27

3、在相关分析中,要求相关的两个变量()。

A、都是随机变量

B、因变量是随机变量

C、都不是随机变量

D、自变量是随机变量

4、回归分析中的两个变量( )。

A、都是随机变量

B、关系是对等的

C、都是给定的量

D、一个是自变量,一个是因变量

5、已知变量X和Y的协方差为-50,X的方差为170,

Y的方差为220,其相关系数为()。

A、0.26

B、-0.26

C、0.01

D、-0.01

6、某企业根据产量(X,千件)和单位产品成本(Y,元/件)资料配合的回归方程为,这

个方程可表示()。

A、产量每增加1000件,单位成本平均下降80元

B、产量每增加1件,单位成本平均下降1元

C、产量每增加1000件,单位成本平均下降10元

D、产量每增加80件,单位成本平均下降10元

答案C C A D B C

二、多项选择题

1、相关分析的特点有( )。BCDE

A、两变量不是对等的

B、两变量只能算出一个相关系数

C、相关系数有正负号

D、两变量都是随机的

E、相关系数的绝对值介于O和1之间

2、变量间的相关关系按其程度划分有( )。ABC

A、完全相关

B、不完全相关

C、不相关

D、正相关

E、负相关

3、变量间的相关关系按其形式划分有( )。CD

A、正相关

B、负相关

C、直线相关

D、曲线相关

E、单相关

4、相关关系的种类,按影响因素多少不同分为( )。CD

A、正相关

B、负相关

C、单相关

D、复相关

E、线性相关

5、若两个变量的相关系数为0.92,则()。ACD

A、正相关关系

B、负相关关系

C、高度相关关系

D、线性相关关系

E、相关密切程度很低

6、直线回归方程中的两个变量()。CDE

A、两个都是随机变量

B、两个都是给定的变量

C、一个是自变量,另一个是因变量

D、一个是给定的变量,另一个是随机变量

E、必须确定哪个是自变量,哪个是因变量

7、可用来判断现象之间相关方向的指标有( )。BCD

A、估计标准误

B、相关系数

C、回归系数

D、两个变量的协方差

E、两个变量的标准差

8、下列关系中,相关系数小于0的现象有()。BCE

A、产品产量与原材料消耗量的关系

B、单位成本与产品产量的关系

C、商品价格与销售量的关系

D、纳税额与收入的关系

E、商品流通费用率与商品销售额的关系

9、工人的工资(元)依劳动生产率(千元)的回归方程为y=10+70x,这意味着( )。BDE

A、如果劳动生产率等于1000元,则工人工资为70元

B、如果劳动生产率每增加1000元,则工人的工资平均提高70元

C、如果劳动生产率每增加1000元,则工人工资为80元

D、如果劳动生产率等于1000元,则工人工资为80元

E、如果劳动生产率每下降1000元,则工人工资平均减少70元

三、判析题

1、变量x与y的相关系数为0.8,变量m与n的相关系数为-0.9,则x与y的相关密切程度高于m与n。( )

错变量m和n的相关程度高

2、回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。( )

错回归系数不能说明两个变量相关的密切程度。

3、估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。( )

错。估计标准误指标数值越大,说明回归方程的代表性越低

计算题见PPT

第六章

一、单项选择题

1、在抽样调查中,无法避免的误差是()

A、登记性误差

B、无意误差

C、系统性误差

D、随机误差

2、在抽样调查中()

A、全及总体是唯一确定的

B、全及指标值只有一个

C、样本是唯一确定的

D、样本指标值只能有一个

3、根据重复抽样资料,甲单位工人工资方差为25

元,乙单位为100,乙单位人数比甲单位多3倍,

则抽样平均误差()。

A、甲单位较大

B、相同

C、乙单位较大

D、无法判断

4、某工厂连续生产,一天中每隔半小时取出一分钟

的产品进行全部检查,这是()。

A、等距抽样

B、类型抽样

C、整群抽样

D、纯随机抽样

5、在纯随机重复抽样的情况下,要使抽样误差减少一半,

(其他条件不变),则样本单位数必须()。

A、增加2倍

B、增加到2倍

C、增加4倍

D、增加到4倍

6、抽样平均误差与抽样极限误差的关系为()。

A、前者小于后者

B、前者大于后者

C、前者等于后者

D、不能判定大小

答案 D A B C D D

二、多项选择题

1、按抽样方法的不同,可分为()。AE

A、重复抽样

B、等距抽样

C、类型抽样

D、整群抽样

E、不重复抽样

2、影响抽样误差的主要因素有()。ABDE

A、抽样单位数

B、抽样方法

C、总体单位数

D、抽样组织形式

E、总体被研究标志的变异程度

3、抽样估计中的抽样误差()。ABD

A、无法避免

B、可以控制

C、可以避免

D、可以计算

E、只能在估计结束才能知道

4、常用的抽样组织形式有()。ABCDE

A、类型抽样

B、等距抽样

C、整群抽样

D、简单随机抽样

E、多阶段抽样

5、影响必要抽样数目的主要因素有()。ABCDE

A、总体标准差

B、抽样极限误差

C、抽样方法

D、概率保证程度

E、抽样组织形式

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

应用统计学案例统计调查方案设计

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其它内容

包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面能够灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

《生物统计学》考试试卷

《生物统计学》考试试卷 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统 计量________。 A. 2 (1)n S σ- B. 2 20 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μμ- 二、综合题(共49分) 1. 给幼鼠喂以不同的饲料,研究每日钙的留存量(mg)是否有显著不同,按以下方式设计本试验,甲组12只喂A 饲料,乙组9只喂B 饲料。钙的留存量见下表:

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关文档
相关文档 最新文档