文档库 最新最全的文档下载
当前位置:文档库 › 统计分析与SPSS课后习题课后习题答案汇总(第五版)

统计分析与SPSS课后习题课后习题答案汇总(第五版)

统计分析与SPSS课后习题课后习题答案汇总(第五版)
统计分析与SPSS课后习题课后习题答案汇总(第五版)

《统计分析与SPSS的应用(第五版)》课后练习答案

第一章练习题答案

1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)

英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)

2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;

结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:

SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同

的数据集合(简称数据集)。

活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集

中的数据进行分析。

4、SPSS的三种基本运行方式:

完全窗口菜单方式、程序运行方式、混合运行方式。

完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按

钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简

洁和直观。

程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工

编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用

于大规模的统计分析工作。

混合运行方式:是前两者的综合。

5、.sav 是数据编辑器窗口中的SPSS数据文件的扩展名

.spv 是结果查看器窗口中的SPSS分析结果文件的扩展名

.sps 是语法窗口中的SPSS程序

6、SPSS 的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主

要集中在分析、图形等菜单中。

7、概率抽样(probability sampling) :也称随机抽样,是指按一定的概率以随机原则抽取

样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。

简单随机抽样(simple random sampling) :从包括总体N个单位的抽样框中随机地

抽取n 个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,

是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样

本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造

抽样框,抽出的单位很分散,给实施调查增加了困难。

分层抽样(stratified sampling) :将抽样单位按某种特征或某种规则划分为不同

的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的

结构比较相近,从而提高估计的精度,组织实施调查方便( 当层是以行业或行政区

划分时) ,既可以对总体参数进行估计,也可以对各层的参数进行估计。

整群抽样(cluster sampling) :将总体中若干个单位合并为组(群), 抽样时直接抽

取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框,

可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

计的精度较差。

系统抽样(systematic sampling) :将总体中的所有单位( 抽样单位) 按一定顺序排

列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则

确定其它样本单位,先从数字 1 到k 之间随机抽取一个数字r 作为初始单位,以后

依次取r+k ,r+2k ?等单位。优点:操作简便,可提高估计的精度。缺

点:对估计

量方差的估计较困难

多阶段抽样(multi-stage sampling) :先抽取群,但并不是调查群内的所有单位,

而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。群是初级抽样单

位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为

用。在

约调查费

多阶段抽样。优点:具有整群抽样的优点,保证样本相对集中,节

大规模的抽样调查中,经常被采用的方法。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查,包括方便抽样、自愿抽样、配额抽样、判断抽样和滚雪球抽样等。

方便抽样:样本限于总体中易于抽到的一部分。最常见的方便抽样是偶遇抽样,即

人研究者将在某一时间和环境中所遇到的每一总体单位均作为样本成员。“街头拦

法”就是一种偶遇抽样。方便抽样是非随机抽样中最简单的方法,省时省钱,但样

本代表性因受偶然因素的影响太大而得不到保证。

快的、麻烦的,这时为方便起见就采用自愿抽样:某些调查对被调查者来说是不愉

以自愿被调查者为调查样本的方法。

判断抽样:研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样

方法。当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样

况方法,可获代表性较高的样本。这种抽样方法多应用于总体小而内部差异大的情

以及在总体边界无法确定或因研究者的时间与人力、物力有限时采用。

滚雪球抽样:以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认

识的合格的调查对象,再由这些人提供第三批调查对象,??依次类推,样本如同

滚雪球般由小变大。滚雪球抽样多用于总体单位的信息不足或观察性研究的情况

这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造

成误差。

;然后按照各层样本数与配额抽样也称定额抽样,是将总体依某种标准分层(群)

,最大的该层总体数成比例的原则主观抽取样本。配额抽样与分层概率抽样很

接近

不同是分层概率抽样的各层样本是随机抽取的,而配额抽样的各层样本是非随机

的。总体也可按照多种标准的组合分层( 群) ,例如,在研究自杀问题时,考虑到婚

姻与性别都可能对自杀有影响,可将研究对象分为未婚男性、已婚男性、未婚女性

和已婚女性四个组,然后从各群非随机地抽样。配额抽样是通常使用的非概率抽样

方法,样本除所选标识外无法保证代表性。

8、利用SPSS进行数据分析的一般步骤:

数据的准备

-- 数据的加工处理-- 数据的分析-- 分析结果的阅读和解释。

第二章练习题答

1、SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。

原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的

统计指标。

分组汇计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过

后的数据。

2、个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。

变量:数据编辑器窗口中的一列。

3、默认的变量名:VAR------ ;默认的变量类型:数值型。

变量名标签和变量值标签可增强统计分析结果的可读性。

4、数据文件如图所示:

5、缺失值分为用户缺失值(User Missing Value )和系统缺失值(System Missing

Value )。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值

来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了

非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。

6、变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。

7~9 题软件操作,答案略

第三章练习题答案

1~8 题软件操作,答案略

9、SPSS排序功能仅实现将观测按用户指定顺序重新排列;拆分功能在按序排列的基础上,

能够实现对数据按排序变量进行分组,并分组进行后续的统计分析。

第四章练习题答案

1、

Statistics

户口所在职业年龄

N Valid 282 282 282

Missing 0 0 0

户口所在地

Frequency Percent Valid Cumulative

Percent Percent

中心城市200 70.9 70.9 70.9

Valid 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0

职业

Frequency Percent Valid Cumulative

Percent Percent

国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0 公交建筑业15 5.3 5.3 39.4 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1 一般农户35 12.4 12.4 63.5

Valid 种粮棉专业

4 1.4 1.4 64.9 种果菜专业

10 3.5 3.5 68.4 工商运专业

34 12.1 12.1 80.5 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9 现役军人 3 1.1 1.1 100.0 Total 282 100.0 100.0

年龄

Frequency Percent Valid Cumulative

Percent Percent

20 岁以下 4 1.4 1.4 1.4 20~35 岁146 51.8 51.8 53.2

Valid 35~50 岁91 32.3 32.3 85.5

50 岁以上41 14.5 14.5 100.0

Total 282 100.0 100.0

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一

般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分

布表中的百分比相同。

2、

分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.9,峰度系数为33.656,偏度系数为 5.234。与标准正态分布曲线进行对比,由峰度

系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,

此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

分析:由表中可以看出,中心城市有200人,边远郊区为82人。两部分样本存取款金额均

呈右偏尖峰分布,且边远郊区更明显。

3、利用描述菜单下窗口对话框中的“将标准得分另存为变量”功能实现。对标准分数变量

按降序排列,绝对值大于3的可视为“与众不同”的样本。

理由:标准化值反映的是样本值与样本均值的差是几个标准差单位。如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;

如果标准化值小于0,则表示该样本值小于样本均值。如果标准化值的绝对值大于3,则可认为是异常值。

4、利用列联分析实现。首先编制列联表,然后进行卡方检验。以户口和收入的列联分析为

例:

表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。若显著性水平设为0.05,由于0.001<0.05,拒绝原假设,表明户口地与收入水平不独立。

5、多选项分类法;

存款的最主要目的是正常生活零用

6、计算结果:

卡方统计量:

o e

2()

r c f

f

ij ij

i1j1f

e

ij

2

,用于测度各个单元格的观测频数与期望频数的差异,

并依卡方理论分布判断差异是否统计显著。由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显。

本例中,由于概率P值小于显著性水平,应拒绝原假设,婆媳关系与住房条件有关系。

7、将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验。

表中,卡方统计量观测值为 4.339,对应的概率P-值为0.037,小于显著性水平0.05,应拒绝原假设,说明减肥效果并不一致。

8、多选项二分法;

102(794 份)、101(514 份)、401(400 份)赚钱比例:30.3%,赔钱比例38%

主要依据:基本因素法;

最少依据:更跟方法

采用列联分析。卡方检验结果表明:专职和业余投资者在投资结果上存在显著差异。

9、(1)变量:汽车价格、居住地区;类型:定序型变量、定类型变量

(2)上述是计数数据的组织方式,应首先组织到SPSS的数据编辑器窗口中,再利用交叉分组下的频数分析方法。

列联分析。原假设:不同居住区的私家车主接受的汽车价格具有一致性的。上表可知,

如果显著性水平为0.05,由于卡方检验的概率P-值小于显著性水平,因此应拒绝原假设。

第五章练习题答案

1、采用单样本T 检验(原假设H0:u=u0=75, 总体均值与检验值之间不存在显著差异);

One-Sample Statistics

N Mean Std. Std. Error

Deviation Mean

VAR00001 11 73.7273 9.55082 2.87968

One-Sample Test

Test Value = 75

t df Sig. Mean 95% Confidence Interval of

(2-tailed) Difference the Difference

Lower Upper VAR00001 -.442 10 .668 -1.27273 -7.6891 5.1436

分析:N=11 人的平均值(mean)为73.7,标准差(std.deviation )为9.55,均值标准误差(std

error mean)为2.87。t 统计量的观测值为-4.22,t 统计量观测值的双尾概率P-值(sig.(2-tailed) )

为0.668;六七列是总体均值与原假设值差的95%的置信区间:(-7.68,5.14)。采用双尾检验

比较 a 和p。T 统计量观测值的双尾概率p-值(sig.(2-tailed) )为0.668>a=0.05 所以不能拒

绝原设;且总体均值的95%的置信区间为(67.31,80.14),检验值75 包括在置信区间内,所以

经理的话是可信的。

2、

每周上网时间的样本平均值为27.5,标准差为10.7,总体均值95%的置信区间为23.8-31.2.

3、利用两独立样本的T 检验实现,本质为两个总体比例差的检验。首先将计数数据通过加

权功能还原为原始数据,然后,采用两独立样本T 检验实现。检验变量为行为,分组变量

为方式。

Group Statistics

方式N Mean Std. Std. Error

Deviation Mean

a2 方式一200 .4600 .49965 .03533 方式二183 .8798 .32611 .02411

分析:

从上表可以看出票丢仍买的人数比例为46%,钱丢仍买的人数比例为88%,两种方式的样

本比例有较大差距。

1.两总体方差是否相等 F 检验:F 的统计量的观察值为257.98,对应的

P 值为0.00,;如果显著性水平为0.05,由于概率P 值小于0.05,两种方式的方差有显著差异。

看假设方差不相等行的结果。 2.两总体均值(比例)差的检验:.T 统计量的观测值为-9.815, 对应的双尾概率为0.00,T 统计量对应的概率P值<0.05,故推翻原假设,表明两总体比例有显著

差异.更倾向心理学家的说法。

4、本题是单个总体的比例检验问题。首先将数据组织成计数方式,并以数量为加权变量还

原为原始数据。然后,采用独立样本的T 检验实现。检验变量为是否开兰花,检验值为0.75。

分析:

由表知:样本中200 棵开兰花的比例为71%。如果总体比例的原假设为0.75,由于T 统计量的概率P 值大于显著性水平(0.05),不能拒绝原假设,不能说与遗传模型不一致。

5、方式一:采用两配对样本t 检验

Paired Samples Statistics

Mean N Std. Std. Error

Deviation Mean

Pair 1 饲料 1 32.578 9 3.8108 1.2703 饲料 2 34.267 9 5.5993 1.8664

Paired Samples Correlations

N Correlatio Sig.

n

Pair 1 饲料 1 & 饲料

2

9 .571 .108

Paired Samples Test

Paired Differences t df Sig.

(2-taile Mean Std. Std. 95% Confidence

d)

Deviatio Error Interval of the

n Mean Difference

Lower Upper

Pair 1 饲料 1 -

饲料 2

-1.68

89

10945.10 1.5456 -5.2529 1.8752

-1.09

3

8 .306

由上表可知,t 统计量观测值为-1.093,概率P-值为0.306,大于显著性水平0.05,不应拒绝原假设,不能认为不同饲料使幼鼠体内钙的留存量出现了显著不同。

方式二:采用两独立样本t检验

由上面的表可知,两组残留的样本平均值差异不大。

由下表可知,该检验的F统计量的观测值为0.059,对应的概率P-值为0.811。如果显著性水平为0.05,则可以认为两总体的方差无显著差异。

两总体均值的检验应看第一行。T统计量的观测值为-0.584,P-值为0.566,。如果显著性水平为0.05,则不应拒绝原假设,不能认为两饲料残留有显著差异。

6、两独立样本T检验

分析:

1.两总体方差是否相等用F检验:F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看假设方差相等行。

2.两总体均值的检验:T统计量的观测值为-0.573,对应的双尾概率为0.569,T统计量对应的P值>显著水平0.05,故不能拒绝原假设,不能认为女生男生的课程平均分有显著差异。

7、利用配对样本T检验,逐对检验

8、

由第一个表知,培训前和培训后样本的平均值(mean)有一定差异,培训后平均值较大;

表二表明,在显著性水平为0.05 时,培训前后的销售量有一定的线性关系;由表三知,t 检验统计量的观测值为-2.3,对应的双尾概率p-值为0.04,小于显著水平a=0.05 ,应拒绝原假设,培训前后的销售平均值存在显著差异。

第六章练习题答案

1、(1)

ANOVA

VAR00002

Sum of df Mean Square F Sig.

Squares

Between Groups 405.534 4 101.384 11.276 .000

Within Groups 269.737 30 8.991

Total 675.271 34

概率P-值接近于0,应拒绝原假设,认为 5 种推销方法有显著差异。

(2)均值图:

Multiple Comparisons

Dependent Variable: VAR00002

LSD

(I) VAR00001 (J) VAR00001 Mean Std. Sig. 95% Confidence Interval

Difference Error

Lower Bound Upper Bound

(I-J)

2 -3.3000 * 1.6028 .048 -6.57

3 -.027

1 3 .7286 1.6028 .653 -2.545 4.002

4 3.0571 1.6028 .066 -.216 6.330

5 -6.7000 * 1.6028 .000 -9.973 -3.427 1 3.3000 * 1.6028 .048 .027 6.573

2

*

3 4.0286

1.6028 .018 .

755 7.302

*

1

.

6

2

8

.

3

.

8

4

9

.

6

3

4 6.3571

5 -3.4000 * 1.6028 .042 -6.673 -.127 1 -.728

6 1.6028 .653 -4.002 2.545

*

2 -4.0286 1.6028 .018 -7.302 -.755

3

4 2.3286 1.6028 .157 -.94

5 5.602

5 -7.428

6 * 1.6028 .000 -10.702 -4.155

1 -3.0571 1.6028 .066 -6.330 .216

*

2 -6.3571 1.6028 .000 -9.630 -3.084

4

3 -2.3286 1.6028 .157 -5.602 .945

5 -9.7571 * 1.6028 .000 -13.030 -6.484

1 6.7000 * 1.6028 .000 3.427 9.973

5 2 3.4000

3 7.4286

* 1.6028 .042 .127 6.673

* 1.6028 .000 4.155 10.702 4 9.7571 * 1.6028 .000 6.484 13.030

*. The mean difference is significant at the 0.05 level.

可知,1 和2、1 和5、2 和3,2 和4,2 和5,3 和5,4 和5 有显著差异。

2、2.4;3.1;

3、

因F 检验的概率P 值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。

10945.11;2629.118;67;24.206

各组均值存在显著差异。更适合第三组

4、

Between-Subjects Factors

Value Label N

1.0 地区一9

地区

2.0 地区二9

3.0 地区三9

1.0 周一至周三9

日期

2.0 周四至周五9

3.0 周末9

Tests of Between-Subjects Effects

Dependent Variable: 销售量

Source Type III Sum df Mean Square F Sig.

of Squares

Corrected

Model

61851851.852 a 8 7731481.481 8.350 .000

844481481.48

1 1

844481481.48

1

912.40 .000

a1 2296296.296 2 1148148.148 1.240 .313 a2 2740740.741 2 1370370.370 1.480 .254 a1 * a2 56814814.815 4 14203703.704 15.340 .000 Error 16666666.667 18 925925.926

Total 923000000.0

27

Corrected

Total

78518518.519 26

a. R Squared = .788 (Adjusted R Squared = .693)

分析:

(2)由上表可知,F a1、F a2的概率P-值为0.313和0.254,大于显著性水平(0.05),所以不

应拒绝原假设,可以认为不同地区和日期下的销售额总体均值不存在显著差异,不同地区和不同日期对该商品的销售没有产生显著影响。

(3)产生了交互影响。因为概率P-值接近于0,拒绝原假设,认为不同地区和日期对销

售额产生了显著的交互作用。

5、

Between-Subjects Factors

Value Label N

性别10945.12 女

12

1.1 男12

手机2.1 使用12

3.1 不使用12

Tests of Between-Subjects Effects

Dependent Variable: 得分

Source Type III Sum df Mean Square F Sig.

of Squares

Corrected

Model

1.1 a 3 34

2.708 21.101 .000

2.1 1 34732.042 2138.453 .000

性别 5.042 1 5.042 .310 .584

手机1001.042 1 1001.042 61.634 .000

性别* 手机22.042 1 22.042 1.357 .258

Error 324.833 20 16.242

Total 36085.000 24

Corrected

Total

3.1 23

a. R Squared = .760 (Adjusted R Squared = .724)

分析:

就性别而言,因为概率P-值=0.584,大于显著性水平0.05,所以不应拒绝原假设,认为性别对驾驶状态无显著影响;就手机使用情况而言,因为概率P-值接近0,应拒绝原假设,认为手机使用情况对驾驶状态存在显著影响。

6、

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地 职业年龄 N Valid282282282 Missing000 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市200 边远郊区82 Total282 职业 Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业 户 4

种 果菜专业 户 10 工商运专业 户 34 退役人员17 金融机构35 现役军人3 Total282 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

《卫生统计学》课后思考题答案

《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。

(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计; 缺点是事先要进行分层,操作麻烦。 (4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。 3、调查设计包括那些基本内容? 答:(1)明确调查目的和指标 (2)确定调查对象和观察单位 (3)选择调查方法和技术 (4)估计样本大小 (5)编制调查表 (6)评价问卷的信度和效度 (7)制定资料的收集计划 (8)指定资料的整理与分析计划 (9)制定调查的组织措施 4、调查表中包含那几种项目? 答:(1)分析项目直接整理计算的必须的内容; (2)备查项目保证分析项目填写得完整和准确的内容; (3)其他项目大型调查表的前言和表底附注。 第三章实验设计 1、简述实验设计的特点。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理 《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在职业年龄 地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理 种果菜专业 10 3.5 3.568.4 户 工商运专业 3412.112.180.5户 退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0

现代心理与教育统计学课后题完整版50612

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点

相关文档
相关文档 最新文档