文档库 最新最全的文档下载
当前位置:文档库 › 社会统计学期末复习

社会统计学期末复习

社会统计学期末复习
社会统计学期末复习

社会统计学期末复习训练及部分答案

一、单项选择题

1.为了解IT 行业从业者收入水平,某研究机构从全市IT 行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( B )

A .样本 B. 总体 C. 统计量 D. 变量

2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )

A .频率 B. 累积频数 C. 累积频率 D. 比率

3.离散系数的主要目的是( D ) A .反映一组数据的平均水平 B .比较多组数据的平均水平 C .反映一组数据的离散程度 D .比较多组数据的离散程度

4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B )

A. 50%的数据

B. 68%的数据

C. 95%的数据

D. 99%的数据

5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A )

A. 39.19

B. 28.90 C .19.54 D .27.95

6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A )

A .点估计

B .区间估计

C .有效估计

D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( C )

A .0H :π≥0.1;1H :π<0.1

B .0H :π≤0.1;1H :π>0.1

C .0H :π=0.1;1H :π≠0.1

D .0H :π>0.1;1H :π≤0.1

8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0

9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0

C .0.5

D .1.2

10.用于说明回归方程中拟合优度的统计量主要是( C )

A. 相关系数

B. 离散系数

C. 回归系数

D. 判定系数

11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是( C )

A .332.1万户家庭 B. 3000户家庭

C. 332.1户家庭的年均收入

D. 3000户家庭的年均收入

12.下列变量属于数值型变量的是( A ) A .工资收入 B. 产品等级

C. 学生对考试改革的态度

D. 企业的类型

13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形( B )

A .环形图

B .饼图

C .直方图

D .条形图

14.在频数分布表中,频率是指 ( C ) A. 各组频数与上一组频数之比 B. 各组频数与下一组频数之比 C. 各组频数与总频数之比

D. 各组频数与最大一组频数之比

15.两个定类变量之间的相关分析可以使用( C ) A. λ系数 B. ρ系数 C. r 系数 D. Gamma 系数

16.根据一个样本均值求出的90%的置信区间表明( )

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

17.已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的( B )

A.95%

B.68%

C.89%

D.90%

18.方差分析的目的是( C )

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著19.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间()A.相关程度越大

B.相关程度越小

C.完全相关

D.完全不相关

20.正态分布中, 值越小,则( A )

A. 离散趋势越小

B. 离散趋势越大

C. 曲线越低平

D. 变量值越分散

21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为(A)

A.简单随机抽样

B. 系统抽样

C. 整群抽样

D. 分层抽样

22.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( D )

A.茎叶图

B. 环形图

C. 饼图

D. 线图

23.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值()

A.是平均数的-1.5倍

B.比平均数少1.5

C.等于-1.5倍标准差

D.比平均数低1.5个标准差

24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 ( A )

A. 89

B. 72

C. 88

D. 95

25.某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的()

A. 68%

B. 89%

C.90%

D.95%

26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为()

A.700

B.0.2

C.3500

D.175000

27.在假设检验中,不拒绝虚无假设意味着()A.虚无假设是肯定正确的

B.虚无假设肯定是错误的

C.没有证据证明虚无假设是正确的

D.没有证据证明虚无假设是错误的

28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间()

A.相关程度越高

B.相关程度越低

C.完全相关

D.没有任何关系

29.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为()

A.234,121

B.117,121

C.234,48.4

D.117,81

30.在回归方程中,若回归系数等于0,这表明( B )

A. 因变量y对自变量x的影响是不显著的

B. 自变量x对因变量y的影响是不显著的

C. 因变量y对自变量x的影响是显著的

D. 自变量x对因变量y的影响是显著的

31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于(C)

A.简单随机抽样

B. 整群抽样

C. 分层抽样

D. 系统抽样

32.某企业职工的月收入水平分为以下五组:1)1500

元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为()

A.3000元

B. 3500元

C. 2500元

D. 3250元

33.对于右偏分布,平均数、中位数和众数之间的关系是()

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

34.两组数据的平均数不相等,但是标准差相等。那么 ( )

A. 平均数小的,离散程度小

B. 平均数大的,离散程度大

C. 平均数大的,离散程度小

D. 两组数据离散程度相同

35.在假设检验中,如果所计算出的P值越小,那么检验的结果()

A. 越显著

B. 越不显著

C.越真实

D.越不真实

36.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着()

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

37.回归平方和(SSR)反映了y的总变差中()A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分

38.根据一个具体的样本求出的总体均值90%的置信区间()

A.以90%的概率包含总体均值

B.绝对包含总体均值

C.10%的可能性包含总体均值

D.绝对不包含总体均值

39.在假设检验中,虚无假设和备择假设()

A.都有可能成立

B.都不可能成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

40.在方差分析中,某一水平下样本数据之间的误差称为( A )

A. 组内误差

B. 组间误差

C. 组内平方

D. 组间平方

二、名词解释

1.抽样单位与抽样框:

抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。

好的抽样框应做到:完整而不重复。

常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。在没有现成的名单的情况下,可由调查人员自己编制。应该注意的是,在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。

例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。

2.普查与抽样调查:普查是是专门组织的一次性的全面调查。抽样调查是按随机原则从总体中抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。1. 从总体中随机抽取一部分单位(样本)进行调查2. 目的是推断总体的未知数字特征;3. 最常用的调查方式;4. 具有经济性、时效性强、适应面广、准确性高等特点。

3.参数与统计量:

4.方差与标准差:

总体各单位标志值与其算术平均数离差平方的算术平均数的平方根,标准差的平方称为方差。

5.独立样本与配对样本:

6.总体与样本:

总体是一个特定研究中所有感兴趣个体集合;

样本是从一个总体中选择出来的个体的集合,通常在研究中被期望代表总体;

必须区分数据是来自总体还是样本。描述总体的特性被称为参数;描述样本的特征被称为统计量

参数和统计量是一个值,通常是一个数字值。可分别从单个测量中得到,或从对总体和样本的一组测量中推导出来;

通常,每个总体参数都与一个样本统计量相对应。

凡是客观存在的并至少具有某一相同性质而结合起来的许多个别事物构成的整体,当它作为统计的研究对象时,就称为总体。构成统计总体的个别单位称为总体单位。

二者关系:包含与被包含;相互转化:随研究目的变化而变化。

7.抽样分布:是运用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。有了抽样分布对概率分布的具体化,研究者便找到了一种理论与实际相联系的有效途径。

抽样分布特指样本统计量作为随机变量的概率分布。用数学语言来说,抽样分布是运用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。

8.二维表:

组距数列的编制:

9.相关系数:

是对变量之间关系密切程度的度量。

对两个变量之间线性相关程度的度量称为简单相关系数(简称相关系数)

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

若相关系数是根据样本数据计算的,则称为样本相关系数,记为 r

10. 组内均方:

11.普查:

是专门组织的一次性的全面调查。1.为特定目的专门组织的非经常性全面调查;2.通常是一次性或周期性的;3.一般需要规定统一的标准调查时间;4. 数据的规范化程度较高;5.应用范围比较狭窄。

12.误差减少比例:

13.散点图:

各种类型的散点图在回归分析中,数据点在直角坐系平面上的分布图。

散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。

散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

14.正态分布:

正态分布是最具典型意义的连续型随机变量的概率分布。一般地讲,若影响某一变量的随机因素很多,而每个因素所起的作用不太大且相互独立,则这个变量服从正态分布。更为重要的是,不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于正态分布。

它是最重要的概率分布:(1)许多自然现象和社会现象,都可用正态分布加以叙述;(2)当样本足够大时,都可用正态近似法解决变量的概率分布问题;(3)许多统计量的抽样分布呈正态分布。

15.最小二乘法:

又称最小平方法。是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。它是点估计的常用方法之一。点估计:又称定值估计,就是用实际样本指标数值作为总体参数的估计值。点估计的常用方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。

概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。

16.概率抽样:

又称随机抽样.概率抽样以概率理论为依据,通过随机化的机械操作程序取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性.虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质,特征.概率抽样主要分为简单随机抽样,系统抽样,分类抽样,整群抽样,多阶段抽样等类型.现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本.

17.中位数:

一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)。中位数是一组数据的中间水平。

意义:反映了一组数的一般情况。

中位数的优缺点:中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,有时用它代表全体数据的一般水平更合适。

直观印象描述:一半比“我”小,一半比“我”大。

18.相关系数:

是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近1,Q越大,变量之间的线性相关程度越低。

相关系数又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。

相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。γ>0为正相关,γ<0为负相关。γ=0表示不相关;γ的绝对值越大,相关程度越高。

两个现象之间的相关程度,一般划分为四级:

如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。通常|r|大于0.8时,认为两个变量有很强的线性相关性。

19.区间估计:

以一定的概率保证估计包涵总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。

包涵两个部分:

1)可能范围的大小;

2)总体指标落在这个可能范围的概率。

注: 在其它条件不变的情况下,缩小抽样误差就意味着增加调查费用,因此,在进行抽样调查时,应该根据研究目的和任务以及研究对象的标志变异程度,科学确定允许的误差范围。

区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

20. 中心极限定理:

是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。中心极限定理实际解决了大样本均值的检验问题。

它是概率论中最重要的一类定理,大大拓展了正态分布的适用面,有广泛的实际应用背景。

21.假设检验:

亦称“显著性检验(Test of statistical significance)”,是假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。假设检验的思想是,先假设两者相等,然后用统计的方法来计算验证你的假设是否正确。用的假设检验有Z检验、T检验、配对检验、比例检验、秩和检验、卡方检验等。

假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法,秩和检验等。

统计检验是指先建立一个关于总体情况的假设,继而抽取一个随机样本,然后以样本的统计量或者统计性质来检定假设。统计检验的依据是小概率原理:一是认为小概率事件在一次观察中是极少出现的;二是如果在一次观察中出现了小概率事件,那么应该否定原有事件具有小概率的说法或者假设。

22.经验法则:

可以准确地估算近似钟形分配量测组的分配型态,如下图“钟形分配”,数据组的相对次数直方图愈接近钟形(bell-sharped)分配,法则愈正确。钟形分配通常称为常态分配

经验法则被定义为已知量测组近似钟形分配,其区间在

1、(μ+1σ)或(x+1s)将包含约68%的量测值。

2、(μ+2σ)或(x+2s)将包含约95%的量测值。

3、(μ+3σ)或(x+3s)将包含几乎100%的量测值。

三、简答题

1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名

(2)每月的网络服务费

(3)每月上网时间

(4)上网的主要目的

(5)上周收到的电子邮件数量

(6)每月用于网上购物的金额

(7)上月网上购物的次数

(8)使用的电脑的品牌

(9)上网是否玩游戏

(10)电脑是否带有光盘刻录机

2.调查方法主要包括哪几种?简要说明各种方法的优缺点。

答:(一)普查(census):

1.为特定目的专门组织的非经常性全面调查,如人口普查、工业普查等

2.通常是一次性或周期性的

3.一般需要规定统一的标准调查时间

4.数据的规范化程度较高

5.应用范围比较狭窄,只能调查一些最基本、最一般的现象

(二)抽样调查

1. 从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。

2. 具有经济性、时效性强、适应面广、准确性高等特点。

(三)重点调查

1.重点调查:是指在调查对象中,只选择一部分重点单位进行的非全面调查。

2重点单位:着眼于现象量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。

(四)典型调查

典型调查是一种专门组织的非全面调查。根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。有人也认为它是“目的抽样”,以若干具有代表性的单位为样本。

▼注意:

重点调查、典型调查与抽样调查的不同处在于:

1、抽样调查是随机抽取调查单位,不存在对调查对象选择的主观性,因此可以根据抽样结果推断总体的数量特征;

2、重点调查和典型调查不是随机取样,具有一定的主观性,因此调查结果不能推断总体。

3. 什么是简单一元线性回归分析?其作用是什么?

答:什么是回归?

回归是由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们父母那样高。比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他给出的研究两个数值变量之间数量关系的方法称为回归分析。

什么是回归分析?

回归分析是对具有相关关系的变量拟合数学方程,通过一个或一些变量的变化解释另一变量变化的方法。

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析

称为一元线性回归分析。

4.简要说明社会研究过程。

答:

5.按测度水平,变量可分为哪几类?并举例说明。

6.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。

答:

7.等距分组和不等距分组有什么区别?请举例说明。

答:

8.举例说明什么是自变量和因变量,二者之间是什么关系?

答:自变量是被研究者操纵的变量;

因变量是被观察的那个变量,用于评估处理效应;

9. 简要说明卡方的拟合优度检验和独立性检验的含义。

答:

10.条形图和直方图有什么区别?

答:条形图是用宽度相同的条形的高度或长短来表示数据变动的图形;条形图有单式、复式等形式;在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率;绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。

直方图是用矩形(或长条)的高度来表示数列各组的频数或频率。对于定类变量和定序变量的分组,矩形(或长条)的宽度是没有意义的,各矩形之间要留出一定的空隙;对于定距变量(和定比变量)的分组,矩形的宽度表示各组组距,各矩形之间一般不留空隙。在等距分组的条件下,很显然各矩形的面积与其高度成正比。因此,各矩形的面积同样可以用来表示各组的频数或频率,而且看起来更形象直观。如果取各矩形的总面积为1,各矩形的面积必定等于各组的相对频数。

直方图是用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布。在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram);直方图下的总面积等于1。直方图下的面积之和等于1。

直方图与条形图的区别:

条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的。

直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。

直方图的各矩形通常是连续排列,条形图则是分开排列。

11. 简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。

答:

13.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。

14.举例说明什么是离散变量和连续变量。

答:

15.SPSS主要有哪些功能?

答:SPSS是软件英文名称各单词的首字母,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随SPSS产品服务领域的扩大和服务功能的深化,SPSS公司已于2000年正式将其英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。

SPSS现在的最新版本为16.0。它是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。

SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。

SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。

16.在SPSS中如何定义变量属性?

17.统计表主要由哪几部分构成?

答:主要是由标题(总标题和标目)、横行和纵栏和数字资料三部分构成。

统计表一般都包括总标题、横标题、纵标题、数字资料、单位、制表日期。总标题是指表的名称,它要能简单扼要地反映出表的主要内容,横标题是指每一横行内数据的意义;纵标题是指每一纵栏内数据的意义;数字资料是指各空格内按要求填写的数字;单位是指表格里数据的计量单位。在数据单位相同时,一般把单位放在表格的左上角。如果各项目的数据单位不同时,可放在表格里注明。制表日期放在表的右上角,表明制表的时间。各种统计表都应有“备考”或“附注”栏,以便必要时填入不属于表内各项的事实或说明。

18.简述相关系数的取值与意义。

答:

相关系数-1≤r≤1 。若0≤r≤1 ,表明x与y之间存在正线性相

关关系;若-1≤r<0 ,表明x与y之间存在负线性相关关系;若r

=1,表明x与y之间为完全正线性相关关系;若r=-1 ,表明x

与y之间为完全负线性相关关系。

|r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度

相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明

两个变量之间的相关程度极弱。

四、计算题 (每题15分,共30分)

1.某校社会学专业同学统计课成绩如下表所示。

社会学专业同学统计课成绩表

要求:

(1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。

2.为研究某种商品的价格(x )对其销售量(y )的影响,收集了12个地区的有关数据。通过分析得到以下结果:

方差分析表

要求:

(1)计算上面方差分析表中A 、B 、C 、D 、E 、F 处的值。 (2)商品销售量的变差中有多少是由价格的差异引起的? (3)销售量与价格之间的相关系数是多少?

3.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,A 项测试中平均分数为90分,标准差是12分;B 考试中平均分数为200分,标准差为25分。一位应试者在A 项测试中得了102分,在B 项测试中得了215分。若两项测试的成绩均服从正太分布,该位应试者哪一项测试更理想?

4.某公司欲了解广告费用x 对销售量y 的影响,收集了20个地区的数据,并对x 、y 进行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残差平方和SSE=40158.07。要求:

(1)写出广告费用y 与销售量程x 之间的线性回归方程。

(2)假如广告费用投入50000元,根据回归方程估计商品销售量。

(3)计算判定系数2

R ,并解释它的意义。

5.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为

6.5个小时,样本标准差为2.5个小时。

(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。

(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。

注:96.1Z 025.0

6.某企业使用3种方法组装一种新的产品,为确定哪种方法生产效率最高,随机抽取30名工人,并指定每人使用

7.某校社会学专业共有两个班级。期末考试时,一班同学社会学理论平均成绩为86分,标准差为12分。二班同学成绩如下所示。

二班同学社会学理论成绩分组数据表

要求:

(1)计算二班同学考试成绩的均值和标准差。

(2)比较一班和二班哪个班成绩的离散程度更大?(提示:使用离散系数)

8.某调查公司研究出租司机每天收入(元)与行驶里程(公里)之间的关系。对30位出租车司机进行调查,并根据每天的收入y、行驶里程x进行回归,得到:方程的截距为162,回归系数为0.6,回归平方和SSR=2600,残差平方和SSE=513。要求:

(1)写出每天的收入y与行驶里程x之间的线性回归方程。

(2)假如某司机某天行驶了300公里,根据回归方程估计他该天的收入。

R,并解释它的意义。

(3)计算判定系数2

第一章:导论

1、什么是统计学?统计方法可以分为哪两大类?

统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。

2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?

按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。

按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。

3、举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集

1、调查方案包括哪几个方面的内容?

调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。

2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。

3、统计调查方式:抽样调查、普查、统计报表等。

抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。除此之外,还有重点调查和典型调查。

4、统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差和非抽样误差两类。

抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除)

5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。

6、数据的收集方法分为询问调查与观察实验。

7、统计调查方案包括哪些内容?

调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。

第三章:数据整理与展示

1、对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。

2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。

3、数据分组的步骤:确定组数、组距,最后制成频数分布表

统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。

组中值=(下限值+上限值)/2

4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。

5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

第四章:数据分布特征的测度

1、一组数据的分布特征可以从哪几个方面进行测度?

一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

2、简述众数、中位数和均值的特点和应用场合及关系。

众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。

均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即Mo=Me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar<Me<Mo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则Mo<Me<xbar(图)3、为什么要计算离散系数?

第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。

4、均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

5、四分位差主要用于测度顺序数据的离散程度,数值型数据也可以计算四分位差,但不适合于分类数据。

6、方差是各变量值与其均值离差平方的平均数。方差的平方根是标准差。

方差、标准差计算公式(分组数据、未分组数据两种,自己写)

样本方差和标准差计算公式(同上)

7、对于分类数据,主要用异众比率来测度其离散程度;对于顺序数据,主要用四分位差来测度其离散程度;对于数值型数据,主要用方差或标准差来测度其离散程度。

8、经验法则:68%-1;95%-2;99%-3

第五章:抽样与参数估计

1、常用的概率抽样方法主要有:简单随机抽样,分层抽样,系统抽样,整群抽样

2、置信水平(P115) 第七章:相关与回归分析

1、解释相关关系的含义,并说明其特点。

相关关系是变量与变量之间存在的不确定的数量关系。特点是:一个变量的取值不能由另一个变量唯一确定,当变量x 取某个值时,变量y 的取值可能有几个。

2、简述相关系数的取值及其意义,并说明相关程度的几种情况。

相关系数-1≤r ≤1 。若0≤r ≤1 ,表明x 与y 之间存在正线性相关关系;若-1≤r <0 ,表明x 与y 之间存在负线性相关关系;若r =1,表明x 与y 之间为完全正线性相关关系;若r =-1 ,表明x 与y 之间为完全负线性相关关系。

|r |≥0.8时,可视为高度相关;0.5≤|r |<0.8时,可视为中度相关;0.3≤|r |<0.5时,视为低度相关;当|r |<0.3时,说明两个变量之间的相关程度极弱。

3、解释回归模型、回归方程、估计的回归方程的含义

回归模型是描述因变量y 如何依赖于自变量x 和误差项的方程。回归方程是描述因变量y 的期望值如何依赖于自变量x 的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。 4、简述参数最小二乘估计的基本原理。

x y 1

0???ββ+= 这一公式的x 和y 的n 对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x 与y 之间的关

系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数0?

β和1?β的方法称为最小二乘法,即:

最小=--=-∑∑==n

i i

i

n

i i x y

y

y 1

21012)??()?(ββ

5、简述判定系数的含义和作用

回归平方和占总平方和的比例,称为判定系数。它测度了回归直线对观测数据的拟合程度,它反映了在因变量y 的总变量差中由于x 与y 之间的线性关系所解释的比例。 第八章:时间序列分析和预测

1、利用增长率分析时间序列时应注意哪些问题?

首先,当时间序列中的观察值出现0或负数时,不宜计算增长率;其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。 第九章:指数

1、什么是指数?它有哪些性质?

反映复杂现象在不同场合下综合变动的一种特殊相对数,称为指数。 性质:相对性;综合性;平均性;动态和静态兼有的特性。 2、指数有哪些类型?

根据对比场合不同,分为动态指数和静态指数;根据指数研究对象的范围不同,分为个体指数和总指数。;根据编制方法的不同,总指数分为综合指数和平均指数;根据指数反映的性质不同,分为质量指数、数量指数;根据比较时所采用的基期不同,分为定基指数和环比指数;根据计算采用权数与否,分为简单指数和加权指数。

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计复习题

第一章 1.一般来说,统计这个词包括三个含义:统计工作、统计资料和()。 4.统计按其内容主要包括两个方面:描述统计和()。 5.推断统计有两个基本内容:参数估计和()。 7.总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为()。凡能用数量的多少来表示的标志,称为()。凡不能用数量的多少来表示而只能文字表述的标志,称为()。 9.统计指标和标志的区别与联系在于:统计指标是说明()特征的,标志则是说明()特征的;统计指标的数值是由标志的数值()而成的。 1.统计总体同时具备三个特征( ) 。 A 同质性、大量性、可比性 B 同质性、大量性、变异性 C 数量性、具体性、综合性 D 数量性、具体性、可比性 8.按变量的性质,可把变量分为( ) 。 A 连续变量和随机变量 B 离散变量和确定性定量 C 连续变量和离散变量 D 确定性变量和随机变量 14.统计一般有三个含义,即()。 A 统计调查、统计整理、统计分析 B 统计工作、统计资料、统计学 C 统计活动、统计管理、统计预测 D 统计咨询、统计监督、统计信息 名词解释:大数规律社会统计学 第二章 4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。 7.统计调查从调查范围上分,可分为()和()。 8.统计调查按调查登记时间是否连续,可分为()和()。 9.统计调查从调查目的上,可分为()和专项调查。 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 6.下面能进行除法运算的测量尺度是()。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 7.教育程度是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 8.智商是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 9.籍贯是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 简答:何谓抽样调查?抽样调查的优点是什么?

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

周飞舟《社会统计学》课程大纲

《社会统计学》课程大纲 讲授教师:周飞舟Email: sociologist@https://www.wendangku.net/doc/5f4441179.html, 助教:廖勤樱Email:liaoqinying@https://www.wendangku.net/doc/5f4441179.html, 课程介绍 统计是社会科学研究中广泛采用的定量分析方法。本课程系统地介绍了社会统计学的基本原理、基本概念和主要内容,按照变量的四个测量层次(定类、定序、定距和定比),课程详细阐述了统计描述和统计推论的操作程序和具体方法,并结合生动的实例说明了统计分析在社会研究中的作用和地位。作为一门初中级社会统计学课程,本课程内容限定在单变量和双变量统计范围之内。 教学大纲 指导思想: 社会现象的独特性和社会研究方法的特点决定了统计在社会研究中的重要地位,统计也因此而成为社会研究的重要工具和重要手段。近十几年来,统计理论、统计方法和统计手段迅速发展,其应用范围也越来越广泛。本课程的目的就是为深入这一领域建立一个基础和平台,即对统计的基本概念、原理、类型、方法、程序、作用等有基本的和概括了解与把握,并能应用这些知识对研究问题进行简单的统计分析。本课程的教与学强调:第一,社会研究是一项系统的和严谨的工作,从研究设计→资料收集→资料整理分析→撰写研究报告,各个步骤之间相互联系、相互影响,密不可分。统计分析作为研究的一个重要环节,只有放在社会研究过程的背景之下,注重其与研究问题及研究方法的联系,才能更准确地掌握每一种统计类型和统计方法的特征,才能针对具体的研究问题选择恰当的统计方法。 第二,作为一门应用性极强的课程,本课程特别强调理论联系实际的原则,在教与学的过程中,一方面教师要通过列举和分析大量研究和应用实例,深化学生对统计原理的和统计思想的理解;另一方面要求学生将学习到的知识不断运用到对实际社会问题的分析中去。为此,要求学生在学习课程讲授的知识的同时,认真完成每一讲后面所指定的“实践性”的练习。 第三,在实际的社会研究中,资料的统计分析都是通过计算机完成的。各种统计描述和统计分析方法被制作成用于计算机的专门的和通用的统计软件,如SPSS、SAS、STATE等。本课程将熟练掌握和灵活运用上述统计软件作为本课程教与学的不可分割的一部分,课程所指定的各种“实践性”练习(包括作业)要求尽量在计算机上完成。 第四,课程中介绍的各种具体的统计方法和统计技术,都有其优点和某些局限性,适用于一定的研究目的和分析要求。因此,在课程学习过程中,不仅需要对每一种方法和技术的特点、实施程序和适用范围有清楚的了解,而且也需要认识各种方法与技术之间的异同点,以便能够在面对不同的社会现象和不同的研究目的时,正确、灵活地选择和运用相应的方法与技术。 第五,统计分析是一种定量分析方法,对于统计结果的理解和解释需要联系其它调查资料,如研究对象所处社会的背景状况、所研究问题的特定意义、调查对象的特点等等来进行。对统计结果的解释和使用应当遵循实事求是的原则,杜绝弄虚作假,这是每一个从事社会研究的人员均应该严格遵循的规范。 目的要求: 通过本课程的学习,掌握统计的基本概念、原理、类型、方法、程序、作用以及应用等。能

2013春社会统计学期末复习训练

2013春社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是() A.样本B.总体C.统计量D.变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有() A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例 ()偏高。如果要检验该说法是否正确,则假设形式应该6为() A.:≥0.1; :<;0.1 B.:≤0.1; :>0.1 C.:=0.1; :≠0.1 D.:>0.1; :≤0.1 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是()

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

社会统计学复习整理

社会统计学复习整理 一、变量的测量层次 二、判断变量层次的技巧 1.首先所有的变量都是定类变量。 2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。 3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。 三、变量层次的比较 定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法 第二节简化一个变项的分布 一、定类变量 1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。 2.统计表必备的容: (1)表号、标题 (2)标识行:变量名、对应数据说明(频次、频率) (3)主题行:变量取值的统计数据 (4)表尾:如果是引用必须说明资料来源 二、定序变量 1.适合定序变量的简化资料的方法 (1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和

向下累加次数(cf↓)。 (2)累加频率:把各级的百分率逐渐相加。也分为向下累加百分率和向下累加百分率。 2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。 3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。 ?cf↑表示低于某个等级的频数有多少 ?cf↓表示高于某个等级的频数有多少 三、定距变量 1.定距变量的简化工具是:分组、直方图和折线图。 2.连续型定距变量的分组统计 (1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。 (2)组限:包括上限(up)和下限(low) (3)标识下限和标识上限,例500—699 (4)真实下限:标识下限—0.5;真实上限:标识上限+0.5. (5)组距:真实上限与真实下限之差。 (6)组中值:真实上限与真实下限的平均值。 第三节集中趋势测量法 1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数 值来代表变项的资料分布,以反映资料的集结情况。 2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的 数值。

社会统计学重点

1.社会调查研究的步骤:1.确定课题。 2.了解情况。 3.建立假设。 4.确定概念和测量方法。 5.涉及问卷。 6.试填问卷。 7.调查实施。 8.校核与登录。 9.统计分析与命题的检验。资料的整理归纳分析以及如何收集资料正是统计分析所要谈论的内容。 2.社会调查资料的特点:随机性和统计规律性。 3.怎样选用统计分析方法:1.全面调查和非全面调查。2.单变量和多变量。3.变量层次. 4.分布概念:指一个概念或变量,它的各个情况出现的次数或频次,又称频次分布。表现形式:数对的集合. 5.变量取值的要求—⑴变量取值必须完备;⑵变量取值必须互斥。 6.统计表:是用表格形式来标识前面所说变量的分布。它不需要文字叙述,就能反应出资料的特性以及资料之间的关系,在编印,传递方面有很大优点,比统计表更精确,但不及统计图直观。 7.统计表必须具备的内容:1.表号。2.表头。3.标识行。4.主体行。5.表尾。 8.根据变量的层次,可以选择以下不同的统计图形:定类变量:圆瓣图、条形图。定序变量:条形图。定距变量:直方图、折线图。 9.圆瓣图:是将资料展示在一个圆的平面上,通常用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。 10.条形图:是用长条的高度来表示资料类别的次数或百分数。定类:离散。定序:离散或紧挨着的。 11.直方图:直方图从图形来看,也是紧挨着的长条形所组成,它与条形图不同,宽度有意义,一般来说,直方图是以长条的面积来表示频次或相对频次,而条形的长度。即纵轴高度表示是频次密度或相对频次密度。频次密度=频次/组距。 12.折线图:如果用直线连接直方图中条形顶端的中点,就是折线图。折线图可使资料的频次分布趋势更一目了然。 13.累计图和累计表:表示的是大于某个变量值的频次是多少或小于某个变量值的频次是多少。 14.众值:就是用具有频数最多的变量值来表示变量的集中值。 15.中位值:是数据序列之中央位置之变量值。未分组:N为奇数时:中位值等于n+1/2. N 为偶数时:中位值等于中间两变量和/2. 根据频次分布求中位值:中位值等于频次的和+1/2.中位值等于求出所对应值所在的区域。分组:1.计算出累计频次,得到累计百分比。2.确定最高频次所在组。 均值:总体各单位数值之和除以总体单位数目所得之商。 统计分析中习惯以X 来表示。 离散趋势测量法:

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

社会统计学综合练习题资料

社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是()A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业

7月份利润额均值为( ) A. 39.19 B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数

社会统计学00278

社会工作与管理社会统计学(00278) 一、(1)单项选择 1.社会统计学与教育统计学、医学统计学一样都是数理统计学应用于自身的结果统计学。其中推断统计学最终创立者是(B) A、B、C、D、 2.在统计中,现象总体中最常遇到的数,也就是在一个变量列中,出现次数最多的标志值是(C) A.均值 B.方差 C.众值 D.极差 3.取值只有列别层次之分。而无大小、程度之分的变量是(D) A.定比变量 B.定距变量 C.定序变量 D.定类变量 4.大样本是指样本容量大于等于(A).100 C D1000 5.统计量的第一个特征是,可以保证统计量可作为衡量小概率时间工具的前提之一是(C) A.可操作性 B.可检查性 C.可技术性 D.可忽略性 6.四分位差可以用来度量哪种变量的分散程度(C) A.定类变量何定距变量B定序变量和定距变量C.定距变量和定比变量D.定序变量和定比变量 7.将离散型随即变量的全部可能取值极其对应概率列举出来,即为离散型随机变量的(B) A.期望 B.概率分布 C.方差 D.均值 8.数学期望本意即为随机变量分布的(A) A.总体均值 B.总体方差 C.概率 D.均值 9.若事件A与事件B为互不相容事件,且在以此试验或观察中都必有其一发生,则称事件A与事件B为(B) A.相等 B.对立事件 C.概率 D.均值 10.某小组5人考试成绩为,则该组成绩的极差是(D) .15 C 11.某国企工人月工资收入平均值是798元众值是元,标准差为元,则偏态系数是(C) B.0.255 C. 12.箱中共有20个小球,其中白色为两个,问抽取两个都是白球的概率是多少(A) B.0.0526 C. 13.有两组数据A.:12.12.13.;B:,比较A、B两组数据众值大小(A)组众值大组众值大C.两组众值相等D.无法确定 14.当纳伪概率是时,每一百次抽样中有多少次采纳伪的错误被接受(D) A.0.07次次次次 15.大样本抽样中,有9位同学的成绩作为样本,分别为,对这组数据的计算正确的是(A)A.方差是 B.标准差是16.5 C.均值是92 D.中位值是58 16.甲乙丙丁四种螺丝的出现频次分别为5.20.30.25,、则这组数据的四分位差是(B) A.甲-乙 B.乙-丁 C.乙-丙 D.丙-丁 17.抛两枚硬币,两枚都是朝上的概率是(B) %%%D100%18.数据4.5.6.,众值是(C) .5 C D2 19.每次抽样经观测后将抽到的个体放 回,允许再次被抽到,这种抽样叫做 (B) A.随机抽样 B.重复抽样 C.无回置抽样 D.简单抽样 20.抽样统计量落入拒绝域时可能发生 的错误是(D) A.抽样错误 B.计算错误 C.纳伪错误 D. 弃真错误 一(2)单项选择 1.政治算数学派是统计学发展史中的 主要流派之一,该学派的鼻祖是(B) 非众值的次数之和在总体中 所占的比例叫做(C) A.众值 B.均值 C.异众比率 D.方差 3.变量中最高级层次的变量是(D) A.定类变量 B.定序变量 C.定距变量 D. 定比变量 4.有两组数据A:12.12.13.;B:,比较 A、B两组数据中位值大小。(C)组中 位值大组中位值大 C.两组中位值相等 D、无法确定 5.物理学常用的数据摄氏度属于哪种 变量(C) A.定类变量 B.定序变量 C.定距变量 D. 定比变量 6.当纳伪概率是时,每一百次抽样中有 多次纳伪的错误被接受(A) 次次次次 7.在度量定居变量和定比变量的分散 程度时我们常使用(A) A.四分位差 B.极差 C.均值 D.异众比率 8.抛两枚硬币,一枚朝上一枚朝下的概 率是(B) A..10%%%% 9.将离散型随即变量的全部可能取值 及其对应概率列举出来,即为离散型 随即变量的(B) A.期望 B.概率分布 C.方差 D.均值 10.数据4.5.6.,众值是(C) .5 C 11.在一个变量数列中,两个极端数值 之差称为(B) A.数学期望 B.全距 C.方差 D.标准差 12.若事件A与事件B为互不相容事件, 且在以此实验或观察中都必有其一发 生,则称事件A与事件B为(A)A. 对立事件B.相等事件C.包含事件D.互 不相容事件 13.某小组五人考试成绩为,则该组成 绩的算数平均值是。(C) .70 C 14.某国企业工人月工作收入平均值是 798元众值是元,标准差为元,则偏态 系数是(C) B.0.255 C. 在假设检验中接受原假设 时出现的错误,接受了位置的不真实 状态称为(C) A、抽样错误B.计算错误C.包含错误 D.弃真错误 16.箱中共有20个小球,其中白色为小 球为两个,问抽取第二个才是白球的 概率是(B) B.0.095 C. 大样本是指样本容量 大于等于(A) .100 C 18.有9位同学的成绩分别为,对这组 数据的统计算正确的是(B) A.方差是 B.标准差是14.48 C.均值是 92 D.中位值是58 19.一组数据排列如下:2.2.3.,则这组 数据的四分位差是(B) .3 C 20.每次抽样经观测后将抽到的个体放 回,允许再次被抽到,这种抽样叫做 (D) A.随机抽样 B.简单抽样 C.无回置抽样 D重复抽样 一、(3)单项选择 1.统计学发展史中的国势学派又名(D) A.算数学派 B.理论学派 C.定量学派 D. 记述学派 2.政治算术学派统计学是在哪个世纪 兴起的(C) 世纪世纪世纪世纪 3.统计学发展史上,只讲观念不谈数学 数量的学派是(A) A.国势学派 B.算术学派 C.政治学派 D. 描述学派 4.小样本的简阳方法又称为(C) 简阳检验检验检验 5.二战以后,什么研究称为数理统计学 的主流(B) A.描述研究 B.推断研究 C.概念统计研 究D.学派史研究 6.社会统计学的内容多为抽象概念,必 须经过什么定义才能形成问题便于收 集资料(A) A.操作化 B.概念化 C.数量化 D.命题化 7.对所有研究对象都进行调查,从而掌 握整个单位的全部资料的调查方法称 为(D) A.概率调查 B.抽样调查 C.非全面调查 D.全面调查 8.抽样调查是以什么为基础的( C) A.概念 B.指标 C.概率论 D.结构论 9.在社会统计学研究中,一共有几层次 的变量(C) 种种种种 10.社会统计学中的最低级别的变量是 (A) A.定类 B.定序 C.定距 D.定比 11.纯粹意义上的定距变量是(B) A.收入 B.智商 C.教育程度 D.年龄 12.下列哪个是属于离散型变量的(C) A.均值 B.身高 C.家庭子女数 D.年龄 13.在一个数量数列中,出现次数最多 的标志值称为(C) A.均值 B.标准差 C.众值 D.极差 14.极差的另一个名称为(A) A.全距 B.分位差 C.众值 D.标准差 15.标准差系数属于度量什么的变异指 标(B) A.相对聚合程度 B.相对离散趋势 C.相 对集中趋势D.稳定性 16.若事件A与事件B为互不相容事件, 且在一次试验中都必有其一发生,则 称事件A与事件B为(D) A.事件和 B.特殊事件 C.事件积 D.对立 事件 17.逆概公式是对事件发生后导致事件 发生的各种什么的分析(A)

社会统计学公式

测量层次 1.下面能进行除法运算的测量尺度是() A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 2.三个人体重分别为50KG、47KG、68KG,这些数据属于() A 定类层次 B定比层次 C 定距层次 D 定序层次 3. 定距层次具有的数学特质是() A >与< B≠与﹦ C+与- D*与/ E 平方与立方 4、教育程度是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 5、定类层次分类时要注意两个原则,一个是,另一个是。 均值、中位值、众值 1、一组数据2 5 7 9 10 12的中位值是() A 7 B 8 C 9 D 10 2、下列指标属于集中趋势测量法的是() A众值B比例C中位值D均值D离异比率 3正态分布中相同的值是() A Q1 B众值 C Q3 D均值 E中位值 4一组12个数据,则Q1的位置= . 5. 用具有频数最多的变量值来表示变量的集中值被称为() A、众值 B、中位值 C、均值 D、四分位差 1、在选择相关测量法时,要考虑两个方面:首先的考虑是变项的,次 要的考虑是变量间的关系。 2、推论统计有两个基本内容:①;②。 3、间距估计时,一般选用的可信度是、、。 4、在一副扑克牌中单独抽取一次,抽到一张红桃或K的概率是();在一 副扑克牌中单独抽取一次,抽到一张红桃K的概率是()。 5、不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分 布就趋于()分布。 6、统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的 ( ),它决定了否定域的大小。 7、假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性 越(),原假设为真而被拒绝的概率越()。 8、参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计 和()。 9、变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去 知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这

卢淑华 《社会统计学》讲义

社会统计学讲义 第一章导论 一、社会统计学 1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。 研究对象:概括而言是指社会现象的数量方面。 2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。 3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。 4、社会统计的基本程序 (1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。 5、几个基本概念 (1)总体与单位 总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。构成总体的每一个个体称为总体单位,简称单位或个体。3个基本特征:大量性、同质性和变异性。(2)标志与变量 总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。 可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。 (3)指标与指标体系 统计指标是反映总体(或样本总体)的数量特征的概念或范畴。一个完整的统计指标由两部分构成:指标名称和指标数值。 在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。指标体系就是一系列有内在联系的统计指标的集合体。 二、社会调查研究的程序 社会学研究之阶段与步骤 (1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务; (2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探

相关文档
相关文档 最新文档