文档视界 最新最全的文档下载
当前位置:文档视界 > 社会统计学讲义

社会统计学讲义

社会统计学讲义.txt48微笑,是春天里的一丝新绿,是骄阳下的饿一抹浓荫,是初秋的一缕清风,是严冬的一堆篝火。微笑着去面对吧,你会感到人生是那样温馨。社会统计学讲义(卢淑华)

第一章社会学研究与统计分析

一、社会调查资料的特点(随时掌握)

随机性、统计规律性;

二、统计学的作用:为社会研究提供数据分析和推论的方法

三、统计分析的作用及其前提。

四、统计分析方法的选择

1 、全面调查和抽样调查的分析方法

2 、单变量和多变量的统计分析方法

五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等

第二章单变量统计描述分析

一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。尤其是直方图的意义。

二、标明组限与真实组限的换算,重要。

三、集中趋势测量法

1 、定义、优缺点、注意事项;

2 、众值:定义、计算公式、解释、运用,注意事项;

3 、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;

4 、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;

5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;

四、离散趋势测量法

1 、定义、优缺点、注意事项,与集中趋势的关系;

2 、异众比例:定义、计算公式、解释、运用,注意事项;

3 、质异指数:定义、计算公式、解释、运用,注意事项;

4 、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。

5 、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;

第三章概率

一、概率:就是指随机现象发生的可能性大小。随机现象具有不确定性和随机性。

二、概率的性质:

1 、不可能事件的概率为O ;

2 、必然事件的概率为1 ;

3 、随机事件的概率在O 一1 之间;

三、概率的计算方法:

1 、古典法:计算等概率事件,P 一有效样本点数/样本空间数;

2 、频率法:求随机事件在多次试验后的极限频率。

3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。

四、概率的运算:会画文氏图

1 、加法公式:两个或多个随机事件的求和概率‘

2 、乘法公式:两个或多个随机时间共同发生的概率。分为独立事件的乘法和条件概率的乘

法公式。

( l )独立:P ( AB ) = P ( A ) * P ( B )

( 2 )条件:PAB ) = P ( A ) * P ( A / B ) = P ( B ) * P ( B / A )

3 、条件概率:将(2 )反过来即可。P ( B / A )是指在A 发生的条件下B 发生的概率。

4 、全概公式:互不相容的完备事件组,求任意一个事件的发生

5 、逆概公式:与4 相反。

五、离散型随机变量和连续型随机变量的概率分布及密度函数。

六、数学期望:

1 、离散型变量数学期望的计算

2 、连续型变量数学期望的计算,可以忽略

3 、数学期望的性质,6 点,重要

七、方差:

1 、简化公式,一个变量的方差等于变量平方的期望减去变量期望的平方。

2 、方差的性质,4 点,重要,经常在参数估计和假设检验中用到。

第四章二项分布及其离散型随机变量的分布

一、二点分布,O 一1 分布,

l 、定义,

2 、概率分布、期望、方差

二、二项分布,贝努里分布:

l 、定义,

2 、概率分布公式

3 、期望、方差

4 、会求不同条件下的概率,如至多、至少出项多少次?

5 、二项分布的讨论

三、多项分布,重点是三项分布,了解。

1 、三项分布的公式

2 、每个变量的期望和方差,注意n 项分布,分别有n 一1 个期望和方差。

四、超几何分布:

1 、定义,跟二项分布的区别

2 、概率分布、期望、方差。

五、泊松分布

1 、定义、分布形式

2 、期望、方差,与二项分布的关系。

3 、应用范围及条件。

第五章正态分布、常用统计分布和极限定理

一、正态分布,常态分布:

1 、定义、密度分布、性质

2 、均值、方差,正态曲线下方面积的意义。

3 、正态分布标准化及实际意义。

4 、正态分布表的查法(注意对称性)。

二、常用统计分布

1 、卡方分布:定义,自由度,均值、方差,性质,换算。

2 、t 分布,定义,自由度,均值、方差,性质,换算。

3 、F 分布,定义,自由度,均值、方差,性质,换算。

4 、三种常用分布适用范围的比较。

三、大数定理

1 、大数定理的含义

2 、切贝谢夫不等式:用于保守估计某事件发生的概率

3 、贝努里大数定理。

4 、切贝谢夫大数定理。

四、中心极限定理:重点

1 、极限定理的含义。

2 、中心极限定理的含义,在何种情况下,何种变量趋向于正态分布。

3 、中心极限定理的

4 个推论,灵活运用。

五、二项分布、泊松分布、正态分布三者的近似关系

第六章参数估计

一、统计推论

1 、统计推论的定义

2 、统计推论的特点(优缺点),考题

3 、统计推论的理论基础及内容。

二、参数的点估计:(定义)

1 、什么是点估计(样本中称统计值,总体中称为参数)

2 、点估计的评价标准:

3 点或

4 点。

3 、总体均值的点估计

4 、总体方差(或标准差)的点估计

5 、总体成数的点估计。

三、抽样分布:统计量的抽样分布,如均值、方差的抽样分布

1 、样本均值的抽样分布:不同的抽样,其均值是不一样的,在具体抽样之前,均值是一个变量,抽样之后,均值就是一个具体的观察指(或统计值)。

2 、总体分布为正态分布、总体方差已知情况下的均值分布:可以用中心极限定理推演出来。(一般指小样本)

3 、总体分布为正态分布,总体方差未知、样本方差可知情况下的均值分布:(一般指小样本)。

4 、大样本、总体未知(或已知都无所谓),总体方差未知(或已知无所谓)情况下的均值分布:凡是提到大样本,均可用正态分布计算,用样本方差替代总体方差

5 、样本成数的抽样分布:凡是提到样本成数p ,都是特指大样本,小样本提成数没有意义。在大样本情况下,无论其分布如何,成数的分布都可以确定。

6 、样本方差的分布,这里特指总体是正态总体的情况。这个运用很多,其分布形式以及卡方换算,重要。

四、区间估计:根据样本大小、总体情况、样本个数情况,待估参数,可以将需要计算的区间估计划分为9 种类型,同假设检验。

1 、小样本、正态总体、总体方差已知,总体均值的区间估计:Z 分布

2 、小样本、正态总体、总体方差未知,总体均值的区间估计:t 分布

3 、小样本(一般不包括大样本)、正态总体,总体方差的区间估计,卡方分布。

4 、小样本、正态二总体,总体方差已知,总体均值差的区间估计,Z 分布

5 、小样本,正态二总体,总体方差未知,总体均值差的区间估计,t 分布

6 、大样本,分布未知(或已知无所谓),方差未知(或已知无所谓),总体均值的区间,Z 分布。

7 、大样本,分布未知(或已知无所谓),方差未知(或已知无所谓),二总体均值差的区间,Z 分布。

8 、大样本,分布未知(或已知无所谓),总体成数的区间估计,Z 分布

9 、大样本,分布未知(或已知无所谓),二总体成数差的区间估计,Z 分布

第七章假设检验的基本概念

一、假设检验的思想:

二、假设检验的原理:小概率原理和大数定理

三、基本假定:总体、抽样等假定。

四、基本概念:原假设、备择假设、单边检验、双边检验、显著性水平、临界值、接受域、拒绝域、两类错误(是指针对原假设而言的弃真和纳伪错误)。

五、假设检验的基本步骤:4 步。做题时候,要严格按照步骤及作出解释。

六、纳伪错误的计算原理,熟悉,多年没有考,计算相对复杂。

第八章单总体假设检验

一、跟参数估计类似,原则上有多少参数估计就会有多少对应的假设检验。

二、假设检验的类型:本章只讨论单总体,注意单边/双边及拒绝域

1 、大样本、总体均值检验,无论总体分布、方差已知与否:Z 检验

2 、大样本,总体成数检验,不考虑分布,Z 检验

3 、小样本、正态总体、总体方差已知,均值检验,Z 检验

4 、小样本、正态总体、总体方差未知,样本方差已知,均值检验:Z 检验。

5 、小样本、正态总体,总体方差检验:卡方检验。

6 、小样本、正态总体、总体标准差检验:同5 ,直接在5 后开方即可。

三、纳伪错误的计算,见书上例题。

第九章二总体假设检验(二分vs .二分,二分vs .定距变量)

一、二总体假设检验的类型:

1 、大样本、二总体分布未知(或已知无所谓)、二总体方差未知(或已知无所谓):二均值差检验:Z 检验

2 、大样本、二总体成数差检验:Z 检验

3 、小样本、正态总体、二总体方差已知,二总体均值差检验:Z 检验

4 、小样本、正态总体,二总体方差未知,但相等,二总体均值差检验:t 检验。注意,在未知二总体方差相等时,要检验二总体方差是否相等?

5 、小样本、正态总体、二总体方差比检验:F 检验

二、配对样本的比较:t 检验,重点。

第十章列联表(定类变量vs .定类变量)

一、列联表的定义:

二、列联表中的分布情况:(分频次,概率分布两种情况)

1 、联合分布:

2 、边缘分布:2 个,自变量和因变量各一个。

3 、条件分布:r + c 个,通常只求因变量的条件分布,控制自变量。

三、列联表中变量的独立性:条件概率分布等于边缘概率分布,那么自变量和因变量相互独立。

四、对于列联表的检验:

l 、原假设:场:plJ = pi , p , J

2 、选择统计量:卡方变量,注意公式,自由度。

3 、计算样本统计值。

4 、比较统计值和临界值的大小,决定原假设的取舍(即统计决策)。

五、关于列联表统计量的几点补充讨论说明:

1 、对于2X

2 的列联表,由于格数的限制,需要为减少作为离散观测值与作为连续型变量x 值之间的偏差,需要对其进行连续性修正。

2 、卡方检验适用于单变量二项总体或多总体的检验(重点,06 考)

3 、列联表格值的取值范围。

4 、列联表就其检验的内容来看是双边检验,就其形式而言是右侧单边检验。

5 、列联表的检验只能通过频次来检验而不能通过频率(相对频次)来检验。当相对频次不变时,样本容量增加K 倍时,卡方XZ 值也增加K 倍。(也即相对频次的统计表必须注明调查总数的原因)

六、列联强度的含义:表示变量间相关程度,程度越高,说明社会现象与社会现象间的关系越密切。

七、2X2 表的列联强度计算:

1 、中系数:(费系数),公式,取值范围卜1 , + 1 ] ,当bc 一0 ,且bc 相等时中一1 ,二变量完全相关;ad 一0 ,且ad 相等时,中一1 ,二变量完全相关;ad 一bC 时,中一0 ,二变量相互独立。说明:二定类变量的相关没有方向之分。

2 、尤拉Q 系数:公式,取值范围,注意Q 一1 时候的情况。

3 、如何选择中系数和Q 系数?取决于研究对象,当自变量的不同取值都会影响因变量时,则用中系数。

八、rXc 列联表的列联强度计算:

1 、以卡方值xZ 为基础的相关性测量:中

2 , CZ , v 系数等,注意公式,取值范围的临界值,相互比较其优缺点。

2 、以减少误差比例为基础的相关性测量:

( 1 )何为减少误差比例?PRE

( 2 ) PRE 的取值范围:[ O , l ]

( 3 ) PRE 的优点及意义。

3 、人系数

( 1 )根据PRE 原理得出E 上和EZ 的值,得出人的公式。可与李沛良书对照。

( 2 )人的取值范围:「0 , 1 ] ,跟PRE 的取值范围一致。注意取极端值时候列联表的情况。(06 年考)

( 3 )人的非对称性讨论。默认情况下,用自变量预测因变量。

4 、:系数(由Goodman 和Kruksal 所创)

( l )根据PRE 原理得出E 上和EZ 的值,得出:的公式。可与李沛良书对照。

( 2 ) :值的取值范围,「0 , 1 ] ,跟PRE 的取值范围一致。注意取极端值时候列联表的情况。(06 年考)

( 3 ) :系数也是非对称性系数。

( 4 )比较:系数与人系数::充分考虑了定类变量的信息,较人值更准确,更佳,但是人较:更容易计算。二者都具有PRE 性质。

九、在计算列联表强度时,必须先对列联表进行卡方检验,有显著性差异才有计算列联强度的必要。

第十一章等级相关(定序变量vs .定序变量)

一、斯皮尔曼等级相关系数:rs

1 、含义及公式。

2 、取值范围及意义。rs 一+l 和一1 的列联表情况。

3 、rs 是积距相关系数r 的特例,其平方r 乒具有PRE 性质。

4 、斯皮尔曼等级相关对总体分布没有特别要求。

5 、适用范围及前提。

6 、等级相关系数rs 的检验。两种情况

二、G ? a 等级相关:G 系数

1 、同序对:两个变量在xy 上的变化方向一致。

2 、异序对:两个变量在xy 上的变化方向相反。

3 、同分对:包括x 方向,y 方向和xy 方向上的同分对,两个变量在xy 上的一个或二个等级相同。

4 、根据列联表重的频次计算同序对、异序对和同分对的个数。

5 、Gamma 系数的公式,取值范围,及其PRE 性质。

6 、在什么情况下,G 系数和2X2 列联表的Q 系数相同?

7 、G 系数的检验。从样本推论到总体。

三、其它的等级相关系数

l 、Kendall , 5 Tau 系数

( 1 ) tau 一a 系数的公式,取值范围以及去+l 和一1 时的情况。

( 2 ) tau 一b 系数的公式,取值范围,以及是如何对tau 一a 修正的?( 3 ) tau 一c 系数的公式。

2 · Somer ' sd 系数,萨默斯d 系数

( l )包括x 方向和y 方向两个系数,通常默认为y 方向的dy 系数。( 2 )计算公式。

四、S 因子检验法:原假设,研究假设,统计量和计算方法。

五、比较rs 系数、G 系数,:系数和d 系数。

1 、对各系数的解释。

2 、取值范围的比较

3 、前提,适用性以及修正性的比较。

4 、PRE 性质比较。

5 、除了rs 外,都可以运用S 因子检验法。

第十二章回归与相关(定距变量vs .定距变量)

一、回归研究的对象

1 、回归是研究定距变量与定距变量之间的非确定关系(相关关系中的因果关系)。

2 、相关关系:有关系,但不确定。

3 、回归方程:研究自变量在不同取值时,与因变量的均值之间的关系的方程。有一元回归方程和多元回归方程等。

二、回归方程的建立

1 、运用最小二乘法来拟合回归直线:y 一+px (根据样本)

2 、回归方程的计算:重点

3 、回归方程(模型)的基本假定:

( l ) x 可以随机变量,也可以不是随机变量。

( 2 ) y 子总体的同方差假定。

( 3 ) y 子总体均值的线性假定。

( 4 ) y 子总体的独立性假定。

( 5 ) y 子总体的正态性假定。

4 、回归方程的检验:判断是否有必要来建立回归直线。

( 1 )总偏差平方和TSS ,相当于EI :计算及意义

( 2 )乘l 余平方和RSS ,相当于EZ :计算及意义

( 3 )回归平方和RSSR , :计算及意义

( 4 )统计量的选取,及相应自由度。

( 5 ) F 检验:内容上的双边检验,形式上的右单边检验。

三、相关

1 、相关关系的定义:

2 、相关关系的形式:正/负,因果/非因果,线性/非线性,……

3 、协方差的计算原理及其标准化。

4 、相关系数:公式及PRE 性质。重点

5 、相关系数与回归系数的换算关系。

6 、相关系数的特点:受变量取值影响很大,不因坐标原点的改变而改变。

7 、相关系数的检验。t 检验和直接检验法。

四、相关与回归的比较:同/异,重点

1 、研究对象一样。

2 、研究角度不一样。

3 、回归系数和相关系数的含义不一样。性质、特点不一样,需要同时研究。

4 、对回归系数和相关系数检验的结果一样。

五、如何用回归方程进行预测:

要求预测的是当自变量x 取某值的时候,y 值的区间估计。置信区间的长度主要由RSS 确定。注意回归分析在非实验性设计中的运用问题。

第十三章方差分析(定类变量vs .定距变量)

一、方差分析的定义:分析或检验总体间的均值是否有所不同,而不是方差是否不同。但是就其检验的手段而言是通过方差来进行的。

1 、一元方差分析,常考

2、二元方差分析,常考

3 、多元方程分析,极少考

二、一元方差分析

1 、方差分析的假定:y 子总体的等方差性,y 子总体为正态分布。方差分析对正态分布的要求并不十分严格。

2 .方差分析的检验:

( l )原假设/备择假设,内容上是双边的。

( 2 )统计量的选择,FSS = BSS * ( n 一m ) / R 55 * ( m 一l )

( 3 )相关统计量的计算及自由度。

三、相关L 匕率etaZ

与r 平方相比较。

四、二元方差分析

1 、定义

2 、独立模型及假定

3 、交互作用模型及假定

五、无重复情况下的二元方差分析(独立模型检验)

1 、假定

2 、原假设/备择假设,2 个

3 、统计量的选择,有2 个。

4 、相关统计量的计算及自由度。

六、重复情况下的二元方差分析(交互作用模型的检验)

1、假定

2 、原假设/备择假设,

3 个

3 、统计量的选择,有3 个,先检验交互作用

4 、相关统计量的计算及自由度。

5 、固定模型

6 、随机模型

7 、混合模型。

七、多元方差分析。

第十四章非参数检验(定类vs .定序变量)

一、非参数检验

1 、定义

2 、特点,应用范围,优缺点。

二、符号检验:

1 、针对

2 个配对样本

2 、二项分布原理

3 、检验过程及结果、临界值的查找。

三、符号秩检验:

1 、针对

2 个配对样本

2 、检验过程及结果、临界值的查找。

四、秩和检验

1 、针对

2 个独立样本

2 、总体1 的样本数小于等于总体2 的样本数,即小样本排在前面

3 、检验过程及结果及临界值。

五、游程检验

1 、针对

2 个独立样本

2 、检验过程、结果及临界值。

六、累计频次检验:

1 、针对

2 个独立样本

2 、检验过程、结果及临界值。

七、单向方差秩分析:

1 、针对多个独立样本

2 、检验过程、结果及临界值。公式

八、双向方差秩分析:

1 、针对配组样本

2 、检验过程、结果及临界值。公式

第十五章抽样

一、抽样方法:以研究方法教材为主、了解。

二、抽样误差的计算:

1 、简单随机抽样的均值抽样误差:

2 、简单随机抽样的成数抽样误差:

3 、简单不重复随机抽样的均值抽样误差:

4 、简单不重复随机抽样的成数抽样误差:

5 、分层抽样中,简单重复抽样的均值抽样误差:一般情况

6 、分层抽样中,简单不重复抽样的均值抽样误差:一般情况

7 、分层抽样中,简单重复、定比抽样的均值抽样误差:定比情况

8 、分层抽样中,简单不重复、定比抽样的均值抽样误差:定比情况。

重点把握以上8 中情况的均值或成数抽样误差,与参数估计联系起来记忆。

三、样本容量的确定

1 、影响样本容量的因素:

2 、抽样原则:原则上要求在有限经费内抽取最大样本数。

3 、根据不同情况下的抽样误差计算样本容量:区分重复和非重复两种情况。

4 、一般情况下,默认为重复抽样。

四、抽样过程:5 步,了解。

相关文档
  • 社会统计学复习

  • 社会统计学期末

  • 社会统计学笔记

  • 社会统计学答案

  • 社会统计学试卷

  • 社会统计学试题

相关推荐: