文档库 最新最全的文档下载
当前位置:文档库 › 统计套利的历史与发展现状分析

统计套利的历史与发展现状分析

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

统计学答案第八章

三、选择题 1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的纤度的均值x=1.39,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为α=0.05,则下列正确的假设形式是()。 A.H0:μ=1.40,H1:μ≠1.40 B. H0:μ≤1.40,H1:μ>1.40 C. H0:μ<1.40,H1:μ≥1.40 D. H0:μ≥1.40,H1:μ<1.40 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。 A. H0:π≤0.2,H1:π>0.2 B. H0:π=0.2,H1:π≠0.2 C. H0:π≥0.3,H1:π<0.3 D. H0:π≥0.3,H1:π<0.3 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3 2磅,则其原假设和备择假设是()。 A. H0:μ≤8,H1:μ>8 B. H0:μ≥8,H1:μ<8 C. H0:μ≤7,H1:μ>7 D. H0:μ≥7,H1:μ<7 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设 7 在假设检验中,第二类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时未拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 8 指出下列假设检验哪一个属于右侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0 :μ>μ0, H1:μ≤μ0 9 指出下列假设检验哪一个属于左侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0 , H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0:μ>μ0, H1:μ≤μ0 10 指出下列假设检验哪一个属于双侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0

统计学简答题完整版

一、统计的含义和本质是什么P2 含义:“统计”一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理和统计分析三个阶段;统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何搜集、整理和分析统计数据的科学。 本质:统计的本质就是关于为何统计,统计什么和如何统计的思想。 二、统计数据有哪些分类不同类型数据有什么不同特点P7 1.统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 2.统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据,有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 3.统计数据按照其来源不同,可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下,通过实验的方式而获得的关于实验对象的数据。 4.统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据,是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5.统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据(即空间状态相同,时间状态不同)。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据(即空间状态不同,时间状态相同)。 三、总体和样本概念以及它们之间的关系如何P14 概念:总体,就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。样本,就是从总体中抽取的一部分个体所组成的集合。 关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断,即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变,一定的研究总体也可成为另一意义上总体的一个样本,这说明总体与样本的角色是可以改变的。 四、标志和指标之间的关系如何P17 区别:1.指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征。 2.指标和标志的表现形式不同,指标是用数值来表现的,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。 联系:1.标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的,因而指标与标志的确定也是相对的、可以换位的。 五、统计数据收集方案包括哪些内容P25 数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

统计学第八章题目

一.单项选择题 1、用于测定两个变量之间密切程度的方法是( D )。 A、定性判断 B、相关表 C、相关图 D、相关系数 2、产品产量和单位成本的相关系数是—0.95,单位成本和利润率的相关系数是0.90,产量和利润的相关系数是0.08,因此( C)。 A、产量和利润的相关程度最高 B、单位成本和利润率的相关程度最高 C、产量和单位成本的相关程度最高 D、无法判断哪对变量的相关程度最高 3、相关系数的取值范围是( D )。 A、0≤r≤1 B、-1≤r≤0 C、r>0 D、-1≤r≤1 4、变量x和y之间的负相关是指(C )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少 C、x值增大时y值随之减少,或x值减少时y值随之增大 D、y的取值几乎不受x取值的影响 5、两个变量之间的相关关系称为( B )。 A、复相关 B、单相关 C、曲线相关 D、直线相关 6、、正方形的边长和周长的相关系数为( A )。 A、1 B、-1 C、0 D、无法计算 7、在一元线性回归方程中,回归系数b的含义是( B )。

A 、当x=0时,y 的平均值 B 、当x 变动一个单位时,y 的平均变动数额 C 、当x 变动一个单位时,y 增加的总数额 D 、当y 变动一个单位时,x 的平均变动数额 8、常用的求解一元线性回归方程的方法是( B )。 A 、相关系数法 B 、最小平方法 C 、误差绝对值最小法 D 、误差和最小法 9、下列回归方程和相关系数的对应式中,错误的是( C ) A 、89.0,5.2170?-=-=r x y B 、94.0,8.35?-=--=r x y C 、78.0,5.036?-=+=r x y D 、98.0,9.25?=+-=r x y 10、已知变量x 和y 线性相关,x 和y 的协方差为-60,x 的方差为 64,y 的方差为去100,则二者的相关系数的值为( B )。 A 、0.75 B 、-0.75 C 、0.1 D 、-0.1 11、已知变量x 和y 高度线性相关,x 和y 的协方差为-60,x 的方 差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系 数b 的值为( B )。 A 、0.94 B 、-0.94 C 、0.6 D 、-0.6 12、若相关系数为正值,则回归系数的值( B )。 A 、为负 B 、为正 C 、视a 的符号而定 D 、不能确定 13、回归估计标准误差是说明( C )的指标。 A 、平均数代表性 B 、现象之间相关程度

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学简答题

1常用的统计调查方式主要有哪些? 答:⑴统计报表。是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。⑵普查。是为特定目的而专门组织的一次性全面调查。⑶抽样调查。是从研究对象的总体中随机抽取一部分个体作为样本进行调查,并根据调查结果来推断总体数量特征的一种非全面调查方法。 2分类数据、顺序数据的整理及图示方法各有哪些? 答:对于分类数据:(1)数据的整理方法有列出所分的类别,计算每一类别的频数、频率、比例、比率等。(2)图示方法有条形图和圆形图。对于顺序数据:(1)数据的整理方法中包括所有的处理分类数据的方法,同时还可以计算累积频数和累积频率(2)图示方法包括累积分布图和环形图 3数值型数据的整理及图示方法有哪些?试述组距分组的步骤。 ⑴用频数分布表(变量数列)展示数值型数据①单变量值分组②组距分组 ⑵用图示展示数值型数据①直方图②箱线图③线图④茎叶图组距分组的步骤:①确定组数②确定各组的组距③整理成频数分布表 4误差主要包括哪两类?引起误差的原因分别是什么? 答:主要包括抽样误差和非抽样误差抽样误差:是指由样本数据对总体特征进行估计时所引起的代表性误差,原因是由于每次抽取一个样本,而样本中包含的哪些单元是随机的,不同的样本由于包含的单元不同,得到的估计值自然不同,各个估计值与总体特征之间不可避免的出现差距,由此产生了抽样误差。非抽样误差:其来源比较复杂,主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,还有无回答误差和粗大误差。 5什么是抽样平均误差?抽样平均误差、方差和偏差的关系? 抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。 6影响样本容量的主要因素有哪些? 答:(1)总体各单位标志变异程度;(2)允许误差的大小;(3)概率度的大小;(4)抽样方法不同;(5)抽样方式不同。 7什么是多重共线:多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确 8方差分析的基本原理是什么? 答:方差分析总的思想是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小,从而判断该因素对总体是否有统计意义。 9简述方差分析的基本步骤? (1建立检验假设; H0:多个样本总体均值相等; H1:多个样本总体均值不相等或不全等。 检验水准为0.05。 (2计算检验统计量F值;(3确定P值并作出推断结果。 10简述方差分析和回归分析的异同? 答:方差分析主要用来研究数据分布的离散与集中,稳定与波动的情况,回归分析是通过数据的分布情况拟合出其分布规律.两者不是一回事 11简述回归方程的显著性检验与回归系数的显著性检验的区别和联系。 答:t检验常能用作检验回归方程中各个参数的显著性,而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

统计学简答题答案

1.“统计”一词有哪些含义?什么就是统计学? (1)统计工作或统计实践活动:对现象的数量进行搜集、整理与分析的活动过程 (2)统计资料:通过统计实践活动取得的说明对象某种数量特征的数据 (3)统计学:就是关于数据的一门科学 统计学就是一门收集、整理、显示与分析统计数据的科学,其目的就是探索数据内在的数量规律性。 2.一组数据的分布特征可以从哪几个方面进行测度? 一组数据的分布特征可以从以下三个方面进行测度: 集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值) 离散程度测度(极差、内距、方差与标准差、离散系数) 偏态与峰度测度(偏态及其测度、峰度及其测度) 3.分布集中趋势的测度指标有哪些? 众数、中位数、分位数、均值、几何平均数、切尾均值 4.简述众数、中位数与均值的特点与应用场合。 众数最容易计算,但不就是永远存在,它不受极端值影响、具有不惟一性、作为集中趋势代表值应用的场合较少,数据分布偏斜程度较大时应用,在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的中数值为代表。 中位数很容易理解、很直观,它不受极端值的影响,这既就是它有价值的方面,也就是它数据信息利用不够充分的地方; 均值就是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分,数据对称分布或接近对称分布时应用,它在整个统计方法中应用最广,对经济管理与工程等实际工作也就是最重要的代表值与统计量。 5.分布离散程度的测度指标有哪些? 极差、内距、方差与标准差、离散系数 6、常用的概率抽样方法有哪些?各自的含义如何? (1)简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,使得每一个总体单位都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样。 (2)分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为不同的层,然后从不同的层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样。 (3)系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 (4)整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察。 (5)多阶段抽样:先抽取群,但并不就是调查群内的所有单位,而就是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。 群就是初级抽样单位,第二阶段抽取的就是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。 7、什么就是抽样分布? 就就是由样本n个观察值计算的统计量的概率分布。 8、什么就是匹配样本? 一个样本中的数据与另一个样本中的数据相对应,这样的样本称为匹配样本。 9、假设检验的思想以及假设检验中的两类错误就是什么? 假设检验的基本思想就是小概率反证法思想。小概率思想就是指小概率事件(P<0、01或P<0、

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

统计学简答题整理

统计学简答题 第一章 1.统计的含义和本质是什么? 统计一词包含三个含义:统计数据、统计活动和统计学。 统计的本质就是关于“为统计,统计什么和如统计”的思想,就是围绕研究目的和任务,运用科学的统计法,去获取真实客观的有关统计数据,做出必要的统计分析,以了解和认识事物的真相。 2.什么是统计学?有哪些性质? 统计学是关于如收集、整理和分析统计数据的学科。 统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科畴而言,具有法型、层次性和通用性的特点;就其研究式而言,具有描述性和推断性的特点。 3.总体、样本、个体三者的关系如?试举例说明。 概念:总体就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称母体。样本就是从总体中抽取一部分个体所组成的集合,也称子样。组成总体的每个个别事物就称为个体,也称总体单位。 总体与个体的关系: 1.总体的容量随着个体数的增减可变大变小。 2.随着研究目的的不同,总体中的个体可以发生变化。 3.随着研究围的变化,总体和个体的角色可以变换。 样本和总体的关系: 1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。 3.总体和样本的角色是可以改变的。 4.如理解标志、指标、变量三者的含义?试举例说明。 标志是用于描述或体现个性特征的名称,如某人是男性,教师。 统计指标简称指标是反映现象总体数量特征的概念以及数值,如09年全国人口13亿。 从狭义上看变量是指可变的数量标志,从广义上看变量不仅指可变数量标志也包括可变的品质标志,因此可变标志就是变量。 5.什么是统计指标体系?有哪些表现形式?试举例说明。 统计指标体系是由一系列统计指标构成,但并不是单个指标的简单组合,而是各个指标之间相互联系,相互制约的。 表现形式:1.数学等式关系 2.相互补充关系 3.相关关系 4.原因、条件、结果关系 第二章 1.概率抽样和非概率抽样有什么本质区别?试举例说明。

相关文档