文档库 最新最全的文档下载
当前位置:文档库 › 统计学简答题汇总

统计学简答题汇总

统计学简答题汇总
统计学简答题汇总

1、标准正态分布(u分布)与t分布有何异同?

相同点:集中位置都为0,都就是单峰分布,就是对称分布,标准正态分布就是t分布得特例(自由度就是无限大时)

不同点:t分布就是一簇分布曲线,t 分布得曲线得形状就是随自由度得变化而变化,标准正态分布得曲线得形状不变,就是固定不变得,因为它得形状参数为1。

3、简述直线回归与直线相关得区别。

1资料要求上不同:直线回归分析适用于应变量就是服从正态分布得随机变量,自变量就是选定变量;直线相关分析适用于服从双变量正态分布得资料。

2 两种系数得意义不同:回归系数就是表明两个变量之间数量上得依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数就是表明两个变量之间相关得方向与紧密程度得,相关系数越大,两个变量得关联程度越大。

第一章医学统计中得基本概念

2、抽样中要求每一个样本应该具有哪三性?

从总体中抽取样本,其样本应具有“代表性”、“随机性”与“可靠性”。

(1)代表性: 就就是要求样本中得每一个个体必须符合总体得规定。

(2)随机性: 就就是要保证总体中得每个个体均有相同得几率被抽作样本。

(3)可靠性: 即实验得结果要具有可重复性,即由科研课题得样本得出得结果所推测总体得结论有较大得可信度。由于个体之间存在差异, 只有观察一定数量得个体方能体现出其客观规律性。每个样本得含量越多,可靠性会越大,但就是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。

3、什么就是两个样本之间得可比性?

可比性就是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其她可能影响实验结果得因素要求基本齐同,也称为齐同对比原则。

实习一统计研究工作得基本步骤

1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?

医学统计学:就是运用统计学原理与方法研究生物医学资料得搜索、整理、分析与推断得一门学科

统计学:就是研究数据得收集、整理、分析与推断得科学。卫生统计学:就是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理与医学科研得一门应用学科。

生物统计学:就是一门探讨如何从不完整得信息中获取科学可靠得结论从而进一步进行生物学实验研究得设计,取样,分析,资料整理与推论得科学。2、医学统计得资料主要来源于那些方面?有何要求?医学统计资料主要有实验数据与现场调查资料、医疗卫生工作记录、报表与报告卡等。实验数据就是指在试验过程中活得得数据;现场调查资料主要来源于大规模得流行病调查获取得资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料得手机过程中,必须进行质量抗旨,包括它得统一性、确切性、可重复性。这些原始数据得精读与偏性应有明确得范围。

3、医学统计学得资料类型有哪些?

(1)计量资料:对每个观察单位用定量得方法测定某项指标量得大小,所得得资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。、其变量值就是定量得,表现为数值大小,一般有度量衡单位。如某一患者得身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。

(2)计数资料:将观察单位按某种属性或类别分组,所得得观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值就是定性得,表现为互不相容得类别或属性。如调查某地某时得男、女性人口数;治疗一批患者,其治疗效果为有效、无效得人数;调查一批少数民族居民得A、B、AB、O 四种血型得人数等。

(3)等级资料:将观察单位按测量结果得某种属性得不同程度分组,所得各组得观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者得治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既就是分类结果,又有顺序与等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量得测定结果分为 +、++、+++等。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

4、常见得三类误差就是什么?应采取什么措施与方法加以控制?

常见得三类误差就是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性得偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但就是,由于各种偶然因素得影响也会造成同一对象多次测定得结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间得操作差异,电压不稳及环境温度差异等因素造成测量结果得误差。对于这种误差应采取相应得措施加以控制,至少应控制在一定得允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度得稳压器、恒温装置等措施,从而达到控制得目得。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异就是由抽样引起得,故这种误差叫做抽样误差,要用统计方法进行正确分析。

实习二单变量资料得统计描述

1、试述频数表得要素及用途。

要素:组段,频距。

用途:

①描述资料得分布特征与分布类型。频数分布有两个重要特征:集中趋势与离散趋势。大部分观察值向某一数值集中得趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,就是个体差异所致,可用一系列得变异指标来反映。

②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

③发现特大、特小得可疑值。如果频数表得一端或两端出现连续几个组段得频数为零后,又出现少数几个特大值或特小值,使人怀疑其就是否准确,需进一步检查与核对并做相应处理。

④ 当样本含量比较大时,可用各组段得平率作为概率得估计值。

2、描述单变量资料得统计指标分哪两大类,分别就是什么指标?

分类:

①描述数据分布集中趋势得指标:算术均数、几何均数、中位数。

②描述数据分布离散程度得指标:极差、四分位数间距、方差、标准差、变异系数。

3、试述平均数、标准差、变异系数得含义及用途?

4、标准正态分布曲线下面积有何分布规律?

所有得正态分布曲线,在υ左右得相同倍数得标准差范围内得面积相同。并且,在υ±σ范围内得面积约为68、3%;在υ±1、96σ范围内得面积约为

95%;在υ±2、58σ范围内面积约为99%。

5、同一资料得标准差就是否一定小于均数?

均数与标准差就是两类不同性质得统计指标、标准差用于描述数据得变异程度,变异程度大,则该值大,变异程度小,则该值小、标准差可大于均数,也可小于均数。

实习三单变量资料得统计推断

1、标准差与标准误有何区别与联系?

?区别:

1、含义不同:⑴s描述个体变量值(x)之间得变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强。⑵标准误就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

2、与n得关系不同: n增大时,⑴s σ(恒定)。⑵标准误减少并趋于0(不存在抽样误差)。

3、用途不同: ⑴s:表示x得变异度大小,计算cv,估计正常值范围,计算标准误等⑵ :参数估计与假设检验。

?联系: 二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。

2、简述Ⅰ型错误与Ⅱ型错误得区别与联系。

·区别:

Ⅰ型错误(弃真):拒绝实际成立得H,型错误得概率记为α。(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)得百分数。当p≤α而拒绝H时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。

Ⅱ型错误(存伪):不拒绝实际不成立得H,Ⅱ型错误得概率记为β。(1-β)即把握度(或检验效能:两总体确有差别,被检出有差别得能力。当p≥α而拒绝H 时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。

·联系:对同一资料,α与β反方向变化,若要同时减小α与β,唯一得办法就是增加样本含量。

3、可信区间与参考值范围得不同点。

应注意:可信区间与参考值范围得意义、计算公式与用途均不同。

1、从意义与用途来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指按95%可信度估计得总体均数得所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值得分布范围,变量值可能很多甚至无限。

2、从计算公式瞧:

若指标服从正态分布,95%参考值范围得公式就是:、96s。总体均数95%可信区间得公式就是:。

前者用标准差,后者用标准误。前者用1、96,后者用α为0、05,自由度为v得t界值。

4、在统计推断中,如何区别单侧检验与双侧检验?

如果将拒绝性概率平分于理论抽样分布得两侧,称为双侧检验。例如选定显著性水平α= 0、05,双侧检验就就是将α概率所规定得拒绝区域平分为两部分而置于概率分布得两边,每边占有=0、025。双侧检验只强调差异就是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布得一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。单侧检验强调差异得方向性。

在具体得假设检验中,选择双侧检验或单侧检验可分为以下三种情况:

第一种:H:μ=μ:μ≠μ双侧

第二种:H:μ≥μ:μ<μ单侧(左侧)

第三种:H:μ≤μ:μ>μ单侧(右侧)

5、t检验、z检验得公式有那些类型,在应用上有何异同?

t检验:当样本例数n较小时,要求样本取自正态总体。

t检验得类型:单样本t检验,独立t检验,配对t检验

z检验:样本例数较大,或n虽小而总体标准差已知。

6、假设检验与总体均数区间估计有何联系?

假设检验:就是对总体做出某种假定,然后根据样本信息推断总体就是否成立得一类统计学方法总称。假设检验有三个基本步骤:①建立假设与确定检验水准;②选择检验方法与计算检验统计量;③确定P值与做出统计推断结论。

总体均数得估计:1、点估计:样本统计量直接作为总体指标得估计值。它未考虑抽样误差得大小。

2、区间估计:按预先给定得概率(1α)确定得包含未知总体参数得可能范围。

实习四方差分析

1、方差分析得基本思想就是什么?

方差分析(analysis of variance,ANOVA )得基本思想就就是根据资料得设计类型,即变异得不同来源将全部观察值总得离均差平方与(sum of squares of deviations from mean,SS)与自由度分解为两个或多个部分,除随机误差外,其余每个部分得变异可由某个因素得作用(或某几个因素得交互作用)加以解

释,如各组均数得变异SS 组间可由处理因素得作用加以解释。通过各变异来源得均方与误差均方比值得大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

2、t检验与F检验得使用条件与应用范围有何异同?

t检验适用于两个样本均数得比较,F检验适用于多个样本得比较。

t检验得应用条件:要求各样本来自相互独立得正态总体且各总体方差齐。

方差分析得应用条件(1)各样本就是相互独立得随机样本,且来自正态分布总体。(2)各样本得总体方差相等,即方差齐性。

实习五计数资料得统计推断与描述

1、率得标准化得意义及基本思想。

当比较得两组资料内部各小组率明显不同,且各小组观测例数得构成比也明显不同时,直接比较两个合计率就是不合理得。因为期内部构成比不同,往往影响合计率得大小,需要统一得内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率得标准化。

率得标准化得基本思想:要比较两个总率时,发现两组资料得内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率得结果,这时就不宜再直接比较总率,而应考虑采用标准化法。标准化法得基本思想,就就是采用统一得标准(统一得内部构成)计算出消除内部构成不同影响后得标准化率(调整率),然后再进行比较。

2、常用相对数指标有哪些?它们在计算与意义上有何不同?

率(强度相对数,频率相对数)、构成比、相对比

应用相对数时应注意得问题:⑴计算相对数得分母一般不宜过小。⑵分析时不能以构成比代替率。⑶不能用构成比得动态分析代替率得动态分析。⑷对观察单位数不等得几个率,不能直接相加求其总率。⑸在比较相对数时应注意可比性。⑹对样本率(或构成比)得比较应随机抽样,并做假设检验。

3、卡方检验得使用范围与各个公式得适用条件就是什么?

卡方检验用于:推断两个及两个以上总体率或构成比就是否有差别,两个分类变量间有无相关关系,多个率得趋势检验,以及两个率得等效检验等。此外,也用于频数分布得拟合优度检验。

对不同得设计类型得资料,检验得应用条件不同:

(1) 完全随机设计两样本率得比较

1) 当n>40,且T≥5时,用非连续性校正值;

若所得P≈α,则改用四格表得确切概率法。

2) 当n≥40,且有1≤T<5时,用连续性校正值。

3) n<40,或有T<1时,不能用检验,应当用四格表得确切概率法。

(2) 配对设计四格表

1) 当b+c≥40,

2) 当b+c<40,需作连续性校正,

(3) 行列表资料

1) 不宜有1/5以上格子得理论频数小于5,或有1个格子得理论频数小于1;

2) 单向有序行列表,在比较各处理组得效应有无差别时,应该用秩与检验或Ridit检验;

3) 多个样本率(或构成比)比较得检验时,结论为拒绝无效假设时,只能认为各总体率(或总体构成比)之间总得说来有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。若想进一步了解哪两者得差别有统计学意义,可用分割法。

4、率得标准误得意义与用途。

意义:由于抽样得原因所造成得样本率与总体率得不一致就就是率得抽样误差。率得抽样误差得大小就是用率得标准误来表示。

用途:①表示抽样误差得大小 ,说明样本率得代表性、可靠性。②对总体率得可信区间进行估计。

实习六非参数资料得统计分析

1、非参数统计方法得概念及适用范围。

概念:样本所来自得总体分布难以用某种函数式来表达, 还有一些资料得总体分布得函数式就是未知得,只知道总体分布就是连续型得或离散型得,解决这类问题得一种不依赖总体分布得具体形式得统计方法。由于这类方法不受总体参数得限制,故称非参数统计法,或称为不拘分布得统计分析方法,又称为无分布型式假定得统计分析方法。它检验得就是分布,而不就是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

适用范围:(1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。(7)对于一些特殊情况,如从几个总体所获得得数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

2、非参数检验得优缺点。

优点:①非参数统计方法要求得假定条件比较少,因而它得适用范围比较广泛。②多数非参数统计方法要求得运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。③大多数非参数统计方法在直观上比较容易理解,不需要太多得数学基础知识与统计学知识。④大多数非参数统计方法可用来分析如象由等级构成得数据资料,而对计量水准较低得数据资料,参数统计方法却不适用。⑤当推论多达3个以上时,非参数统计方法尤具优越性。

缺点:①由于方法简单,用得计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就就是说,在给定得显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误得概率β要大些。②对于大样本,如不采用适当得近似,计算可能变得十分复杂。

注意: 凡符合或经过变换后符合参数检验条件得资料,最好用参数检验。当资料不具备参数检验得条件时,非参数检验就是一种有效得分析方法。

实习七直线相关与回归分析

1、相关与回归得联系与区别。

区别:

意义:相关反映两变量得相互关系,即在两个变量中,任何一个得变化都会引起另一个得变化,就是一种双向变化得关系。回归就是反映两个变量得依存关系,一个变量得改变会引起另一个变量得变化,就是一种单向得关系。

应用:研究两个变量得相互关系用相关分析。研究两个变量得依存关系用回归分析。

研究性质:相关就是对两个变量之间得关系进行描述,瞧两个变量就是否有关,关系就是否密切,关系得性质就是什么,就是正相关还就是负相关。回归就是对两个变量做定量描述,研究两个变量得数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

相关系数r与回归系数b :r与b得绝对值反映得意义不同。r得绝对值越大,散点图中得点越趋向于一条直线,表明两变量得关系越密切,相关程度越高。b得绝对值越大,回归直线越陡,说明当X变化一个单位时,Y得平均变化就越大。反之也就是一样。

联系:r与b值可相互换算;r与b正负号一致;r与b得假设检验等价;回归可解释相关。相关系数得平方r(又称决定系数)就是回归平方与与总得离均差平方与之比,故回归平方与就是引入相关变量后总平方与减少得部分。

2、直线相关、秩相关得区别与联系。

区别:(1)资料要求不同:直线相关要求x、y就是来自双变量正态总体得随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示得原始数据。(2)相关意义不同:直线相关表示两变量得直线相关关系存在,秩相关表示两变量得相关关系。

联系:相关系数得取值范围相同;秩相关将原始数据进行秩变换,以秩次计算直线相关系数。

实习八统计表与统计图

1、统计表及统计图得制表原则与要求。

统计表:

(1) 统计表得制表原则

1) 应重点突出,即一张表一般只包括一个中心内容,内容较多时可以用多个表格表达不同指标与内容。

2) 统计表要层次清楚,即标目得安排及分组符合逻辑,便于分析比较。主谓分明,通常主语放在表得左边,作为横标目;谓语放在右边,作为纵标目。由左向右读,构成完整得一句话。但若统计表得主语项目少而谓语项目多或主语项目多而谓语只有一项,亦可将纵标目作主语、横标目作谓语,阅读时从上至下。

3) 统计表应简单明了,一切文字、数字与线条都应尽量从简。

(2) 制表要求:统计表通常由标题、标目、线条、数字4部分组成。表中数字区不插入文字,也不列备注项。必须说明者标“*”号等,在表下方说明。 1) 标题:应高度概括表得主要内容,一般包括研究得时间、地点与研究内容,左侧加表号,置于表得上方。

2) 标目:有横标目与纵标目,分别说明表格每行与每列数字得意义。横标目位于表头得左侧,代表研究得对象;纵标目位于表头右侧,表达研究对象得指标。注意标明指标得单位。

3) 线条:力求简洁,多采用三条线,即顶线、底线、纵标目下横线。部分表格可再用短横线将“合计”分隔开,或用短横线将两重纵标目分割开。其它竖线与斜线一概省去。

4) 数字:用阿拉伯数字表示。同一指标小数点位数一致,位次对齐。表内不留空项,无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”。

统计图:①根据资料性质与分析目得正确选用适当得统计图。②除圆图外,一般用直角坐标系得第一象限得位置表示图域(制图空间),或者用长方形得框架表示。③绘制图形应注意准确、美观,给人以清晰得印象。

2、常见得统计图有哪几种?它们得使用条件各就是什么?

常用得统计图有直条图、直方图、百分比条图与圆图、线图、散点图、统计地图、箱式图等。

·直条图:适用于比较、分析独立得或离散变量得多个组或多个类别得统计指标。指标既可以就是绝对数,也可以就是相对数。

·直方图:主要应用于频数分布资料,描述连续变量得频数分布。

百分比条图与圆图:表示事物内部各构成部分所占得比重,适合描述分类变量得各类别所占得构成比。其中,百分比条图特别适合作多个构成比得比较。·线图:适合于描述某统计量随另一连续性数值变量得变化而变化得趋势,常用于描述统计量随时间变化而变化得趋势。普通线图描述得就是绝对变化趋势,半对数线图描述得就是相对变化趋势,特别适宜作不同指标或相同指标不同组别得变化速度得比较。

·散点图:以直角坐标上点得密集程度与趋势来表示两个变量间得相关关系。

·统计地图:以不同得颜色与花纹表示统计量得值在地理分布上得变化,适宜描述研究指标得地理分布。

·箱式图:通过使用5个统计量(数据分布得中心位置、分布、偏度、变异范围与异常值)来反映原始数据得分布特征。特别适合多组数据分布得比较。

3、普通线图与半对数线图得主要区别就是什么?

从形式上瞧,二者得不同点在于纵坐标得尺度不同,普通线图得纵坐标为算术尺度,而半对数线图得纵坐标为对数尺度。从用途上瞧,普通线图描述得就是统计量得绝对变化趋势,半对数线图描述得就是相对变化趋势,特别适宜作不同指标或相同指标不同组别得变化速度得比较。

实习九调查设计与实验设计

1、四种基本抽样方法得概念、优缺点与应用条件就是什么?

(1) 单纯随机抽样:就是在总体中以完全随机得方法抽取一部分观察单位组成样本,其整个抽样过程,都体现了随机化得原则。

单纯随机抽样得优点:简单直观,就是最基本得概率抽样方法,也就是其她概率抽样方法得基础。

单纯随机抽样得缺点:当总体例数较多时,编号麻烦,实际工作中难以实施;样本分散,组织困难。

单纯随机抽样方法多用于总体例数较少得情况。

(2) 系统抽样:就是将总体得观察单位,按一定顺序号平均分成n个部分,每一部分抽取第k号观察单位组成样本,这里得k就是随机确定得,其体现了系统抽样中得随机性。

系统抽样得优点就是:1) 易于理解,简便易行;2) 容易得到一个按比例分配得样本;3) 一般情况下样本得观察单位在总体中分布均匀,其抽样误差小于单纯随机抽样。

系统抽样得缺点就是如果总体中观察单位按顺序有周期趋势或单调递增(减)趋势时,采用系统抽样可能产生明显得系统误差。

系统抽样方法多用于观察单位具有现成且与试验无关得自然编号,同时观察单位在总体中分布均匀。

(3) 整群抽样:就是先将总体按照某种与主要研究指标无关得特征划分为K个“群”,每个群包含若干观察单位,然后再随机抽取k个“群”,由抽取得各个群得全部观察单位组成样本。其随机性主要体现在“群”得抽取过程。

整群抽样得优点就是便于组织调查、易于质量控制与节省调查成本。

整群抽样得缺点就是当样本含量一定时,因为样本观察单位并非广泛散布于总体中,整群抽样得抽样误差一般大于单纯随机抽样。

整群抽样较为常用,尤其当“群”间得个体变异较小时。

(4) 分层抽样:就是先按对主要研究指标影响较大得某种特征,将总体分为若干类别(统计上称之为“层”),再从每一层内随机抽取一定数量得观察单位,

合起来组成样本。其随机性体现在层内得抽样过程。

分层抽样得优点就是:1) 由于分层后增加了层内得同质性,观察指标变异减小,各层得抽样误差减小。2) 分层抽样便于对不同层采用不同得抽样方法。

3) 分层抽样便于对各层独立进行分析。

分层抽样得缺点就是:层间变异较大,抽样误差较小;如果分层特征选择不当,层内变异较大,层间变异较小,抽样误差仍然较大,分层抽样就失去了意义。一般情况下,当样本含量一定,几种方法抽样误差大小得排序为:分层抽样≤系统抽样≤单纯随机抽样≤整群抽样。

2、何谓调查研究与实验研究?各自得特点就是什么?

调查研究:就是指研究者通过客观地观察、描述调查对象来搜集资料,未加任何得干预措施。

实验研究:就是指研究者根据研究假设主动地对研究对象加以干预措施,并观察总结其结果,回答研究假设所提出得问题。

3、何谓实验效应,对实验效应指标得要求就是什么?

实验效应:指处理作用于实验对象得反应,一般就是通过某些观察指标,定量或定性地反映实验效应。

选择观察指标得基本原则:

指标得选择必须与研究目得密切关联

客观性尽可能选择客观指标,避免一些笼统得、不确切得指标。

准确性选用得指标应尽量精确。

灵敏性与特异性实验效应指标应当同时兼顾其灵敏性与特异性,尽量使灵敏性与特异性都高。

4、实验研究中为什么要设立对照,常见得对照有几种,各自有何特点?

设立对照组得目得就是衬托处理因素得效应。

对照原则:所设立得对照组必须与实验组达到均衡可比。除干预措施外,组间其她影响结果得非处理因素等尽可能相同。对所研究疾病得易感度及发病机会相等。检测与观察方法及诊断标准必须一致。

自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。

空白对照对照组不施加任何处理因素。

安慰剂对照主要目得就是为了平衡对照组病人心理因素得影响。

实验对照(阳性对照) 对照组不施加处理因素,但施加某种实验因素。

标准对照不设立专门得对照组,而就是用现有标准值或正常值做对照。

历史对照

5、实验设计为什么要遵循重复原则,影响重复性得因素有哪些?

重复原则包含重现性与观察单位数量两方面得含义。

可靠得实验结果应能在相同得条件下重现;

可靠得实验结论也不能凭一次实验或3~5例结果获得,一定要有足够量得观察单位数。

7

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学原理简答题汇总

统计学原理简答题汇总 一说到统计学原理简答题,大家都会连声抱怨:好多内容要背啊,好难背啊,不过一切抱怨过后还是要继续努力。我个人觉得,统计学原理简答题还是以理解为主,只要大概意思有了,那就已经是很不错的了。 1.品质标志与数量标志有什么区别? 答:统计标志通常分为品质标志和数量标志两种。品质标志表明总体单位属性方面的特征,其标志表现只能用文字表示,如学生的性别、职工的文化程度等,品质标志不能直接汇总为统计指标,只有对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量;数量标志则表明总体单位的数量特征,其标志表现用数值来表示,即标志值,如学生的成绩、职工的工资等,它们从不同方面体现出总体单位在具体时间、地点条件下运作的结果。数量标志值可直接汇总综合出数量指标。 2.举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 3.一个完整统计调查方案应包括哪些主要内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 4.举例说明如何理解调查单位与填报单位的关系? 答:调查单位是调查项目的承担者,是调查对象所包含的具体单位;填报单位是负责向上提交调查资料的单位。两者在一般情况下是不一致的。例如:对工业企业生产设备进行普查时,调查单位是每一台工业生产设备,而填报单位是每一个工业企业。但调查单位和填报单位有时又是一致的。例如:对工业企业进行普查时,调查单位是每一个工业企业,而填报单位也是每一个工业企业,两者一致。 5.调查对象、调查单位和填报单位有何区别? 答:调查对象是应搜集其资料的许多单位的总体;调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,一般是基层企事业组织。 6.简述什么是普查及普查的特点。 答:普查是专门组织的、一般用来调查属于一定时点上社会经济现象数量的全面调查。例如:人口普查、经济普查、基本生产单位普查等。 普查的特点:(1)普查是一种这连续调查。(2)普查是一种全面调查。(3)普查能解决全面统计报表不能解决的问题。(4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 7.简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 8.某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查和典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查是依据对总体的分析,有意识地选取调查单位。因此,

统计学简答题

1、描述统计与推断统计有何区别和联 系? 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。 联系:描述统计学和推断统计学是现代统计学的两个组成部分呢,相辅相成、缺一不可,描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 2、统计数据的类型有哪些?(P5-6) 按照计量尺度不同,可分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法可以分为观测数据和实验数据;按照被描述的现象与时间的关系可分为截面数据和时间序列数据。 3、简述数据误差来源?(P33-38) 统计数据的误差来源分为抽样误差和非抽样误差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。非抽样误差是相对抽样误差而言的,是指除抽样误差之外的由于其他原因引起的样本观察结果与总体真值之间的差异。 4、衡量数据离散程度的指标有哪些 (P96-104) 衡量数据离散程度的指标有:1.异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;2.四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;3.方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 5、为什么说正态分布是客观现象中最主 要的分布?(P142) 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 6、有人说,标准化与中心化的两个变量的 协方差就是它们的相关系数,你认为正 确吗?请说明理由? 7、请你说明小概率原理的含义?(P213, 最后一段) 一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 8、评价估计量的标准有哪些?并解释它 们的含义(P179-180) 一般地说,一个好的估计量应具备三个标准:无偏性、有效性和一致性。 无偏性是指估计量分布的数学期望等于被估计的总体参数。有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。一致性是指随着样本量的增大,点估计量的值越来越接近于被估总体的参数。 9、假设检验的理论基础和推理方法是什 么?(P210-213) 进行假设检验的基本原理就是小概率原理。小概率原理是说概率很小的事件(称为“小概率事件”)在一次试验中几乎是不可能发生的。 根据小概率原理进行假设检验的方法就是概率意义下的反证法,其思想是:为了检验原假设 H是否正确,我们首先假定“0H 正确”,然后来看在 H是正确的假定下能导出什么结果。如果导出一个与小概率原理相矛盾的结果,则说明“ H正确”的假定是错误的,即原假设 H不正确,于是我们应作出否定原假设 H的决策;如果没有导出与小概率原理相矛盾的结果,则说明“ H正确”的假定没有错误,即不能认为原假设 H是不正确的,于是我们应作出不否定原假设 H的决策。 10.假设检验的一般步骤?(P212-213) 假设检验的一般步骤:1.根据所研究问

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学简答题整理

统计学简答题 第一章 1.统计的含义和本质是什么? 统计一词包含三个含义:统计数据、统计活动和统计学。 统计的本质就是关于“为统计,统计什么和如统计”的思想,就是围绕研究目的和任务,运用科学的统计法,去获取真实客观的有关统计数据,做出必要的统计分析,以了解和认识事物的真相。 2.什么是统计学?有哪些性质? 统计学是关于如收集、整理和分析统计数据的学科。 统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科畴而言,具有法型、层次性和通用性的特点;就其研究式而言,具有描述性和推断性的特点。 3.总体、样本、个体三者的关系如?试举例说明。 概念:总体就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称母体。样本就是从总体中抽取一部分个体所组成的集合,也称子样。组成总体的每个个别事物就称为个体,也称总体单位。 总体与个体的关系: 1.总体的容量随着个体数的增减可变大变小。 2.随着研究目的的不同,总体中的个体可以发生变化。 3.随着研究围的变化,总体和个体的角色可以变换。 样本和总体的关系: 1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。 3.总体和样本的角色是可以改变的。 4.如理解标志、指标、变量三者的含义?试举例说明。 标志是用于描述或体现个性特征的名称,如某人是男性,教师。 统计指标简称指标是反映现象总体数量特征的概念以及数值,如09年全国人口13亿。 从狭义上看变量是指可变的数量标志,从广义上看变量不仅指可变数量标志也包括可变的品质标志,因此可变标志就是变量。 5.什么是统计指标体系?有哪些表现形式?试举例说明。 统计指标体系是由一系列统计指标构成,但并不是单个指标的简单组合,而是各个指标之间相互联系,相互制约的。 表现形式:1.数学等式关系 2.相互补充关系 3.相关关系 4.原因、条件、结果关系 第二章 1.概率抽样和非概率抽样有什么本质区别?试举例说明。

统计学简答题(完全)

简答题 1.一个完整的统计调查方案包括哪些主要内容 (1)确定调查目的。 (2)确定调查对象和调查单位。 (3)确定调查项目,拟定调查表。 (4)确定调查时间和时限。 (5)确定调查的组织和实施计划。 2.简述品质标志与数量标志的区别。 品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表示。 品质标志本身不能直接汇总为统计指标,只能对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量。 数量标志表明总体单位数量方面的特征,其标志表现可用数值表示,即标志值。 数量标志值可直接汇总综合出数量指标。 3.时期指标有什么特点 (1)时期指标的数值是连续计数的,表示现象在一段时期内发生的总量; (2)时期指标具有累加性; (3)时期指标数值的大小与时间长短直接相关,时期越长,时期指标数值就越大。 4.影响抽样平均误差的因素有哪些 (1)总体各单位标志的变动程度(总体内部差异程度); (2)抽样单位数的多少; (3)抽样组织方式; (4)取样方法(重复抽样或不重复抽样)。 5.品质标志与质量指标有何区别和联系 区别:品质标志说明总体单位的属性特征,只有名称,没有数值;而质量指标是统计指标中的一种,是说明统计总体特征的综合性数值,由指标名称和指标数值两个部分组成。 联系:品质标志与质量指标之间本身没有直接的关系只是在进行统计分析时,可以利用按某一品质标志分组的资料,计算各组某种质量指标,研究这种质量指标在各组之间的变动规律,这时两者之间便产生了一定的联系。 6、时期指标与时点指标有何区别 (1)时期指标反映现象在一段时期内发展过程的总数量 时点指标表示现象处在某一时刻上的状态 (2)时期指标可以累计相加; 时点指标则不能 (3)时期指标数值的大小与计算时期长短有直接关系; 时点指标数值的大小与时间间隔长短没有直接关系

统计学简答题复习

1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识? 答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。这是由客观事物本身的特点和统计方法的特性共同决定的。任何事物都是质与量的对立统一,一定事物的质总是表现为一定的量的特征;一定的量的特征代表事物的某种性质。从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。任何一个数据,也都是必然性与偶然性共同作用的结果,必然性反映了事物本质的特征和联系,决定了事物的内在本质是有规律可循的,偶然性反映了事物个别表现的差异性。统计就可以从大量事物的表现中探索到内在的、本质的的数量规律性。 2.解释总体与样本、参数和统计量的含义。 答:总体:所研究的全部个体(元素)的集合。 样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。统计量:根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。 3.解释总体分布、样本分布和抽样分布的含义。 (1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n 的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。 4.简述描述统计学和推断统计学的概念及其联系。 答:描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。 联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 5.简述中心极限定理。 答:从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。 6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。 答:在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。 假设检验中犯第一类错误的概率被称为显著性水平。它们的联系是:置信水平越高,置信区间越宽,显著性水平越低。 7. 几何平均数的适用条件分别是什么? 答:几何平均数的使用条件:总指标等于各个变量连乘积的值,一般用来计算社会经济问题的平均发展速度。 8.抽样推断时为什么必须遵循随机原则抽取样本? 答、只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确 9.简述假设检验的一般步骤。 答:⑴陈述原假设和备择假设 ⑵从所研究的总体中抽出一个随机样本 ⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值 ⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 ⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可 以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。 10.相关系数(r)绝对值的大小是如何来反映两个变量之间线性关系显著性的? 答:相关系数r是根据从总体中抽取的随机样本的观测值x和y计算出来的,它是对总体相关系数p 的估计。当r=0,表明没有线性相关关系;当0<▏r▏<1时,存在一定的线性相关关系;若r>0,表明x和y为正相关,若r<0,表明y为负相关;当▏r▏=1时,表明x和y完全线性相关,若r=1,表明x 和y完全正相关;若r=-1,表明x和y完全负相关。 11.简述众数、中位数和均值的特点和应用场合。 答:众数是一种位置代表值,它的应用场合比较有限;中位数具有稳健性,数据值与中位数之差的绝对值之和最小;均值就是算术平均数,是数据集中趋势的最主要测度值。众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。

相关文档