当前位置：文档库 › 样本量计算(DOC)

样本量计算(DOC)

1.估计样本量的决定因素

1.1 资料性质

计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。

1.2 研究事件的发生率

研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。

1.3 研究因素的有效率

有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显著性，反之就要越大。

1.4 显著性水平

即假设检验第一类（α）错误出现的概率。为假阳性错误出现的概率。α越小，所需的样本量越大，反之就要越小。α水平由研究者具情决定，通常α取0.05或0.01。

1.5 检验效能

检验效能又称把握度，为1－β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β水平由研究者具情决定，通常取β为0.2，0.1或0.05。即1－β=0.8，0.1或0.95，也就是说把握度为80%，90%或95%。

1.6 容许的误差（δ）

如果调查均数时，则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信限的一半。

1.7 总体标准差(s)

一般因未知而用样本标准差s代替。

1.8 双侧检验与单侧检验

采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时，其α或β的Ua 界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算

由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。

护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③实验性研究：即队列研究或干预实验。研究的类型不同，则样本量也有所不同。

2.1描述性研究

护理研究中的描述性研究多为横断面研究，横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。

例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查，采用分层多级抽样，选用的是均数抽样的公式，Uα为检验水准α对应的υ值，σ为总体标准差，δ为容许误差，根据预实验得出标准差σ

=1.09，取α=0.05，δ=0.1，样本量算得520例，考虑到 10%-15%的失访率和抽样误差，样本扩展到690例。

2.2分析性研究

2.2.1 探索有关变量的影响因素研究

有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至少是变量数的5-10倍。例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么研究的变量就可以在60-120例。

这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式

计算，计量资料的样本量估算可用公式，根据预实验中的数据（也可以依据其他文献的结果）得出标准差S和容许误差δ，代入公式最终计算出样本量，计数资料资料可用公式，P为样本率。

2.2.2 研究某变量对另一变量的影响

对于研究某变量对另一变量的影响来说，样本量可以根据直线相关的公式

获得，μα与μβ与分别为检验水准α和第Ⅱ类错误的概率β相对应的U值，ρ为总体相关系数。

例.要做一项血透患者自我管理水平对其健康状况影响的研究，假设α=0.05，power=0.80，

查表得μα=1.96，μβ=0.84，总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为0.274，代入公式就可算出所需样本量为103例。

2.2.3 两变量或多变量的相关研究

对于两变量或多变量相关的研究，样本量与自变量的多少有关，一般是其10倍，也可以采用公式计算。Uα为检验水准α相对应的U值，S为标准差，δ为容许误差。

例. 研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.

设定显著性水平α= 0.05，则Uα=1.96，标准差和容许误差可从预实验中获得，根据预实验的S和δ值，算出S/δ=5，样本量则为99例.

2.3 实验性研究

实验性研究样本量的估算公式，也分计量资料和计数资料两种。计量资料可采用两样本均数的计算公式N1=N2=，计数资料可采用率的计算公式。式中N1、N2分别为两样本含量，

一般要求相等，S为两总体标准差的估计值，一般假设其相等或取合并方差的平方根，δ为两均数之差值（若为自身对照，δ也可以写为d），tα／2和t

β／2分别为检验水准α和第Ⅱ类错误概率β相对应的t值。α有单双侧之分，而β只取单侧。

例.一项心肌梗死患者院外自助式心脏康复的效果研究，可以采用此公式计算，其中的d 可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷GHQ的得分：d=10.7-5.3=5.4，计算Sc为8.78，双侧α=0.05，β=0.1，查表得tα／2=1.96，tβ=1.282，代入公式得出两组各需样本为56例。

附临床研究样本量的估计：

1.计量资料

1.1 对总体平均数m做估计调查的样本估计

公式：公式：n=（Uασ/δ）（式2.1.2.1）

式中：n为所需样本大小；Ua为双侧检验中，a时U的界值，当a=0.05时,

U0.05 =1.96,a=0.01时,U0.01 =2.58；s为总体标准差；δ为容许的误差。例1：某学校有学生3500人，用单纯随机抽样调查学生的白细胞水平，根据预查标准差为950个/ mm ，允许误差不超过100个/mm ，应调查多少人?

N=3500 d=100个/mm s=950个/mm

a=0.05（双侧） Ua=1.96

n=(1.96×950/100) ≈347

1.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。

单侧检验用：单侧检验用：n=[（U2α + U2β）s/δ]（式1.2-1）

双侧检验用：n=[（Uα + U2β）s/δ]（式1.2-2）

式中：α与β分别为第一类错误及第二类错误出现的概率，

Uα、U2α、U2β分别为α、2α、2β检验水准的t值。

2 计数资料

2.1 对总体率π做估计调查的样本大小

公式：n=（Uα/δ）/P（1－P）（式2.1）

式中：δ为容许的误差：即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。

例2：对某地HBsAg阳性率进行调查，希望所得的样本率(p)和总体率(P)之差不超过2%，基于小规模预调查样本率P=14%，应调查多少人? (规定a=0.05)

已知：δ=0.02, P=0.14，a=0.05 , Ua=1.96

n=(1.96/0.02)2/ ×0.14(1－0.14) =1156

需调查约1160人.

2.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。

单侧检验用：n=（U2α + U2β/δ2）（式2.2-1）

双侧检验用：n=（Uα + U2β/δ ）（式2.2-2）

式中：α与β分别为第一类错误及第二类错误出现的概率，

Uα、U2α、U2β分别为α、2α、2β检验水准的t值。

2.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。

单侧检验用：n=[（U2α + U2β）s/δ] P（1－P）式2.3-1）

双侧检验用：n=[（Uα + U2β）s/δ] P（1－P）（2.3-2）

式中：α与β分别为第一类错误及第二类错误出现的概率，

Uα、U2α、U2β分别为α、2α、2β检验水准的U值。

3 病例对照研究的样本量估计

选择患有特定疾病的人群作为病例组，和未患这种疾病的人群作为对照组，调查两组人群过去暴露于某种（些）可能危险因素的比例，判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。

3.1设置估算样本量的相关值

①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率)；

②比值比 (odds ratio，OR) 估计出的各研究因素的相对危险度或暴露的比值比（即RR或OR）

③α值，检验的显著性水平，通常取α=0.01或0.05；

④期望的把握度（1-β）,通常区β=0.10或0.20；即把握度为90%或80%。

根据以上有关参数查表或代公式计算

公式为：

n=（U +U ）/(p1 -p0 )2（式3.1）

p1 =p0 ×OR/1-p0 +OR×P0

=1/2（p1 +p0）=1-q1 =1-p1 q0 =1-p0

p0与P1分别为对照组及病例组人群估计的暴露率；

OR为主要暴露因子的相对危险度或暴露的比值比（RR或OR）。

q0 =1-P0 , q1 =1-P1 ;

为两组暴露史比例的平均值,

既 =(P1 +P2 )/2, Q1 =1-P1 ;

例：拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。估计孕妇有30%暴露于此因子。现要求在暴露造成相对危险度为2时，即能在95%的显著性水平以90%的把握度查出，病例组和对照组各需多少例？

p0=0.3 OR=2，设α=0.05, β=0.10,

用双侧检验Uα=1.96 Uβ=1.282

p1 =(0.3×2)/[1+0.3(2-1)]=0.46

q0 =1-0.3=0.7 =1/2(0.3+0.46)=0.38

q1 =1-0.46=0.54 =1-0.38=0.62

n=(1.96 +1.282 )2/(0.46-0.3)2 ≈192 ，即病例组与对照组各需192人.

4实验研究的样本量计算

4.1 计量资料: 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。

估计公式为：

（式4.1）

n为计算所得一个组的样本人数，如果两组的人数相等，则全部试验所需的样本大小为2n；

Uα为显著性水平相应的标准正态差；

Uβ为β相应的标准正态差；

δ为估计的标准差，δ2 =（δ1 2 +δ2 2 ）/2；

d为两组数值变量均值之差，

例题：某新药治疗高血压，将研究对象随机分为治疗组和对照组。假设：a=0.05,

β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。查表：zα=1.96,

zβ=1.282(双侧检验),需要多大样本。

4.2 计数资料:即非连续变量资料，如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时，按下式计算样本大小：

n=[U +U ] /(P -P ) （式4.2）

P ：对照组发生率

P ：实验组发生率

5 诊断试验的样本量估计

5.1 设置估算样本量的相关值

①灵敏度60%；

②特异度60%；

③α值，检验的显著性水平，通常取α=0.01或0.05；

④期望的把握度（1-β）,通常区β=0.10或0.20；即把握度为90%或80%。

5.2 计算公式

公式：n=（Uα/δ）/P（1－P）（式5.2）

式中：

Uα为显著性水平相应的U值,通常取α=0.01或0.05；

δ为容许的误差：即允许样本率(p)和总体率(P)的最大容许误差为多少。

P为诊断试验的灵敏度或特异度；

例：预计所评价的诊断试验的灵敏度为90%,特异度85%；

δ=0.025，规定a=0.05,病例组和对照组应调查多少人?

已知：δ=0.02, a=0.05 , Ua=1.96

n=(1.96/0.025)2/ ×0.85(1－0.85) =783

n=(1.96/0.025)2/ ×0.90(1－0.90) =553

对照组需783人, 病例组需553人。

参考文献

[1] 胡修周.医学科学研究学[M].北京:高等教育出版社.2006,76.

[2] 刘娜，倪平，陈京立. 护理研究中量性研究的样本量估计[J]. 中华护理杂志， 2010， 45(4): 378-379.

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下：要求：（1）计算平均工资；（79元）（2）用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%，超额完成计划2%，试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定，第一季度的单位产品成本比去年同期降低8%。实际执行结果，单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何？104.35%（ (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明：超额完成4.35%（ 104.35%-100%）） 4. 某公社农户年收入额的分组资料如下：

要求：试确定其中位数及众数。中位数为774.3（元）众数为755.9（元）求中位数：先求比例：（1500-720）/（1770-720）=0.74286 分割中位数组的组距：（800-700）*0.74286=74.286 加下限700+74.286=774.286 求众数： D1=1050-480=570 D2=1050-600=450 求比例：d1/(d1+d2)=570/（570+450）=0.55882 分割众数组的组距：0.55882*（800-700）=55.882 加下限：700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下： 64.43（件/人）（55*300+65*200+75*140+85*60）/（300+200+140+60） 6.某地区家庭按人均月收入水平分组资料如下：

根据表中资料计算中位数和众数。中位数为733.33（元）众数为711.11（元）求中位数：先求比例：（50-20）/（65-20）=0.6667 分割中位数组的组距：（800-600）*0.6667=66.67 加下限：600+66.67=666.67 7.某企业产值计划完成103%，比去年增长5%。试问计划规定比去年增长多少？1.94% （上年实际完成1.03/1.05=0.981 本年实际计划比上年增长（1-0.981）/0.981=0.019/0.981=1.937%） 8.甲、乙两单位工人的生产资料如下：试分析：（1）哪个单位工人的生产水平高？（2）哪个单位工人的生产水平整齐？ % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人）（件人）（件9.在计算平均数里，从每个标志变量中减去75个单位，然后将每个差数缩小10倍，利用这个变形后的标志变量计算加权算术平均数，其中各个变量的权数扩大7倍，结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数，并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表：（单位：亿元）

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时，其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③实验性研究：即队列研究或干预实验。研究的类型不同，则样本量也有所不同。 2.1描述性研究例. =0.1， 2.2 2.2.1探索有关变量的影响因素研究有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至少是变量数的5-10倍。例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式计算，计量

统计学计算题例题及计算分析

计算分析题解答参考 1.1．某厂三个车间一季度生产情况如下：计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。解：平均计划完成百分比＝实际产量/计划产量＝733/（198/0.9+315/1.05+220/1.1）＝101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2．某企业产品的有关资料如下：试分别计算该企业产品98年、99年的平均单位产品成本。解：该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下： 1.3．1999 解：三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1．某车间有甲、乙两个生产小组，甲组平均每个工人的日产量为22件，标准差为 3.5件；乙组工人日产量资料：

试比较甲、乙两生产小组中的哪个组的日产量更有代表性？解：∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲＜V 乙,故甲生产小组的日产量更有代表性。 2.2．有甲、乙两个品种的粮食作物，经播种实验后得知甲品种的平均产量为998斤，标准差为162.7斤；乙品种实验的资料如下：试研究两个品种的平均亩产量，确定哪一个品种具有较大稳定性，更有推广价值？解：∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

教育统计学试题库

教育统计学一、选择题 1、当一组数据用中位数来反映集中趋势时，这组数据最好用哪种统计量来表示离散程度？( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布，从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于：( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用：( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时，在下面哪种情况下不需要进行方差齐性检验？( B ) A. 两个独立样本的容量相等且小于30； B. 两个独立样本的容量相等且大于30； C. 两个独立样本的容量不等，n1小于30, n2大于30; D. 两个独立样本的容量不等，n1大于30, n2小于30。 5、下列说法中哪一个是正确的？( C ) A. 若r1=0.40 , r2=0.20，那么r1 就是r2 的2 倍；

B. 如果r=0.80 ，那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2； D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时，应计算哪一种相关？（ B ） A. 积差相关（两个连续型变量） B. ?相关 C. 点二列相关（一个是连续型变量，另一个是真正的二分名义变量） D. 二列相关（两个连续型变量，其中之一被人为地划分成二分变量。） 7、对多组平均数的差异进行显著性检验时需计算：（ A ） A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度，可以采用何种差异量？（ A ） A. 差异系数 B. 方差 C. 全距 D. 标准差二、名词解释 1. 分层抽样：按与研究内容有关的因素或指标先将总体划分成几个部分，然后从各部分（即各层）中进行单纯随机抽样或机械抽样，这种抽样方法称为分层抽样。 2. 描述统计：对已获得的数据进行整理、概括，显现其分布特征的统计方法称为描述统计。 3. 集中量：集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下：单位：（件）试计算7、8月份平均每人日产量，并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为：37360 13320 == = ∑∑f Xf X （件） 8月份平均每人日产量为：44360 15840 == = ∑∑ f Xf X （件）根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%，而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布，经测定两年中各级产品的产量资料如下：解： 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24（级） 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12（级）可见该厂棉布产品质量2010年比2009年有所提高，其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%，同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高，为什么？解：甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16（元）乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09（元）可见甲企业的单位产品成本较高，其原因是甲企业生产的3批产品中，单位成本较高（1.2元）的产品数量占70%，而乙企业只占30%。

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。 1.3 研究因素的有效率有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显著性，反之就要越大。 1.4 显著性水平即假设检验第一类（α）错误出现的概率。为假阳性错误出现的概率。α越小，所需的样本量越大，反之就要越小。α水平由研究者具情决定，通常α取0.05或0.01。 1.5 检验效能检验效能又称把握度，为1－β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β水平由研究者具情决定，通常取β为0.2，0.1或0.05。即1－β=0.8，0.1或0.95，也就是说把握度为80%，90%或95%。 1.6 容许的误差（δ）如果调查均数时，则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

应用统计学练习题(含答案)

应用统计学练习题第一章绪论一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体；总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征，即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况，总体是_企业全部产品__，个体是__每一件产品__。 5.样本是从__总体__中抽出来的，作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称，按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于：（1）指标是说明__总体__特征的，而标志则是说明__总体单位__特征的。（2）标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_，而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。二、单项选择题 1.统计总体的同质性是指（A）。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业，要研究这些企业的产品生产情况，总体是（ D）。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料，如果要调查这200家公司的工资水平情况，则统计总体为（A）。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体（ D）。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量，则该产品等级是（C）。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元，工资是（ B ）。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分，这4个数字是（ D）。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是（D）。 A.连续变量 B.离散变量 C.前者是连续变量，后者是离散变量 D.前者是离散变量，后者是连续变量 9.统计工作的成果是（C）。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展，沿着两个不同的方向，形成（C）。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

抽样调查样本量确定

抽样调查样本量的确定在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而，由于当前市场经济情况的多样性，经济发展的不均衡性，以及地域宽广性，导致情况多种多样；实际情况的复杂，决定了方案的复杂性，增加了具体抽样的难度。经过多年的探讨，区域二相抽样调查比较符合当前我国的实际情况，我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。一、样本单位数量的确定原则一般情况下，确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验，市场潜力和推断等涉及量比较严格的调查需要的样本量比较大，而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查，样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题，即要有定性的考虑，也要有定量的考虑；从定性的方面考虑，决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来，样本量的大小主要取决于： (1)研究对象的变化程度，即变异程度； (2)要求和允许的误差大小，即精度要求； (3)要求推断的置信度，一般情况下，置信度取为95%； (4)总体的大小； (5)抽样的方法。也就是说,研究的问题越复杂,差异越大时,样本量要求越大；要求的精度越高,可推断性要求越高时,样本量也越大；同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系；而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1；分层抽样由于抽样效率高于简单随机抽样，其设计效应的值小于1,合适恰当的分层，将使层内样本差异变小，层内差异越小，设计效应小于1的幅度越大；多阶抽样由于效率低于简单随机抽样，设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

统计学试题库7

单选题 1. 相关关系与函数关系之间的联系体现在（） A. 相关关系普遍存在，函数关系是相关关系的特例 B. 函数关系普遍存在，相关关系是函数关系的特例 C. 相关关系与函数关系是两种完全独立的现象 D. 相关关系与函数关系没有区别 2. 当一个现象的数量由小变大，而另一个现象的数量相反地由大变小时，这种相关关系称为（）。！ A. 线性相关 B. 非线性相关 C. 正相关 D. 负相关 3. 配合回归直线方程对资料的要求是()。 A. 因变量是给定的数值,自变量是随机的 { B. 自变量是给定的数值,因变量是随机的 C. 自变量和因变量都是随机的 D. 自变量和因变量都不是随机的

! 4. 在回归直线方程中,b表示() A. 当x增加一个单位时,y增加a的数量 B. 当y增加一个单位时,x增加b的数量 / C. 当x增加一个单位时,y的平均增加量 D. 当y增加一个单位时,x的平均增加量 5. 若估计标准误Syx等于因变量的标准差σy，则说明回归方程（）。） A. 很有意义 B. 毫无价值 C. 计算有误 ` D. 问题不成立多选题 1. 相关关系与函数关系各有不同的特点，主要体现在（）。 A. 函数关系是一种不严格的相互依存关系 · B. 函数关系可以用一个数学表达式精确表达

C. 函数关系中各变量均为确定性的 D. 现象相关为关系时，是有随机因素影响的依存关系 , E. 相关关系中现象之间仍然可以通过大量观察法来寻求其变化规律 2. 估计标准误差是反映（） A. 回归方程代表性的指标 · B. 自变量离散程度的指标 C. 因变量数列离散程度的指标 D. 因变量估计值可靠程度的指标） E. 自变量可靠程度的大小 3. 对于回归系b，下列说法正确的有（）。 A. b是回归直线的斜率。 B. b的绝对值介于0－1之间 C. b越接近于零表明自变量对因变量影响越小 D. b与相关系数具有b=r·σy/σx，的关系￥ E. b满足Σy=na+bΣx

样本量计算

样本量计算调查研究中样本量的确定在社会科学研究中，研究者常常会遇到这样得问题：“要掌握总体(population)情况，到底需要多少样本量(sample)？”，或者说“我要求调查精度达到95%，需要多少样本量？”。对此，我往往感到难以回答，因为要解决这个问题，需要考虑的因素是多方面的：研究的对象，研究的主要目的，抽样方法，调查经费…。本文将根据自己的经验，探讨在调查研究中确定调查所需样本量的一些基本方法，相信这些方法对于其他的社会调查研究也有一定的借鉴意义。确定样本量的基本公式在简单随机抽样的条件下，我们在统计教材中可以很容易找到确定调查样本量的公式： Z2 S2 n = ------------ (1) d2 其中： n代表所需要样本量 Z：置信水平的Z统计量，如95%置信水平的Z统计量为1.96，99%的Z为2.68。 S：总体的标准差; d ：置信区间的1/2，在实际应用中就是容许误差，或者调查误差。对于比例型变量，确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中： n ：所需样本量 z：置信水平的z统计量，如95%置信水平的Z统计量为1.96,99%的为2.68

p：目标总体的比例期望值 d：置信区间的半宽关于调查精度通常我们所说的调查精度可能有两种表述方法：绝对误差数与相对误差数。如对某市的居民进行收入调查，要求调查的人均收入误差上下不超过50元，这是绝对数表示法，这个绝对误差也就是公式(1)中置信区间半宽d。而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元，则相对误差的绝对数是100元。公式的应用方法对于公式的应用，一些参数是我们可以事先确定的：Z值取决于置信水平，通常我们可以考虑95%的置信水平，那么Z=1.96；或者99%，Z=2.68。然后可以确定容许误差d（或者说精度），即我们可以根据实际情况指定置信区间的半宽度d。因此，公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差（标准差），那么我们可以根据公式计算出样本量：例如：要了解该城市的居民收入，假定我们知道该市居民收入的标准差为1500，要求的调查误差不超过100元，则在95%的置信水平下，所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。最大样本量以上公式只是理论上的，在实际调查中确定合理的样本量，必须考虑多方面的因素。首先，由于人们通常缺乏对标准差的感性认识，因此对标准差的估计往往是最难的。总体的标准差是123，还是765？如果没有一点对样本的先验知识，那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计，如我们通过历史资料估计该地区目前的年人均收入大致为10,000元，那么根据统计学知识，我们引入变异系数的概念：变异系数V=标准差S/平均值X<= 1 因此，我们知道人均收入的标准差应该小于平均值，就是说标准差应该在10000以下。当然，这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度，对公

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下：要求：（1）计算平均工资；（79元）（2）用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%，超额完成计划2%，试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定，第一季度的单位产品成本比去年同期降低8%。实际执行结果，单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何？104.35%（ (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明：超额完成4.35%（104.35%-100%）） 4. 某公社农户年收入额的分组资料如下：

（55*300+65*200+75*140+85*60）/（300+200+140+60） 6.某地区家庭按人均月收入水平分组资料如下：根据表中资料计算中位数和众数。中位数为733.33（元）众数为711.11（元）求中位数：先求比例：（50-20）/（65-20）=0.6667 分割中位数组的组距：（800-600）*0.6667=66.67 加下限：600+66.67=666.67 7.某企业产值计划完成 103%，比去年增长5%。试问计划规定比去年增长多少？1.94% （上年实际完成1.03/1.05=0.981 本年实际计划比上年增长（1-0.981）/0.981=0.019/0.981=1.937%） 8.甲、乙两单位工人的生产资料如下：

样本量计算方法

样本量及其计算依据：根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840]，功能性消化不良患者接受伊托必利50mg组治疗后，其NDI改善值的均数为18.0，本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0，本研究共设了6个组别，检验水准α=0.05，检验效能1-β=0.90，采用多个样本均数比较的样本含量估计公式（王家良主编《临床流行学》.上海.上海科学技术出版社，2001.P142）进行样本量的估算，公式如下： k ψ2（Εs j2/k） n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算，每组所需样本数n=77例，按15%的脱失率计算，每个组应不少于89例，6组应不少于534例。样本量及其计算依据：若分为三组或三组以上，采用多个样本均数比较的样本含量估计公式（王家良主编《临床流行学》.上海.上海科学技术出版社，2001.P142）进行样本量的估算，公式如下： k ψ2（Εs j2/k） n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数，?X j, s i各为每组的均数与标准差的估计值，x=Ε?X j/k,ψ为界值，可通过查阅ψ值表得到。

统计学计算习题

第四章六、计算题月工资（元）甲单位人数（人）乙单位人数比重（％） 400以下 400～600 600～800 800～1000 1000以上 4 25 84 126 28 2 8 30 42 18 合计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲甲甲 () 2 x x f f σ-∑∑乙乙乙乙 V x σσ= 甲甲甲 V x σσ= 乙乙乙根据V σ甲、V σ乙大小判断，数值越大，代表性越小。甲品种乙品种田块面积（亩）产量（公斤）田块面积（亩）产量（公斤） 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同，试研究这两个品种的收获率，确定那一个品种具有稳定性和推广价值。 2、(1) 收获率（平均亩产） 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值（求变异指标） 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙求V σ甲、V σ乙，据此判断。 8.某地20个商店，1994年第四季度的统计资料如下表4-6。表4－6 按商品销售计划完成情况分组(％) 商店数目实际商品销售额（万元）流通费用率（%） 80－90 90－100 100－110 110－120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算（1）该地20个商店平均完成销售计划指标（2）该地20个商店总的流通费用率 (提示：流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额实际销售额计划完成 (2) 据提示计算：2012.7%x = 品种价格（元/公斤）销售额（万元）甲市场乙市场甲乙丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示：= 销售额平均价格销售量企业序号计划产量（件）计划完成程度（％）实际一级品率（％） 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

统计学试题库(选择题和判断题)

编辑版word 统计学题库一、判断题 1、统计学是研究总体数量方面的规律的，所以就不需要做定性研究。（） 2、重点调查的误差是可以事先计算和控制的。（） 3、计算比较相对指标时，通常采用总量指标。（） 4、众数和中位数均易受极端值影响，不具有稳健性。（） 5、定基增长速度等于环比增长速度的连加。（） 6、平均增长速度等于各环比增长速度的几何平均数。（） 7、因为综合指数是总指数的基本形式，所以实际计算总指数时通常运用综合指数。 8、样本指标的方差称为抽样平均误差。（） 9、若其他条件固定，则总体变量的变动程度与抽样极限误差呈正比。（） 10、相关系数与回归系数同号。（） 1、总体和总体单位的区分具有相对性，随着研究任务的改变而改变。（） 2、统计分组是统计整理的基本方法，因此它并不能分析现象之间的依存关系。（） 3、频率是加权算术平均数实质意义上的权数。（） 4、若甲、乙两总体某变量的标准差乙甲、σσ存在乙甲σσ>，则乙总体变量的差异性较小。 5、定基增长速度等于环比增长速度的连乘积。（） 6、若现象的发展，其逐期增长量大体相等，则应配合直线趋势方程。（） 7、若p 表示产品价格，q 表示产品产量，则1011q p q p ∑∑-表示因价格变动造成的产值变动额。 8、抽样平均误差不受总体变量变动程度的影响。（） 9、在重复抽样情况下，其他条件不变，则样本单位数增加一倍将使抽样平均误差减少一半。 10、若0=r ，则X 与Y 不相关。（） 1、数量标志是用数值表示的，而质量指标是用属性（文字）表示的。（） 2、离散型变量既可以进行单项式分组，也可以进行组距式分组。（） 3、以组中值代替组平均数不需要前提假设。（） 4、算术平均数与几何平均数比较大小没有实际意义。（） 5、若某国GDP2003年比2001年增长15％，2006年比2003年增长20％，则该国GDP2006年比2001年增长35％。 6、若现象的发展，其二级增长量大体相等，则应配合指数曲线趋势方程。（） 7、若p 表示产品价格，q 表示产品产量，则0001p q p q ∑∑-表示因产量变动造成的产值变动额。 8、样本单位数n 越大，样本平均数的波动越小。（） 9、在重复抽样情况下，其他条件不变，若要使抽样极限误差减少一半，则必须使抽样单位数增加两倍。 10、若X 与Y 高度曲线相关，则r 必接近于1。（） 1、标志和指标存在着一定的变换关系。（） 2、连续型变量既可以进行单项式分组，也可以进行组距式分组。（） 3、加权算术平均数的所有变量值均减少一半，而所有权数均增加一倍，则平均数不变。 4、设甲、乙两总体某变量的平均数和标准差分别为乙甲、X X 和乙甲、σσ，若存在乙甲X X <及乙甲σσ>，则乙

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试，甲班平均成绩为81分，标准差为9.5分，乙班的成绩分组资料如下：按成绩分组学生人数（人） 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩，并比较甲乙两班，哪个班的平均成绩更有代表性？ 2、某车间有甲乙两个生产组，甲组平均每个人的日产量为36件，标准差为9.6件，乙组工人产量资料如下：日产量（件）工人数（人） 15 15 25 38 35 34 45 13 要求：（1）计算乙组平均每个工人的日产量和标准差（2）比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元，试计算上半年，下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长（%） 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 （2）计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下：（万元）商品单位销售额1996比1995年销售价格提高（%） 1995 1996 甲米120 130 10 乙件40 36 12 要求：（1）计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值（2）计算销售量总指数，计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下：要求：（1）计算相关系数，说明两个变量相关的密切程度（2）配合回归方程，指出产量每增加1000件时，单位成本平均变动多少？月份产量（千克）单位成本（元） 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显著来。但是中国的国情？有多少厂家愿意多做？建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为65.0%和42.9%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。非劣性试验（α=0.05，β=0.2）时：

计数资料：平均有效率（P）等效标准（δ） N= 公式：N=12.365×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=12.365× (S/δ)2 等效性试验（α=0.05，β=0.2）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=17.127×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=17.127× (S/δ)2 上述公式的说明： 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数； 3) P 是平均有效率，

统计学计算题整理

：典型计算题一 1、某地区销售某种商品的价格和销售量资料如下：根据资料计算三种规格商品的平均销售价格。解： 36== ∑∑ f f x x (元) 点评: 第一，此题给出销售单价和销售量资料，即给出了计算平均指标的分母资料，所以需采用算术平均数计算平均价格。第二，所给资料是组距数列，因此需计算出组中值。采用加权算术平均数计算平均价格。第三，此题所给的是比重权数，因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%，1992年实际产值是1991的的116%，问1992年产值计划完成程度是多少？解： %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%，超额完成计划10%。点评：此题中的计划任务和实际完成都是“含基数”百分数，所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%，实际单位成本是1991年的90%，问1992年单位成本计划完成程度是多少？解：计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。点评：本题是“含基数”的相对数，直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%，实际增长16%，问1992年产值计划完成程度是多少？解：计划完成程度%110% 51% 161=++= 点评：这是“不含基数”的相对数计算计划完成程度，应先将“不含基数”的相对数还原成“含基数”的相对数，才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%，实际降低10%，问1992年单位成

统计学试题库及试题库答案解析

统计学题库及题库答案题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差二、多项选择题(每题2分,共10分)

样本量计算(DOC)

1. 估计样本量的决定因素 1.1 资料性质计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些 ,需要30-100 例。 1.2 研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。 1.3 研究因素的有效率有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显著性，反之就要越大。 1.4 显著性水平即假设检验第一类（a）错误出现的概率。为假阳性错误出现的概率。a越小，所需的样本量越大，反之就要越小。a水平由研究者具情决定，通常a取0.05 或 0.01 。 1.5 检验效能检验效能又称把握度，为1-B，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的a水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，B越小，检验效能越高，所需的样本量越大，反之就要越小。B水平由研究者具情决定，通常取 B为0.2，0.1或0.05。即1—B =0.8，0.1或0.95，也就是说把握度为80% 90%或95%。 1.6容许的误差（S）如果调查均数时，则先确定样本的均数（）和总体均数（m）之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1— a ）可信限的一半。 1.7 总体标准差（s）一般因未知而用样本标准差 s 代替。 1.8 双侧检验与单侧检验采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义