文档库 最新最全的文档下载
当前位置:文档库 › 非统计抽样

非统计抽样

非统计抽样
非统计抽样

一、抽样检验的基本概念

抽样检验VS全数检验

检验是用计量、测定、试验等方法对检验对象进行测试,将其结果与质量标准进行比较,做出合格与否的判定,对能否适合下道工序使用或能否提供给用户做出处理的决策过程。

检验的类型有全数检验和抽样检验:

1.全数检验

所谓全数检验就是对全部产品逐个地进行测定,从而判定每个产品合格与否的检验。它又称全面检验、100%检验。其处理对象是每个产品。全数检验的适用场合:(1)生产过程不能保证达到预先规定的质量水平,不合格品率大时。

(2)不合格的产品会造成严重的不良后果,如果漏检有可能造成人身事故或对下道工序或消费者带来重大损失,必须进行全数检验。如彩电、冰箱等家电的耐压特性。

(3)条件允许,能容易地进行质量检验,且费用低廉。

(4)批量比较少,且批的大小和样本大小接近,没有必要进行抽样检验

(5)同检验费用相比,产品价值特别昂贵,应进行全数检验

但是全数检验有很多缺点:

(1)有些产品的检验具有破坏性;

(2)有些产品的产量很大,对其进行全数检验需花费大量的人力、物力、财力,不经济;

(3)在数量多、速度快、时间长等情况下,全数检验容易产生错检和漏检;

(4)全数检验是一种消极的检验方法,不能引起生产者对产品质量的关心。

2.抽样检验

抽样检验是从一批产品中随机抽取一部分产品,通过检验少量产品来对这批产品的质量进行评估,进而判断这批产品是否接收的活动。它不是逐个检验这批产品中的所有产品,而是按照规定的抽样方案和程序从一批产品中随机抽取部分单位产品组成样本,根据样本测定结果来判断该批产品是否接收。

抽样检验的适用场合:

(1)破坏性检验;

(2)产量大而不能进行全数检查的时候;

(3)检验对象是连续体的检验,如对布匹、油的检验等;

(4)检验项目过多、周期长,进行全数检验有困难;

(5)希望节省检验费用的场合。

二、抽样的概念

(一)抽样的概念

又称取样。从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。

抽样:检验检疫机构接受报验后,须及时派员赴货物堆存地点进行现场检验、鉴定。其内容包括货物的数量、重量、包装、外观等项目。现场检验一般采取国际贸易中普遍使用的抽样法(个别特殊商品除外)。抽样时,要按照规定的方法和一定的比例,在货物的不同部位抽取一定数量的、能代表全批货物质量的样品(标本)供检验之用。还可以抽血样。

基本概念:所考察对象的某一数值指标的全体构成的集合看作总体,构成总体的每一个元素作为个体,从总体中抽取一部分的个体所组成的集合叫做样本,样本中的个体数目叫做样本数量。

(二)抽样类型

1.简单随机抽样

一般的,设一个总体个数为N,如果通过逐个抽取的方法抽取一个样本,且每次抽取时,每个个体被抽到的概率相等,这样的抽样方法为简单随机抽样。

适用于总体个数较少的。

1)特点:

每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。

(2)简单随机样本数n小于等于样本总体的个数N。

(3)简单随机样本是从总体中逐个抽取的。

(4)简单随机抽样是一种不放回的抽样。

(5)系统抽样抽样的每个个体入样的可能性均为n/N。

2)缺点:

只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能有效的利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明、难以分类,或总体单位之间特性差异程度小的情况下采用此法效果较好。

3)抽样方法:

简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。

简单随机抽样的具体作法有:

(1)直接抽选法

直接抽选法,即从总体中直接随机抽选样本。如从货架商品中随机抽取若干商品进行检验;从农贸市场摊位中随意选择若干摊位进行调查或访问等。

(2)抽签法

先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取次,就得到一个容量为的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等。抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。

(3)随机数表法

随机数表法,即利用随机数表作为工具进行抽样。随机数表又称乱数表,是将0至9的10个数字随机排列成表,以备查用。其特点是,无论横行、竖行或隔行读均无规律。因此,利用此表进行抽样,可保证随机原则的实现,并简化抽样工作。其步骤是:① 确定总体范围,并编排单位号码;② 确定样本容量;③ 抽选样本单位,即从随机数表中任一数码始,按一定的顺序(上下左右均可)或间隔读数,选取编号范围内的数码,超出范围的数码不选,重复的数码不再选,直至达到预定的样本容量为止;④ 排列中选数码,并列出相应单位名称。举例说明如何用随机数表来抽取样本。

当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。

在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。

4)应用

简单随机抽样(Simple random sampling)是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样

就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。

2.系统抽样

当总体的个数比较多的时候,首先把总体分成均衡的几部分,然后按照预先定的规则,从每一个部分中抽取一些个体,得到所需要的样本,这样的抽样方法叫做系统抽样。

等距抽样也称为系统抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。

1)分类

根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。

系统抽样分为间隔定时法、间隔定量法、分部比例法。

2)特征

等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。3)优缺点

等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。

4)应用

在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。

等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。

样本距离可通过下面公式确定:样本距离=总体单位数∕样本单位数

例如,你使用本地电话本并确定样本距离为100 ,那么100 个中取1 个组成样本。这个公式保证了整个列表的完整性。

等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第5 页开始,在该页上再另选一个数决定从该行开始。假定从第3 行开始,这就决定了开始的位置。

5)方法

当总体单位的顺序排列之后,可选用下列方法进行等距抽样。

(1)随机起点等距抽样

即在总体分成K段(K=N/n)的前提下,首先从第一段的1至k号总体单位中随机抽选一个样本单位,然后每隔k个单位抽取一个样本单位,直到抽足n个单位为止。这n个单位就构成了一个随机起点的等距样本。这种方法能够保证各个总体单位具有相同的概率被抽到,但是,如果随机起点单位处于每一段的低端或高端,就会导致往后的单位都会处于相应段的低端或高端,从而使抽样出现偏低或偏高的系统误差。

(2)半距起点等距随机抽样

这种方法又称为中点法抽取样本,它是在总体的第一段,取1,2,…,k号中的中间项为起点,然后再每隔k个单位抽取一个样本单位,直到抽足n个样本单位为止。当总体是按有关标志的大小顺序排列时,采用中点法抽取样本,可提高整个样本对总体的代表性。

(3)随机起点对称等距抽样

这种方法是在总体第一段随机抽到第i个单位,而在第二段抽取第2k-f+1的单位,在第三段抽取第2k+f的单位,而在第四段抽取第4k-f+1的单位…,以此交替对称进行。可概括为:在总体奇数段抽取第jk+i单位(j=0,2,4…);在总体偶数段抽取第jk-i+1单位(j=2,4…)。这种抽样方法能使处于低端的样本单位与另一段处于高端的样本单位相互搭配,从而抵消或避免抽样中的系统误差。

(4)循环等距抽样

当N为有限总体而且不能被n所整除,亦即k不是一个整数时,可将总体各单位按顺序排成首尾相接的循环圆形,用N/n确定抽样间隔k,k可以取最接近的整数,然后在第一段的1至后号中抽取一个作为随机起点,再每隔后个单位抽取一个样本单位,直至抽满行个为止。6)排序方法

采用等距抽样时,必须首先对总体单位按某种标志进行排序,有下列两种排序方法。

(1)按无关标志排序

即总体单位排列的顺序和所要研究的标志是无关的。如调查职工的收入水平,可按姓氏笔划排列的职工名单进行抽样;工业生产质量检验可按产品生产的时间顺序进行等距抽样等等。一般认为,按无关标志排队的等距抽样是一种抽签法,随机数表法更好的纯随机抽样方式,又称无序系统抽样。

(2)按有关标志排序

即总体单位排列的顺序与所要研究的标志是有直接关系的。例如,农产量抽样调查时,可按照当年估产或前几年的平均实产由低到高或由高到低的顺序进行抽样。这种按有关标志排队的等距抽样又称有序系统抽样,它能使标志值高低不同的单位,均有可能选入样本,从而提高样本的代表性,减小抽样误差。一般认为有序系统抽样比等比例分层抽样能使样本更均匀地分布在总体中,抽样误差也更小。

3.分层抽样

又称分类抽样或类型抽样。将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。

先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的统计学计算方法

适用于总体由差异明显的几部分组成。

1)适用条件

分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组成时,往往选择分层抽样的方法

2)使用方法

最简单的情况:尽管每组的大小不同,但是从每组抽取的对象个数相同;

另一种变形:尽管每组的大小不同,但从每一组抽取的对象数量正比于该组的大小。

3)实例应用

例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50

岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。

求解过程:

解:S1:100 / 500 = 0.2

S2: 125*0.2= 25 ————————(不到35岁)

280*0.2= 56 ————————(35岁至49岁)

95*0.2= 19 ————————(50岁以上)

S3: 所以:<35岁的抽25人

35~49岁的抽56人

>50岁的抽19人

4)优点

(1)是在不断增加样本规模的前提下降低抽样的误差,提高抽样的精度。

(2)非常便于了解总体内不同层次的情况,便于对总体不同的层次或类别进行单独研究。

5)分层的原则

(1)以调查所要分析和研究的主要变量或相关变量作为分层标准。

(2)以保证各层内部同质性强和各层之间的异质性强、突出总体内在结构的变量作为分层变量。

(3)以那些已有明显层次区分的变量作为分层变量。

4.整群抽样

整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。

应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。1)优缺点

整群抽样的优点是实施方便、节省经费;

整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。

样本分布面不广、样本对总体的代表性相对较差等缺点。

2)实施步骤

先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:

(1)确定分群的标注

(2)总体(N)分成若干个互不重叠的部分,每个部分为一群。

(3)据各样本量,确定应该抽取的群数。

(4)采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。

例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。

3)与分层抽样区别

整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。

分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;

分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。

4)适用情况

整群抽样方法的运用,需要与分层抽样方法区别。当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成,同时,不同子群相互之间差很大、而每个子群内部的差异不大时,则适合于分层抽样的方法;反之,当不同子群之间差别不大、而每个子群内部的异质性比较大时,则特别适合于采用整群抽样的方法。[1]

5)整群抽样的误差

整群抽样的误差视各群单位方差大小而定,各群单位方差的简单平均数是计算其抽样平均误差的依据。从公式上看,整群抽样平均误差的公式与类型抽样平均误差的公式相似,用R 表示全及总体中划分的群(组)数。r表示被抽中的群(组)数。表示抽样总体各群(组)方差的平均数。

5.多段抽样

多段随机抽样,就是把从调查总体中抽取样本的过程,分成两个或两个以上阶段进行的抽样方法。

6.PPS抽样(概率比例规模抽样)

即“概率与元素的规模大小成比例的抽样”。其原理可以通俗的理解成以通过阶段性的不等概率抽样来换取最终的、总体的等概率抽样的方法。

7.户内抽样

从所抽中的每户家庭中抽取一个成年人,以构成访谈对象的过程。

8.偶遇抽样

是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象的方法。

9.判断抽样

判断抽样(Judgement sample)又称“立意抽样”,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。

10.定额抽样

定额抽样又称配额抽样,是按市场调查对象总体单位的某种特征,将总体分为若干类,按一定比例在各类中分配样本单位数额,并按各类数额任意或主观抽样。其抽样时并不遵循随机的原则。

11.雪球抽样

当无法了解总体情况时,可以从总体中少数成员入手,向他们询问其他符合条件的人,再去找那些人并再询问他们知道的人。如同滚雪球一样。

12.图像抽样

在图像区域的一些特定位置上取出图像的亮度值(或色度值),以此作为原图像的一种替代,这一过程就称作图像的抽样,而每一个抽样的位置称为抽样点,该点的亮度值(或色度值)就是抽样值。

三、统计抽样

统计抽样VS非统计抽样

非统计抽样

非统计抽样是指按照职业判断进行样本设计和实施抽样的技术。非统计抽样的特点:不能对抽样风险进行控制和量化。

统计抽样与非统计抽样比较:

统计抽样是指同时具备下列特征的抽样方法:(1)随机选取样本;(2)运用概率论评价样本结果,包括计量抽样风险。

统计抽样的样本必须具有这两个特征,不同时具备上述两个特征的抽样方法为非统计抽样。一方面,即使严格按照随机原则选取样本,如果没有对样本结果进行统计评估,就不能认为使用了统计抽样。另一方面,基于非随机选样的统计评估也是无效的。

在统计抽样与非统计抽样方法之间进行选择时主要考虑成本效益。统计抽样的优点在于能够客观地计量抽样风险,并通过调整样本规模精确地控制风险,这是与非统计抽样最重要的区别。

[1] 陆迎霞.审计中统计抽样与非统计抽样的比较[J].生产力研究,2008,(21)

常用术语

1.产品单位

质量管理的抽样检验中,单位产品是为了实施抽样检验而划分的单位体或单位量。

对于按件制造的产品来说,一件产品就是一个单位产品,如一批灯泡中的每个灯泡,一批螺钉中的每个螺钉。由于需要不同,钢水可以将一炉作为单位产品,也可以将一勺作为单位产品。

2.过程平均质量

过程平均质量指在规定的时段或生产量内平均的过程水平。

GB/T2828.1中指的是过程处于统计状态期间的质量水平。用不合格品百分数或每百单位产品不合格品数表示。

1.统计抽样检验的概述

1.1抽样检验特性曲线(OC曲线)

以不合格品率p为横坐标,以接收概率L(p)为纵坐标,做出的接收概率L(p)随不合格品率p变化的曲线,称为抽样检验特性(Operating Characteristic)曲线,简称OC曲线。不难理解,有一个确定的抽样方案,就有一个确定的OC曲线与之相对应,并且影响产品接收概率的只有交验批不合格品率这一个因素。

1.2影响OC曲线的抽样检验方案中的参数

抽样检验方案由交验批的批量N、抽样样本量n和合格判定数Ac等三个参数构成,一般记为[N,n,Ac]。

当抽样检验方案中的N,n为确定值时,Ac的变化对OC曲线的影响如图1所示。Ac由大变小时,OC曲线由右向左移动,倾斜度逐渐变大,使得接收概率降低,这就意味着方案变严,同时曲线越向左移,接收概率的变化率增大,也就是灵敏度增加。

当抽样检验方案中的N,Ac为确定值时,n由小到大变化时,OC曲线由右向左移动,和图1所示Ac由大变小对OC曲线的影响相似,即抽样方案随样本量n的增大,逐渐变严。

当抽样检验方案中的n,Ac为确定值时,N的变化对a曲线的影响甚微,如图a所示。这说明批量N对OC曲线即抽样检验的检验特性影响很小,表明对于相同质量水平的交验批,

抽样样本量n和合格判定数Ac一旦确定,其接收概率基本上是相同的,即体现了统计抽样检验的科学性和合理性。

2.统计抽样检验方案的确定

我国制订的统计抽样检验国家标准已有二十几个,不同的国家标准所确定的抽样方案也不尽相同。下面面介绍适用于连续批交验的GB2828.1计数抽样检验程序[按接收质量限(AQL)检索的逐批检验抽样计划]中抽样方案的确定过程。

要确定适用的抽样方案,首先依据批量N和检验水平IL从样本字码表中检索出相应的样本量字码,再根据样本量字码和合格质量水平AQL,利用附录的抽检表确定抽样方案,即确定要抽取的样本量n、用来判定批接收与否的接收数Ac,拒收数Re等。所以,使用GB/T2828.1统计抽样检验标准首先要明确检验水平、合格质量水平和抽样方式。

检验水平就是为确定检验判断能力,而规定的交验批量N与样本大小n之间的等级关系,记为IL。在GB/T2828.1中,检验水平有两类,即一般检验水平和特殊检验水平,一般检验水平包括I、II、III三个等级,其判断能力:III 大于II 大于I,无特殊要求时均采用一般检验水平II。特殊检验水平的判断能力低于一般检验水平,规定了S-1.S-2.S-3.S-4四个等级,其判断能力:S-4大于S-3大于S-2大于S-1。一般适用于检验费用较高、风险较高的场合。

合格质量水平AQL也称可接收的质量水平,表征连续提交批平均不合格品率的上限值。AQL的数值小于等于10%时,既可以表征“每百件产品中的不合格品数”,也可以表征“每百件产品中的不合格数”。当AQL大于10%时,则只能表征产品中的不合格数。AQL值确定原则为单项严于多项、原材料和另部件严于成品、航天产品严于军工和民用、电气严于机械等。

在GB/T2828.1中,抽样方式有三种,即一次抽样、二次抽样和五次抽样。对于给定的合格质量水平AQL和检验水平IL不同的抽样方式对批质量的判定能力以及对总体质量的保证能力基本上相同。所不同的是抽样方式的抽样次数越少,所需的样本量越大;但多次抽样的检验组织工作难度大,判定复杂。当检验费用不高时优先选用一次抽样。

3统计抽样检验的实施

3.1交验批的认定

交验批是提交检验的一批产品。在实施统计抽样检验的操作中,如果对交验批的认识比较混乱,不能清晰地认定,就不能选择适宜的随机抽样方法,这将直接影响到产品的质量保证。为保证抽样检验的可靠性,交验批的产品应由同型号、同等级和同种类(尺寸、特性、成分等),且生产条件和生产时问基本相同的单位产品组成。一般按包装条件及贸易习惯组成的批,不能直接作为检验批。

3.2样本的抽取

样本是检测的对象,质量特性是客观存在于产品之中的,也就是说样本客观上决定了检测结果。抽取样本是质量检验工作的首要环节,这一程序的关键是尽量做到“随机化”,所谓“随机化”是指以统计理论为基础的科学抽样方法,保证批中每个个体被抽取的概率完全相同,即保证所抽取的样本在批中的代表性。在认定交验批之后,按规定的抽样方案,抽取规定数量的产品作为待检样本。

3.3样本的检验和批质量的推断

根据规定的质量标准,对所抽取的样本进行质量检验,并判断样本中每个产品合格与否,记下样本中不合格品数或不合格数d。

d<=Ac,批接收;d>Re,批拒收。

3.4交验批的处理

判接收的产品交验批即可交付。样本中已发现的不合格品使用方有权拒收,也可以按事

先签订的合同决定是直接退货或是换成合格品。

对于判为拒收的交验批,通常应当全部退货,也可以按事先签订的合同有条件的接收。4统计抽样检验的风险

统计抽样检验存在风险,这是因为抽样检验是根据一定的抽样方案从交验批中抽取一部分作为样本进行检验,并依据所确定的接收准则来推断该批产品是否可以接收,所以,由于样本仅仅是交验批中的一部分,有可能做出错误的判断,即将本来质量合格的批次,判为不接收,出现生产方风险,或将本来质量不合格的批次,判为接收,出现使用方风险。

在抽样检验中这两种风险是无法避免的,即生产方和使用方都要承担一定的风险。因此选用抽样检验方案,不仅要考虑到所能承受的抽检费用的大小,还应考虑到尽可能减小两类风险,使生产方提供的质量合格的批次尽可能以高概率被接收,而质量不合格的批次尽可能以高概率被拒收。

例如,某产品交验批批量为200个、检验水平IL为II .AQL为1.0时,所确定的样本量n 为32、用来判定批接收与否的接收数Ac为1,拒收数Re为2等。理论上讲,AQL为1.0,就是规定了该批产品最高不合格品率为1.0%,该交验批如果被接收,最多有两件不合格品,其置信水平为89.5%,也就是说,使用方接收该批产品的不合格品数可能超过两件的概率,即使用方风险为10.5%。

5使用过程中不合格品的处理

既然统计抽样检验存在风险,在交验批交付使用时,仍然可能会出现不合格品。为保证下道工序的质量水平和统计抽样检验的有效性,应当及时就不合格品进行分析处理。

首先应当确认不合格品是否由使用不当造成。如果判断是由使用不当造成,应当改进该产品的使用环境、使用方法等。

然后确认统计抽样检验过程是否有效。如果判断统计抽样检验无效,则应当仔细检查统计抽样检验流程中的每一过程的有效性,即从抽样方案的确定、交验批的认定、样本的抽取、样本的检验、批的判断和交验批的处理等,甚至包括该交验批交付转序与保管过程是否有效,给出纠正与预防措施,并确认改进的有效性。

当判断统计抽样检验处于有效状态,而不合格品数却超过了AQL限定的数,应当确认不合格品状况是否在检验中不易发现或为规定之外的项目。如果是,应当完善检验内容,改进检验方式方法。

当判断统计抽样检验处于有效状态,不合格品数也未超过AQL限定的数,一般将不合格品退货,价值低的产品也可以考虑进行报废处理。

统计抽样计算题(有计算过程)

抽样计算题: 1、某乡水稻总面积20000亩,以不重复抽样方法从中随机抽取400亩实割实 测得样本平均亩产645公斤,标准差72.6公斤。要求极限误差不超过7.2公斤。试对该乡水稻的亩产量和总产量作出估计。 (1))亩产量的上、下限: (公斤)98.63702.7645=-=?-x x (公斤)652.0202.7645=+=?+x x 总产量的上下限: (万公斤)96.12752000098.637=? (万公斤)1304.0420000652.02=? (2)计算该区间下的概率() t F : 抽样平均误差 ()(公斤)3.59 2000040014006.72122=?? ? ? ?- =?? ? ?? -= N n n x σμ 因为抽样极限误差 x x z μ=? 96.159 .302 .7所以≈= ? = μ z 可知概率保证程度()t F =95% 2.某地有8家银行,从它们所有的全体职工中随机性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断: (1)全体职工中有储蓄存款者所占比率的区间范围;(2)平均每人存款金额的区间范围。 (1)全体职工中有储蓄存款者所占比率的区间范围: %81600 486 1=== n n p ()()%23.39%811%811=-?=-= p p p σ

抽样平均误差 %6.1600 3923.0== = n P p σμ 根据给定的概率保证程度()t F ,得到概率度z () %45.95=t F ? 2=z 则抽样极限误差%2.3%6.12=?==?p p t μ 估计区间的上、下限 %8.77%2.3%81=-=?-p p %2.84%2.3%81=+=?+p p (2)平均每人存款金额的区间范围: 抽样平均误差() (元)41.02600 5002 2 ===n x σμ 概率度z=2 则抽样极限误差 (元)82.4041.202=?==?x x z μ 平均每人存款额的上、下限: (元)18.335982.403400=-=?-x x (元)82.440382.403400=+=?+x x 3..某企业生产某种产品的工人有1000人,采用不重复抽样从中随机抽取100人调查当日产量,得到他们的人均日产量为126件,标准差为6.47件,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。(F (t )=95%,t=1.96) 抽样平均误差 () (件)61.010********* 47.612 2 =??? ? ??-=??? ? ??-=N n n x σμ 概率度z 或t=1.96 则抽样极限误差 (件)20.161.096.1=?==?x x z μ 全部工人的日平均产量的上、下限: 件) 2.1278.124()2.1126(-=±=?±x x

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

处方点评抽样与统计分析报告方法

处方点评抽样与统计分析方法 一、统计学概述 统计学是把科学和艺术结合在一起进行收集和分析数据资料的一门学科。 因为科学研究常研究的是事物的一般规律,研究的是其共性;艺术扬的是其个性,两者相差很远。而统计学是通过扬有差别的个性来寻求事物背后的一般规律,所以它是连接科学和艺术的一个桥梁。 早在16世纪,意大利人把统计学称为国情学。这种说法后来传播到法、德、荷等欧陆国家。在17,18世纪,这些国家的大学里讲授的“统计学”课程,实际上就是讲“国情学”,包括有关人口,经济,地理,乃至政治方面的容。到十九世纪初,逐步演变为现代西方统计学——Statistics。 统计学可与各领域、各专业相结合,已在社会、人口、教育、环境等各领域的应用研究中被广泛应用,因为它是一门方法学,是破解各领域难题的科学工具。如工业统计,卫生统计,生物统计,医药统计,金融统计,法学统计,心理统计,交通统计、教育统计等等。 卫生统计学属应用统计学,运用数理统计学的原理和方法,研究医学科研及卫生工作中有关数据的收集、整理、分析的科学。其容包括三部分: 1、统计设计: 抽样方法、研究设计方案 样本含量(大小)的确定 2、整理资料:数据录入、核查和汇总 3、分析资料:统计描述、统计推断。 二、目的意义

处方点评是加强合理用药的管理手段,目的是要解决临床不合理用药问题,不断提高临床医疗水平。在处方点评中应用卫生统计学的意义: 1、控制影响处方点评的因素 2、保证处方点评的质量 3、提高处方点评的水平 4、促进临床合理用药 在处方点评工作应用卫生统计,其容包括处方抽取的数量(样本含量)和抽样方法、处方数据资料的整理、分析、解释和描述。将获得可靠的结果,作出科学的推断或预测,为政府或卫生管理部门在医疗工作中进行管理决策和行动提供依据和建议。因此在处方点评中应用卫生统计,必须做到以下原则: 1、要有足够的样本含量; 2、被抽查的处方要有代表性; 3、抽样方法要科学; 4、点评结果要有可比性。 三、样本含量 样本含量是指样本中包含的观察单位数。从总体中抽取样本时,应保证样本有足够的数量满足统计学要求,样本中观察个体之间变异度小的样本含量可少些,变度大的应多些。 影响样本含量大小的相关因素 1、检验水平一般用95%的把握 2、检验效能一般取90%的信度 3、容许误差抽样率与总体率差别<10% 4、总体率的大小

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

统计抽样标准大全

統計抽樣標準大全 AQL的意义及其确定方法 ※ 产品检验的概念和分类 单位产品:为了实施检验的需要而划分的基本单元。如一辆卡车、1M棉布、1KG水泥、一双鞋等。 检验批:需要进行检验的一批单位产品。简称批。构成检验批的单位产品不应有本质的差别,只能有随机的波动。因此,一个检验批应当由在基本相同的生产条件下并在大约相同的时期内,所生产的同类型、同等级的单位产品所组成。 批量:需要检验的一批产品所包含的单位产品数。 致命缺陷:对使用和维护产品或对与此有关的人员可能造成危害或不安全状况的缺陷;或损坏产品重要的、最终的基本功能的缺陷。 重缺陷:不同于致命缺陷,但能引起失效或显著降低产品预期性能的缺陷。 轻缺陷:不会显著降低产品的预期性能的缺陷,或偏离标准但只轻微影响产品有效使用或操作的缺陷。 产品检验可分为全数检验、抽样检验、购入检验、中间检验、成品检验、出厂检验、库存检验、监督检验、计数检验、计量检验、破坏性检验、非破坏性检验等。 抽样检验常常用于下列情况: a) 检验是破坏性的; b) 检验时,被检对象是连续体; c) 产品数量多; d) 检验项目多; e) 希望检验费用小; f) 作为生产过程工序控制的检验。 随机抽样方法: 简单随机抽样:随机数表法、掷骰法。 周期系统抽样:采用一定间隔进行抽样的方法。 分层抽样:从一个可以分为不同子批(或称层)的检验批中,按规定的比例从不同层中抽取样本

※ 抽样检验标准及其体系 1、计数和计量抽样检验标准 计数抽样检验标准是以计数抽样检验的结果作为判定质量特性指标的,已经制订了国家标准的有: a) GB2828-1987《逐批检查计数抽样程序及抽样表(适用于连续批的检查)》 b) GB2829-1987《周期检查计数抽样程序及抽样表(适用于生产过程稳定性的检查)》 c) GB8051-1987《计数序贯抽样检查程序及表》 d) GB8052-1987《单水平和多水平计数连续抽样检查程序及表》 计量抽样检验标准是以计数抽样检验的结果作为判定质量特性指标的,已经制订了国家标准的有:2AG

抽样方法教案

新课程创新设计 学科:数学 年级:一 教材:苏教版必修3 模块:统计 内容:简单随机抽样 设计时段:一课时 学校:江苏省华罗庚中学 设计者:陈亮

设计思想: 通过设置问题情境使学生理解抽样的必要性和重要性,体会统计的思想。 通过“游戏”引入抽签法,在实际操作的过程中不断提出问题,通过学生对问题的讨论和思考使学生理解抽样的科学性与合理性,理解简单随机抽样的随机性和等可能性,由实际操作的步骤总结出抽签法的方法步骤,再继续设疑引出随机数表法,让学生感知学习随机数表法的必要性,并通过对问题的解决让学生感知随机数表法与抽签法的不同之处与共同点,从而总结出简单随机抽样的特点。 教材分析: 本节内容是统计的第一节课,是学生在初中统计基础上的延续和深化,本节内容介绍了统计的第一种方法,教材的重点应是对简单随机抽样方法的理解,难点是统计的思想以及简单随机抽样特点的理解,教学过程中应注意帮助学生加以理解,从而真正把握问题的本质。 学习目标: 1、知识与技能:通过解决具体实例的过程,掌握用抽签法、随机数表法(统称“简单随机抽样”)抽取样本的方法。学会用简单随机抽样方法从总体中抽取样本,掌握用抽签法和随机数表法进行抽样的步骤,了解随机数表法的制作和思想; 2、过程与方法:初步感受抽样统计的重要性和必要性;理解统计思想与确定性思想的差异; 3、情感态度与价值观:能从现实生活和其他科学中提出具有一定价值的统计问题,会用数学的眼睛看问题。 教学重点:1、简单随机抽样的概念; 2、常用方法:抽签法和随机数表法。 教学难点:随机数表法。 教学方法:问题探索与自学相结合。 课前准备:号签若干个,纸盒一个。 教学过程: 一、情境引入 (一)提出问题 1、为了知道汤的味道如何,你会怎么做?

常用的统计量抽样分布总结

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12)(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σ S n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T =~)(n t 。 2. 定理: 设n X X X ,,,21 独立同分布,且~),(2σμN ,则

n S X μ -σ σ μS n X )(-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σ S n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X 为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112 -+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σ S n -~)1(12 -n χ, 2 2 2 2)1(σ S n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σS n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 2 12111) ()(n n Y X +---σ μμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ 2 12111) ()(n n Y X +---= σμμ/ )2/()1()1(212 2 2 2211-+-+-n n S n S n σ ~)2(21-+n n t 。

统计学第九章抽样与抽样估计

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进 行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本, 这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差 相比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

统计工作抽样调查方法工作心得

统计工作抽样调查方法工作心得 篇一:统计工作培训总结 篇一:统计培训小结 2011年统计继续再教育培训小结— 调查分析技能培训 2011年9月中旬,厂企管部组织工艺品质部、物质供应部、动力车间、一二车间的统计人员进行了为期6天的调查分析技能的培训,大家经过6天的学习,互相探讨,互相启发,都从这次学习中获得了教益和能力的提升。 一、培训学习的基本情况。 培训的目的:学员通过参加调查分析技能的专业学习,系统掌握社会、经济调查理论、方法与技能,能够熟练运用现代化计算技术和现代定量分析方法,对各种信息进行综合分析,并结合经济学、管理学知识,为决策和管理提供咨询、策划服务。 培训的形式:部门负责人辅导学习教材;观看专题录 像;学习期间学员就所学内容进行坦诚、积极的交流和探讨。

培训的内容:以统计工作过程为基础,运用定性、定量的调查方法,调查、收集、整理相关资料,进行数据处理分析并形成报告,为企业决策提供可靠的依据。具体内容为---确定调查项目、调查方案、收集有关信息资料、设计问卷调查、进行抽样设计、指导和培训调查员、进行预调查、组织实施实地调查、调查数据处理和分析、撰写调查分析报告、评估和形成调查分析报告等。分析技能主要有六大技能,1收集数据的基本技能;2调查数据整理与显示的基本技能; 3.调查数据特征的集中程度分析的基本技能;4调查数据特征离散程度分析的基本技能;5.用excel软件进行数据分析;6用ppt制作和演示调查报告等。 学习期间,通过部门负责人蔡部长介绍,我们了解调查分析是一种综合技能,是很多行业解决实际问题的有效途径。了解调查分析主要靠数据说话,统计数据是否准确,将直接影响企业的决策是否正确,在这信息高速时代,专业的、高素质的调查分析从业人员是企业必备的。我厂的专业和兼职的统计人员能力水平也参次不齐,影响了调查分析的质量与效率,企业急需要有高素质的专业化人才。我们要珍惜这次培训学习机会,积极的学习调查分析技能。统计业务培训学习心得体会20XX年8月18日至8月29日,我同全州八县同行共53人有幸参加了在成都信息工程学院举办的xxx州统计业务骨干

统计学抽样方案

2006年海宁市公众科学素养调查抽样方案 一、调查目的、范围及对象 海宁地处中国长江三角洲南翼、浙江省北部,东距上海100公里,西离杭州60公里,南濒钱塘江,内陆面积近700平方公里,地势平坦,河流众多,水源丰富,是典型的江南水乡。海宁现辖8个镇,4个街道,总人口64万。海宁经济发达,市场繁荣,是我国首批沿海对外开放县(市)之一,连续三届跻身“全国综合实力百强县(市)”行列,县域社会经济发展综合评价全国第19位,是浙江省首批“小康县(市)”之一。海宁的目标是实现由小康向现代化的历史性跨越,到2010年建成经济文化强市。 提高公众科学文化素质,是实施科教兴国战略和可持续发展战略,是建设经济文化强市的重要内容之一。为深入地了解海宁市公众科学素养的状况,为政府和相关机构以及科普研究提供详尽的数据,海宁市科协决定于2006年6月至11月开展海宁市公众科学素养抽样调查。 ●本次调查的范围是海宁市包括:斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥 镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。 ●本次调查对象是在海宁市境内居住半年以上,年龄在18~69岁的成年人(智力障碍者 除外)。 ●本次调查的内容主要是了解海宁市公众的科学素养水平、获得科技知识的渠道、对科 技发展的态度等方面的基本情况。 二、调查方案的设计 从数据上看,海宁市各地区的经济、文化等各方面差异不是很大。但非农业与农村的

差异还是明显的。本次调查采用分层抽样三阶段的方法,各阶段的抽样单位如下: 第一阶段:海宁市所有镇及街道均入选为抽样单位; 第二阶段:以社区或村委会为二级抽样单位; 第三阶段:以家庭住户并在每户中确定1人为最终单位; (一) 调查样本量的确定 ● 样本量的定量分析: 纯净样本量是指去掉不合格或未回答的调查对象以后的剩余量,由于调查的结果主要是估计各种比例数据以及比例数据的之间的比较,所以在决定调查样本量时采用估计简单 随机抽样的总体比例时的样本量为基础,一般用公式2 2 ) 1(d p p u N -=α来计算,其中N 为纯净样本量,αu 为一定置信度下所对应的临界值,p 为样本比例,2d 为误差率。类似调查中, 大多数取95%的置信度(即仍有5%的不确定性或5%的误差),本调查也采用95%的置信度,此时αu =1.96,由于p 值较难估计,可采用保守策略,取5.0=p ,上述公式转化为 2 25.05.096.1d N ??= 。一般误差率(最大允许绝对误差) d 取值为3%或更小。 ● 样本量的确定: 在95%的置信度下按抽样绝对误差不超过3%的要求进行计算,由于我们可能要计算各种比较的大小,所以没办法精确地估计p 的大小,采用保守策略,取5.0=p 计,即所应抽取样本量为: 22022 (1) 1.960.50.510670.03u p p n d α-??==≈ 根据经验,一般分层抽样的设计效应为1.8,故抽取总样本数为1920.6个(人),为了便于计算和分组,设定本次的样本量为1920个(人)。

产品抽样标准大全

統計抽樣標準大全

AQL的意义及其确定方法 ※ 产品检验的概念和分类 单位产品:为了实施检验的需要而划分的基本单元。如一辆卡、1M棉布、1KG水泥、一双鞋等。检验批:需要进行检验的一批单位产品。简称批。构成检验批的单位产品不应有本质的差别,只能有随机的波动。因此,一个检验批应当由在基本相同的生产条件下并在大约相同的时期内,所生产的同类型、同等级的单位产品所组成。 批量:需要检验的一批产品所包含的单位产品数。 致命缺陷:对使用和维护产品或对与此有关的人员可能造成危害或不安全状况的缺陷;或损坏产品重要的、最终的基本功能的缺陷。 重缺陷:不同于致命缺陷,但能引起失效或显著降低产品预期性能的缺陷。 轻缺陷:不会显著降低产品的预期性能的缺陷,或偏离标准但只轻微影响产品有效使用或操作的缺陷。产品检验可分为全数检验、抽样检验、购入检验、中间检验、成品检验、出厂检验、库存检验、监督检验、计数检验、计量检验、破坏性检验、非破坏性检验等。 抽样检验常常用于下列情况: a)检验是破坏性的; b)检验时,被检对象是连续体; c)产品数量多; d)检验项目多; e)希望检验费用小; f)作为生产过程工序控制的检验。 随机抽样方法: 简单随机抽样:随机数表法、掷骰法。 周期系统抽样:采用一定间隔进行抽样的方法。 分层抽样:从一个可以分为不同子批(或称层)的检验批中,按规定的比例从不同层中抽取样本 ※ 抽样检验标准及其体系 1、计数和计量抽样检验标准

计数抽样检验标准是以计数抽样检验的结果作为判定质量特性指标的,已经制订了国家标准的有: a)GB2828-1987《逐批检查计数抽样程序及抽样表(适用于连续批的检查)》 b)GB2829-1987《周期检查计数抽样程序及抽样表(适用于生产过程稳定性的检查)》 c)GB8051-1987《计数序贯抽样检查程序及表》 d)GB8052-1987《单水平和多水平计数连续抽样检查程序及表》,计量抽样检验标准是以计数抽样检验的结果作为判定质量特性指标的,已经制订了国家标准的有: a)GB6378-1986《不合格品率的计量抽样检查程序及表》 b)GB8053-1987《不合格品率的计量标准型一次抽样检查程序及表》 c)GB/T8054-1995《平均值的计量标准型一次抽样检查程序及表》 2、调整型与非调整型抽样检验标准,调整型抽样检验标准,如GB2828-1987,GB6378-1986,可以根据连续批的质量变化来调整抽样检验方案的宽严程度,以达到保证批质量的情况下,引导生产方重视产品质量或减少抽样费用。 3、一次抽样、二次抽样、多次抽样和序贯抽样检验标准 ※ 使用GB2828-1987的检验程序 1、规定单位产品的质量特性在产品技术标准或订货合同中,必须明确对单位产品规定技术性能、技术指标、外观等质量特性。 2、不合格的分类 按照实际需要,将不合格分为A、B、C三类。如有需要或必要,可以对于或少于三类。 3、合格质量水平的规定在产品技术标准或订货合同中,应由订货方与供货方协商确定合格质量水平。合格质量水平是认为可以接受的连续提交检查批的过程平均上限值。 4、检查水平的规定 标准给出了一般检查水平:Ⅰ、Ⅱ、Ⅲ和四个特殊检查水平:S-1、S-2、S-3、S-4。除非另有规定,通常一般采用检查水平Ⅱ。当需要的判别力比较低时,可规定使用一般检查水平Ⅰ。当需要的判别力比较高时,可规定使用一般检查水平Ⅲ。特殊检查水平仅适用于必须使用较小样本,而且能够或必须允许较大的误判风险时。 5、检查批的形成和提出 单位产品经简单汇集形成检查批。 6、检查严格度的规定 检查严格度是指提交批所接受检查的宽严程度。本标准规定有正常检验、加严检验和放宽检验三种不同严格度的检查。 除非另有规定,在检查开始时,应使用正常检查。 检查严格度转移规则如附表。 7、抽样方案类型的选择,标准给出了一次、二次、五次三种类型抽样方案。通常根据比较各种不同类型对应抽样方案的管理费用和平均样本大小来决定采用一次、二次或五次抽样方案中的一种。 8、检索抽样方案根据样本大小字码和合格质量水平运用标准中给出的表检索抽样方案 9、样本的抽取 要能代表批质量的方法抽取样本。当检查批由若干层组成,就以分层抽样方法抽取样本。 在使用二次和五次抽样方案时,每个样本都应在整批中抽取。 抽取样本的时间,可以在批的形成过程中,也可以在批组成之后。 10、样本的检查 11、逐批检查合格或不合格的判定

具体的统计抽样方法

具体的统计抽样方法 一、属性抽样 属性抽样是通过确定样本的属性来推断总体的属性。 1、属性抽样回答是“是”或“否”,来反映一些属性的存在。它适合于测试内部控制的有效性。 2、属性抽样不考虑错误业务的大小或导致的错误大小,只要是背离有效控制的问题,都是同样重要的。 3、属性抽样不能确定准确率。因为它的回答只是“是”或“否”,而不是具体的量化数字。 二、变量抽样 变量抽样是对交易的金额和数量进行评估,以确定是否与预期的有偏差。 ①变量抽样要考虑以下情况: 要求的精确度、标准离差、可接受的风险水平。 ②变量抽样一般用于应收账款、存货和固定资产的测试。 三、发现抽样 发现抽样是在既定的可信赖的程度下,在假定误差以既定的误差率存在于总体之中的情况下,至少查出一个误差的抽样方法。 当内审师在检查怀疑存在舞弊或重大错误的总体时,就会采用发现抽样技术。这样的总体中可能包括工资表中的假冒员工、重复付款、未经批准运送货物或不存在的贷款抵押物。

四、连续抽样,也称为停-走抽样 连续抽样的样本需要在几个阶段中抽取,即,当在第一组样本中没有发现问题时,足以证实相关控制的有效性,就可以结束测试;如果第一组审查发现有些偏差,则需抽第二组样本检查,直到有足够的证据证明控制的有效性为止。 1、连续抽样是属性抽样技术的一个分支,用来测试内控制度的有效性,不是为了查找违纪金额的。 2、在预计总体差错率低的情况下(即违反的情况较少时),连续抽样需要的样本量最少。 3、连续抽样没有固定的样本量。 每组样本抽查后,内审师应该作“停或走”的判断,所以又叫停-走抽样。 五、多层次抽样,也称为分层抽样★ 有时也称分类(型)抽样。多层次抽样是将总体中的抽样单元分成若干个彼此不重叠的层,每个层中的个体都具有共同的属性,然后从这些层分别抽取样本,最后组成样本的全部。 例如:为函证应收账款,可以将应收账款账户按应收账款账户金额的重要性分层,分为三层,即账户余额在100,000元以上的,在50,000元到100,000元以内的,50,000元以下的。对应收账款账户余额在100,000元以上的账户进行100%的函证。 六、分块抽样★

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

统计抽样标准大全样本

統計抽樣標準大全 AQL意义及其拟定办法 ※产品检查概念和分类 单位产品:为了实行检查需要而划分基本单元。如一辆卡车、1M棉布、1KG水泥、一双鞋等。 检查批:需要进行检查一批单位产品。简称批。构成检查批单位产品不应有本质差别,只能有随机波动。因而,一种检查批应当由在基本相似生产条件下并在大概相似时期内,所生产同类型、同级别单位产品所构成。 批量:需要检查一批产品所包括单位产品数。 致命缺陷:对使用和维护产品或对与此关于人员也许导致危害或不安全状况缺陷;或损坏产品重要、最后基本功能缺陷。 重缺陷:不同于致命缺陷,但能引起失效或明显减少产品预期性能缺陷。 轻缺陷:不会明显减少产品预期性能缺陷,或偏离原则但只轻微影响产品有效使用或操作缺陷。 产品检查可分为全数检查、抽样检查、购入检查、中间检查、成品检查、出厂检查、库存检查、监督检查、计数检查、计量检查、破坏性检查、非破坏性检查等。 抽样检查常惯用于下列状况: a) 检查是破坏性; b) 检查时,被检对象是持续体; c) 产品数量多;

d) 检查项目多; e) 但愿检查费用小; f) 作为生产过程工序控制检查。 随机抽样办法: 简朴随机抽样:随机数表法、掷骰法。 周期系统抽样:采用一定间隔进行抽样办法。 分层抽样:从一种可以分为不同子批(或称层)检查批中,按规定比例从不同层中抽取样本 ※抽样检查原则及其体系 1、计数和计量抽样检查原则 计数抽样检查原则是以计数抽样检查成果作为鉴定质量特性指标,已经制定了国标有: a) GB2828-1987《逐批检查计数抽样程序及抽样表(合用于持续批检查)》 b) GB2829-1987《周期检查计数抽样程序及抽样表(合用于生产过程稳定性检查)》 c) GB8051-1987《计数序贯抽样检查程序及表》 d) GB8052-1987《单水平和多水平计数持续抽样检查程序及表》 计量抽样检查原则是以计数抽样检查成果作为鉴定质量特性指标,已经制定了国标有:2AG

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估 计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30 的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样 本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 设71,,X X 为总体)5.0,0(~2N X 的一个样本,则=>∑=)4(7 1 2 i i X P ; 6.11设X 1,X 2,…,X n 是分布为的正态总体的一个样本,求 221 1()n i i Y X μσ==-∑ 的概率分布 6.12设61,,X X 为总体)1,0(~N X 的一个样本,且cY 服从2χ分布,这里, 26542 321)()(X X X X X X Y +++++=,则=c .

抽样标准大全

抽样标准大全

統計抽樣標準大全 什么是抽样方案?它有哪些类型? 答:抽样方案是由样本量和对样本的要求两部分组成。抽样方案有计数型和计量型两种类型。计数型抽样方案可记为:(n;c),n表示样本量,c表示对样本的要求,即从一批产品中抽取n个样品,(n当然不能大于批量),逐个检验这n 个产品,若在其中发现有d个不合格品,若d不大于C,判为总体可接收,若d大于C,判为总体不可接收。计数型抽样方案又分为计件和计点两种情况。 抽样方案类型如下: 抽样方案:技术型抽样方案:计件、计点 计量型抽样方案 抽样检验方案的设计依据是什么? 答:抽样检验方案是根据对总体的质量要求,用数理统计理论设计出来的。对总体的质量要求不同,对样本的要求也就必然不同。例如要求总体不合格品率不超过万分之一,所用的抽样方案与要求总体不合格品率不超过百分之一所用的抽样方案必然不同。所以说应先有对总体的质量要求,才能有抽样方案;如果没有对总体提出质量要求,抽样方案也无从谈起。这里应特别指出,总体不合格品率与样本不合格品率是两个不同的概念,在数值上不能混为一谈。例如从批量为10000的一批产品中抽取两件样品,样本不合格品率仅有三个

值:0,50%,100%。两件都合格样本不合格品率是零;其中有一件不合格,样本不合格品率为50%;两件都不合格样本不合格品率是100%,但总体不合格品率的真值可能不是上述三个值中的任何一个值,综上所述,样本不合格品率与总体不合格品率不一定相等。 抽样检验方面有哪些国家标准? 答:抽样检验这门科学,就是用尽量少的样本量,来尽量准确的判断总体质量状况,这是一个很复杂的领域。欲达到上述目的,根据不同种情况要用不同的抽样方案或抽样系统。到目前为止,我国已正式颁布了20个关于抽样检验的国家标准,如下: GB 2828—87 逐批检查计数抽样程序及抽样表(适用于连续批的检查) GB 2829—87 周期检查计数抽样程序及抽样表(适用于生产过程稳定性的检查) GB 6378—86 不合格品率的计量抽样检查程序及图表 GB 8051—87 计数序贯抽样检查及表 GB 8052—87 单水平和多水平计数连续抽样检查程序及表GB 8053—87 不合格品率计量标准型一次抽样检查程序及表GB 8054—87 平均值计量标准型一次抽样检查程序及表 GB/T 13262—91 不合格品率的计数标准型一次抽样检查程序及抽样表 GB/T 13263—91 跳批计数抽样检查程序

统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,

2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

相关文档