文档库 最新最全的文档下载
当前位置:文档库 › 针对不确定射频识别数据流的改进概率推导方法(西交-交叉读)

针对不确定射频识别数据流的改进概率推导方法(西交-交叉读)

 http:∥www.j

dxb.cn 第45卷 第12期2011年12月

西 安 交 通 大 学 学 报

JOURNAL OF XI′AN 

JIAOTONG UNIVERSITYVol.45 No.12Dec.2011

收稿日期:2011-05-24. 作者简介:聂艳明(1972-),男,博士生;李战怀(通信作者),男,教授,博士生导师. 基金项目:国家自然科学基金资助项目(60720106001,61033007).网络出版时间:2011-10-08

网络出版地址:http

:∥www.cnki,net/kcms/detail/61.1069.T.20111008.008.html针对不确定射频识别数据流的改进概率推导方法

聂艳明,李战怀,陈群

(西北工业大学计算机学院,710072,西安)

摘要:针对射频识别(RFID)数据存在漏读和交叉读而导致所提供的位置信息不准确,以及RFID

数据与上层应用需求之间存在的信息鸿沟,提出了一种可以处理RFID交叉读问题的改进的RFID数据推导方法.该方法利用动态图模型并辅以历史RFID识读,从不确定RFID数据流上有效捕获对象的当前状态,采用基于熵的方法推导对象的最可能位置与包含,并且利用仿真物流仓库的RFID模拟数据进行算法评价.实验结果显示,该方法在获得准确推导结果的同时,能确保其高效性.对于常见RFID部署,位置推导和包含推导的错误率都可以控制在10%以内,针对超过17万个节点的推导所用时间小于1s,采用修剪措施后内存使用低于700MB.关键词:不确定射频识别数据流;交叉读;动态图模型;基于熵;概率推导

中图分类号:TP311 文献标志码:A 文章编号:0253-987X(2011)12-0045-08

Enhanced Probabilistic Interp

retation over Uncertain RadioFrequency 

Identification Data StreamsNIE Yanming

,LI Zhanhuai,CHEN Qun(School of Computer Science,Northwestern Polytechnical University

,Xi′an 710072,China)Abstract:To address the uncertainty of radio frequency 

identification(RFID)data due to the ex-isting missed readings and cross readings,and to mitigate the information gap between RFID dataand the requirements of upstream applications,an enhanced data interpretation method is p

ro-posed,which is able to handle with cross RFID readings over uncertain RFID streams.A dynamicgraph model is chosen,supplemented with the history of RFID readings,to efficiently capture thepossible locations and containment for tagged objects.Then an entropy-based method is adoptedto estimate the most likely location and containment for each object.The method with the syn-thetic RFID data is also evaluated.The experimental results show the accuracy and efficiency.The error rates for both inferences get within 10%for common RFID deploy

ment.The inferencetime is no more than 1s,as the number of objects over 1.7×105

 and the used memory less than700MB by employing 

likelihood threshold-based trimming.Keywords:uncertain radio frequency identification data streams;cross readings;grap

h model;entropy-based;p

robabilistic interpretation 由于射频识别(RFID)

技术本身的局限性以及环境干扰等影响因素,RFID识读存在漏读和交叉读,所提供的位置信息不准确,同时RFID识读语义非常简单,并不直接捕获对象间的关联关系(如包含

等),因而针对RFID数据的清洗和推导就显得尤为关键.我们将仅仅基于识读本身来处理RFID数据的不准确性称为针对RFID数据的物理清洗(即数据清洗),将兼顾识读本身以及识读中存在的关联关

系来消减RFID数据的不准确性称为针对RFID数据的逻辑清洗(即数据推导),这也是本文的讨论重点.

文献[1]提出了延迟RFID数据清洗的方法,并利用重写机制来限制清洗数据量以提高处理效率.文献[2]提出的RFID数据过滤方法在保持原始事件的顺序和内存需求方面尤为有效.ESP(Extensi-ble receptor Stream Processing)[3]通过引入时态与空间粒度的概念对RFID数据流进行在线清洗,但在粒度的选取上存在困难.SMURF(StatisticalsMoothing for Unreliable RFid datal)[4]则通过将RFID数据流看成物理世界中RFID标签的统计样本,通过动态调整窗口大小(即时态粒度)来对RFID数据流进行平滑处理,但SMURF无法捕获标签在多个阅读器间的迁移.

文献[5]通过扩展SMURF,提出了3种基于动态概率路径事件模型的数据填补算法,并通过挖掘已知区域事件的顺序相关性来对后续事件进行填补.文献[6-7]综合利用对象的时态信息及其时空关联关系,对RFID数据进行清洗.文献[8]提出一种概率模型,将原始移动RFID数据流转换为包含位置坐标信息的事件流.文献[9]基于当前时刻的RFID识读推导对象的位置,如同文献[5-8]中的方法一样也无法应对交叉读问题.文献[9]同时假定特殊阅读器事先已知并可直接确认对象的包含,存在局限性.

本文提出一种改进的针对不确定RFID数据的推导方法.该方法基于时变图模型,并辅以对象的历史位置信息和对象间的历史同位置信息,捕获对象的当前状态,随后采用基于概率熵的方法来分别估计对象最可能的位置与包含.针对经过上述位置推导后仍为不确定的节点,本文还提出一种有效形成子图的方法对不确定对象作进一步的推导.

1 问题陈述

1.1 相关概念

(1)物理世界及其状态与观测.一个物理世界包括一个贴标对象集O、一个预先设定的位置集L和一个全序的离散时域T.位置集L中的位置可以是逻辑区域(如仓库入口)或是物理坐标,本文暂只考虑逻辑位置.在某个时刻t,贴标对象所在位置及其之间的包含等关联关系,称为物理世界在t时刻的状态.某个时刻的RFID识读,则称为对物理世界的一个观测.

(2)RFID数据中的漏读与交叉读.位于阅读器识读范围中的贴标对象没有成功地被该阅读器检测到,此即RFID数据中的漏读,通常使用识读率来描述漏读,指RFID标签能够被位置最近的阅读器检测到的概率.由于部署的RFID阅读器的识读范围存在一定程度的区域重叠,贴标对象可能会被邻近的阅读器检测到,此即RFID数据中的交叉读,使用交叉率来描述,指RFID标签能被其邻近阅读器识读到的概率.

(3)RFID识读中的时态信息与空间信息.动态产生的RFID数据中包含关于贴标对象随时间而改变的状态数据,如对象的位置等,此即RFID识读中的时态信息.贴标对象之间也存在诸如同位置、包含等多种关联关系,此即RFID识读中的空间信息.RFID数据推导问题就是基于已有RFID识读中并不精确的时态信息和空间信息,对物理世界的当前状态进行尽可能准确的估计,即报告对象的最可能位置和最可能包含.对RFID数据流的实时推导主要是基于最近k个时刻内对象的历史位置信息,并辅以对象间的同位置信息,推导对象在当前时刻最可能的位置和包含.

1.2 应用场景示例

一个小型物流仓库示例如图1所示.RFID标签编码标准[10]规定了对象的3个包装层级(即单品、包装箱、托盘,分别对应到图1中的方形、八边形、圆形),将其编码于对象标签的ID中.为了表示方便,每个对象被着色为t时刻观测位置的颜色(可以存在多个观测位置),而白色的节点表示t时刻该对象未被任何位置观测到.虚线边表示对象间的包含关系是不确定的.如果对象存在已确认的父包含,则相应的父连接边改由实线表示

(a)t=1(b)t=2 (c)t=3

图1 小型物流仓库示例

在t=1时,进货门禁处的阅读器观测到对象1~6,由实心节点表示.对象7也处于进货门禁,但未被观测到(即漏读),由空心节点表示.对象4、5和6的包装容器可以是箱子2,也可以是箱子3,所以存

4西 安 交 通 大 学 学 报 第45卷 

 http:∥www.jdxb.cn 

 http:∥www.j

dxb.cn 在不确定性.在t=2时,箱子2在传送带上被单独扫描.在t=3时,

箱子3在传送带上被单独扫描,同时箱子8以及单品9被货架1和2同时观测到(即交叉读).由于RFID识读本身的不可靠性,以及诸如包含关系等语义的隐含性,物流仓库中对象的状态是不确定的,这就需要进行数据推导.

2 数据捕获模型及其动态更新

2.1 数据捕获模型

采用图模型G=(V,E)

表示物理世界(如物流仓库)当前可能所处的状态[9]

图捕获模型及其演化的示例如图2所示,其中节点集合V表示贴有RFID标签的对象,

根据对象的包装层级对节点进行分层,

每层对应一个包装层级.边集E表示对象间可能的包含关系,一条有向边oi oj表示对象i

包含对象j.模型允许节点具有多条子边(如一个包装箱可包含多个单品)

和多条父边(如一个单品对应多个可能的包装箱),最终通过概率方法选择最可能的包含

 (

a)t=1 (b)t=2 (c)t=k(k>2)图2 图模型及其动态更新

图模型保存有历史统计信息.

首先,与文献[9]中仅仅利用当前时间的观测位置不同,本文为每个节点保存了所对应对象在最近K个时间周期的观测位置信息LK.对象在某个时间周期上被所有位置的观测情况由一个位向量表示,每位对应到一个观测位置.如对象被某个位置观测到,就将该位置对应为位置1,否则置0.显然,该图模型可以处理RFID交叉读问题.另外,每个节点还记录其对应的已确认父包含PC.图2c中节点8和9分别对应有两个图形,表示同时被两个位置观测到,但在图模型中只是更新节点所对应的位向量.其次,每条边维护一个位向量CS来记录邻接节点对应的两个对象在最近S个时间周期是否被相同位置观测到.当一条边的两个邻接对象在同一个位置同时被观测到时,位向量中对应的位就被设定为1,否则为0.

2.2 图模型的实时更新

根据当前时间周期的识读集R(t

),对前一个时

间周期的图进行更新处理,

得到一个新图.由于RFID技术本身的物理特性以及部署环境的限制,RFID阅读器一次能够识读的RFID标签的数量有

限,因而一次所产生的RFID识读数量也不大.而且,

在图模型更新以及数据推导过程中,使用到的仅为当前时间周期的RFID识读.对于应用场景规模非常庞大的情形,

可以考虑采用分布式并行的处理方法.图模型更新算法的伪代码如图3所示,其步骤说明如下.

1)新建节点.如果对象是第一次被观测到,则新创建一个图节点,如图3中的1~5行.(2

)添加边.如果相邻层两个未邻接的节点具有相同位置的观测,则在该两个节点之间添加一条边,如图2c中节点3-7、8-9、8-10之间的边,见图3中15行和26行

图3 RFID流数据驱动的图模型更新算法

(3

)删除边.如两个邻接节点具有互不交叉的位置观测,则该边可删除.如图2c中节点3-4、3-5之间

4 第1

2期 聂艳明,等:针对不确定射频识别数据流的改进概率推导方法

 http:∥www.j

dxb.cn 的边,见图3中13行和24行.

(4

)更新统计信息.对于已观测节点,记录观测位置与时间,

并丢弃过时信息,同时更新邻接节点的同位置信息,见图3中16行和27行.

图模型更新的复杂度分析.

对于时间周期t的识读集Rt,创建或更新节点的代价上界为|Rt

|.对于来自每个阅读器的识读集R(k)

(k为阅读器编号),针对邻接节点为相同观测位置新增边的代价小

于|R(k)t/2|2

.待更新边的集合Gt-1在Ot至少为其中一个邻接节点为观测节点的边上的投影,用

πR1,R2,…,Rk(G)表示,更新代价为2|πR1,R2,…,Rk

(G)|.因此,一个时间周期图数据更新的复杂度为

(O

∑k

|R

(k)t

|2

+|πR1,R2,…,Rk

(G))

|,这意味着图更新代价不大于输入图在其中一个邻接节点为观测节点的边上投影集合的大小,再加上来自每个阅读器识读的个数的平方和.同时,由于RFID防冲撞协议以及实际部署,单个时间周期内一个RFID阅读器可识读的标签数量有限,为确保识读效果,实际部署的标签数量会更少些.

3 数据推导方法

在数据捕获阶段得到的更新图的基础上,利用基于概率分布的熵的方法来推导目标对象的位置和包含.对图G中的每个节点,根据该节点在所有可能位置上概率分布的熵来推导其最可能的位置,根据该节点的所有可能包含的概率分布的熵来推导其最可能的包含.

3.1 基于熵的概率推导方法

信息论中的熵是关于不确定性的一种度量,小的熵意味着随机变量更为确定.

当熵很小时,就可认为该随机变量是确定的,并可将返回概率最大的对应值作为该随机变量的值.具有n个可能取值{x1,x2,…,xn}

的离散随机变量X的熵为H(X)=-∑n

i=1

p(xi)logb

p(xi)(1

)式中:p(xi)为X取值xi的概率质量函数.基于熵的定义,熵对随机变量X可能取值的个数是敏感的.例如,具有10个相同可能取值的随机变量的熵会远远高于具有2个相同可能取值的随机变量的熵.为了减轻这种影响,利用具有n个可能取值的最大熵对拥有n个可能取值的随机变量的熵进行归一化处理,亦即

H(X)=-∑n

i=1p(xi)logbp(xi()()/-1nlog(b1

))

n(2

)3.2 包含关系推导

包含推导分为包含关系确认和一般包含关系推导.包含关系确认是确定在对象的所有可能包含中是否存在一个显著的包含.

如果没有,则对其进行一般包含关系推导,以获得关于该对象包含关系的最可能估计,

如图4所示

.图4 节点包含关系推导算法

3.2.1 包含关系确认 文献[9

]中假定特殊阅读器(如传送带阅读器等)事先已知,并且可以直接确认对象的包含,本文则通过找到一个特定的识读序列来识别出对象的真正包含.如传送带上的阅读器一次只识别一个箱子以及其所包含的单品,而且由于传送带和其他阅读器相距很远,因而该箱子及其所包含的单品不会被其他位置观测到.

如果该趋势持续几个时间周期,就可确认该传送带上的箱子(唯一)就是这些单品的容器.给定节点v,包含关系确认方法如下.

(1

)计算权重.为节点的每条父连接边计算权重8

4西 安 交 通 大 学 学 报 第45卷 

 http:∥www.j

dxb.cn 珡wei

(见图4中2~4行)珡wei=∑W

j=0

CS[

j()]/∑W

j=0

1(3

)式中:CS[j]为同位置向量的第j个设置位;W为窗口大小.由于太大的窗口会引入更多噪声而降低了边的权重的作用,使用较小的W(本文取W=4)较为理想.

(2)计算概率.对节点的每条父边的权重珡wei

做归一化处理,得到珚pei.(3)计算熵.计算节点的所有父边的概率分布的熵hi(

见图4中6~14行).hi=-∑n

j=1

珚pejlb珚pe()j/-1nlb1()

n(4

) 当节点的所有父边的概率分布的熵很小时,

就可认返回概率最大的边作为该节点的确认边.同时,更新变量PC,并删除该节点的其他所有父连接边,以节省系统的内存开销.

3.2.2 一般包含关系推导 如果在当前时间周期

节点没有确认的包含,

则对该节点进行一般包含关系推导,并选择概率值最大的父边作为其最可能的容器.由于利用到了包括父连接边的同位置向量(即CS)

和表示节点之前已经确认的包含(即PC)等历史统计信息,该节点于当前时刻所丢失的RFID识读对于节点包含关系推导结果的影响就大大减小.节点包含关系推导包括以下两个步骤.

(1)计算权重.为每条父边计算权重wei

,计算方法[9]

如下(见图4中15~17行)

wei=∑S

j=0CS[j]j(

α/∑S

j=0

1jα(5)式中:S为位向量CS的窗口大小(本文中S=32)

;参数α控制不同时刻历史位置信息的权重,服从Z

分布,α>0给越新的历史赋予越高的权重,而α=0为历史信息中的各个位赋予相同的权重.

(2

)计算概率.计算节点v所有可能父连接边的概率分布.如果父连接边中具有的最大概率和其他概率的均方差小于一个设定阈值,则返回该具有最大概率值的父边作为节点v的最可能父包含;否则,节点v的父包含是不确定的(见图4中的18~27行).通过权衡连接边的相对权重和该连接边是否为已确认父边,计算每条边的概率,参数β则用来平衡

这两个因素.连接边ei的概率pei

的计算方法[9]如下pei=((1-β)m(ei)+βwei)/Z(6)如果ei为确认边,内存函数m(ei)取值1,否则为0.参数Z为归一化因子.

3.3 位置推导

节点位置推导的关键就是在继续停留于原位置、

移动到一个新的位置和不在任何位置而消失这3种可能情形之间进行权衡.

节点推导对节点v的所有可能位置构建概率分布,

并根据最近K个时间周期的位置统计信息和邻居节点的位置统计信息,推导该节点当前最可能的位置.节点的位置推导算法的伪代码如图5所示.

3.3.1 基于RFID数据的时态信息的位置推导 基于节点的历史位置信息LK计算其所有可能位置上的概率分布,方法如下.

(1

)计算权重.对于节点v的位置统计信息中所有位置,逐个计算节点v仍可能处于位置li的权重wli(v)(见图5中1~6行).节点在TO处于位置li的权重的计算方法如下

wtli

(v)=1/(TN-TO+1)θ

(7

)式中:TN为当前时间周期;TO为节点v所代表的物品在位置li被识别到的时间周期;

参数θ控制节点v的最近位置li的衰减速度.

(2)计算概率.对相同位置上的权重进行累加,并对所有可能位置的权重进行归一化处理,得到节点v可能所处位置的概率分布pli

(v).(3

)计算熵.如同包含关系推导,基于节点所处位置的概率分布来计算熵hi.如果该节点在某个位置上较为为显著(即位置概率分布的熵小于设定的阈值,

并且该位置概率大于设定阈值)时,则可推导出该节点的最可能位置.如果该节点所有位置的概率小于一个很小的阈值时,则可以推导出该节点的位置为未知(即丢失).否则,该节点的位置为不确定,并推迟对该节点的位置推导到后续的“基于RFID数据的空间的位置推导”中进行,见图5中7~19行.3.3.2 基于RFID数据的空间信息的位置推导 借助邻居节点的历史位置信息LK,对不确定节点vu进行位置推导.方法如下.

1)构建局部子图.首先向上遍历节点v的所有父节点,找到可能性最大的父节点vp.如果vp不是根节点,类推遍历父节点vp的所有父节点,直到遍历到的父节点为根节点vr为止.然后,向下遍历根节点vr的所有子节点,如果子节点vc的最大可能父节点就是vr,则将该子节点vc加入到子图中.如此类推,向下递归遍历该子节点的所有子节点,直到加入到子图中的子节点为叶子节点为止,

见图5中9

4 第1

2期 聂艳明,等:针对不确定射频识别数据流的改进概率推导方法

 http:∥www.j

dxb.cn 20~26行.为节点I5构建的局部子图如图6所示,由双点划线所包围的节点及其之间概率最大的连接边(

标有向下箭头)所构成.(2

)计算概率.对上述局部子图中的所有节点于相同位置上的权重进行累加,并对所有可能位置的权重进行归一化处理,得到节点v可能所处位置的概率分布pci(

v)

.图5 节点位置推导算法

3)计算熵.如同在基于RFID数据的时态信息的位置推导,根据计算出的熵来判断该节点当前所

处的位置(包括未知),如果仍不能推导出节点的可能位置,则输出该节点的位置为不确定,见图5中27~32行

图6 局部子图的构建

3.4 数据推导的复杂度分析

节点包含关系推导的代价为|E|,对于基于时态信息的位置推导,其代价小于|V|,而对于基于空间信息的位置推导,其主要代价小于|E|+|V|(一般情况下满足|V|<|E|

).因此,数据推导的复杂度为O(|E|).为改善推导效率,可在推导过程中对模型进行修剪处理.首先,如果一个物品已经通过仓库出口并有一段时间未被观测到,就可以从图中删除对应的节点及其所有邻接边.其次,在对节点进行包含关系推导时,也可以剪除那些概率小于设定阈值的连接边.

4 性能评价

采用Java实现本文所提出的RFID数据捕获模型与数据推导方法,

并在一个模拟的物流仓库环境中对该方法的准确性和效率进行评价.4.1 RFID数据模拟器

为产生实验所需的数据,我们开发了一个在仓库部署RFID的数据模拟器.在该模拟仓库中:①托盘以一定的速度注入到仓库,并将被仓库入口处的阅读器读到;②到达的托盘随后被解包为包装箱,这些包装箱被放置到入库传送带,并被传送带阅读器逐个扫描;③经过扫描后的包装箱将被放置到安装有阅读器的货架上,并在货架上停留一段时间;④待出货的包装箱被放置到出库传送带,并被传送带阅读器逐个扫描;⑤在安装有阅读器的打包区域,将待出货的包装箱重新打包成托盘;⑥托盘以一定的速度出库,并被仓库出口处的阅读器扫描到.其中,物

品(托盘或包装箱)在各个位置上的停留时间和在位置之间的迁移时间服从指数分布.

用于控制模拟数据生成的主要参数如下:

托盘注入速率为每4~600s注入1个托盘,

托盘中箱子0

5西 安 交 通 大 学 学 报 第45卷 

的数量为5~8个,箱子中单品的数量为20个,模拟

持续时间为3~24h,阅读器的识读率为0.5~1,阅读器的交叉率为0~0.8.基于所产生的数据,数据推导算法以1s-1的频率对对象进行包含关系推导和位置推导.

4.2 数据推导的准确性

基于针对包含关系推导和位置推导的实验结果可知,当S=32、α=0、β=0.4以及θ=1.25时,推导效果最好.由于篇幅限制,这里略去相关实验结果图及分析.

实验1:不同识读率的影响.本文提出的推导方法可充分利用最近K个时间周期的观测位置信息,即使识读率较低也可获得相当准确的对象的位置推导结果.由于低识读率会影响包含关系的有效确认,同时还会造成邻接节点之间的同位置信息丢失,对象间的包含关系推导的准确性会随着识读率的降低存在较为明显的下降,如图7a所示.对于不小于0.8的识读率,采用该改进方法两种推导错误率均低于10%.

相比于改进前的方法[9](仅根据当前时刻的RFID识读来进行对象的位置推导),该改进后的方法除了支持处理RFID交叉读外,在对象位置推导准确性上也有明显提高,当识读率为50%时推导准确性的改善可达7%,如图7a所示.由于该方法放松了文献[9]中关于特殊阅读器事先已知并可用于直接确认对象包含的假设,并采用基于对象邻接边的概率熵的包含确认方法,在一定程度上抵消了对象位置推导结果的改善对于对象间包含关系推导的促进作用.因而,本文所提出的方法与文献[9]的方法在对象间的包含关系推导结果的准确性方面区别不是很明显,如图7a所示.需要注意的是,本实验中的交叉率为0.由于文献[9]方法并不能处理RFID交叉读问题,对于存在交叉读的场景其推导错误率将更高.

实验2:不同交叉率的影响.如图7b所示,对于常见RFID部署(识读率为[0.8,1],交叉率为[0,0.25]),两种推导的错误率都可以控制在10%以内.当交叉率增大时,两种推导的错误率都随之增加.过多的交叉读,会使得来自于最近阅读器的识读少于来自于交叉阅读器的识读,从而造成更多的位置推导错误,同时会使邻接节点的同位置信息中包含更多的噪声,使得用于包含关系确认的有效识读更少,从而导致了非常高的包含关系推导错误率,见图7b中位于顶部的曲线

(a)

变化识读率的影响

(b)变化交叉率的影响

图7 位置推导和包含关系推导的错误率

4.3 数据推导的效率

从处理速度和内存使用来评价本文所提出方法的性能.变化托盘的注入速率控制系统的吞吐量,变化托盘中包装箱个数以及模拟时间控制图模型中节点的规模.本实验采用2.33GHz的英特尔Xeon处理器与8GB内存且运行JVM1.6.0的Linux服务器,最大Java分配池为3GB.

实验3:处理速度.表1为不同节点规模的图的处理时间.随着节点数目的增加,每个时间周期(长度为1s)图更新代价和推导代价随之增大,而图更新和推导的代价都小于1s,其中推导代价的变化更为显著.结果表明,该数据推导方法可以有效应对海量RFID数据流的处理需求.

表1 图更新与推导的代价

节点数目更新代价/s推导代价/s总代价/s

25 344 0.00 256 0.07 080 0.07 336

54 915 0.00 684 0.15 617 0.16 301

75 275 0.00 967 0.22 159 0.23 126

95 049 0.01 203 0.29 139 0.30 342

135 509 0.01 557 0.43 624 0.45 181

154 893 0.01 656 0.50 930 0.52 586

174 923 0.01 689 0.58 413 0.60 102

 第12期 聂艳明,等:针对不确定射频识别数据流的改进概率推导方法

 http:∥www.jdxb.cn 

 http:∥www.j

dxb.cn 实验4:

内存使用.数据推导中内存使用由图模型中节点的规模所决定.如图8所示,内存使用随着用于修剪连接边所设定阈值的增大而变小.当阈值取0.5时,图的大小能够保持在700MB以下,此时节点数目可达175 000.当阈值设定为0.5和0.75时,内存的使用大致呈线性增长.同时我们也观察到,当设定的阈值不小于0.5时,修剪连接边对于位置推导错误率的影响并不显著,这对于内存严重不足的环境是可以接受的

图8 图拥有不同节点数时的内存使用变化

5 结 语

本文提出的RFID数据流的概率推导方法,采用了图模型并辅以历史RFID识读捕获对象的位置与包含,利用基于熵的方法估计对象最有可能的位置与包含.针对经过基于RFID时态信息的位置推导后仍为不确定的节点,

本文还采用了一种有效形成子图的方法,并利用空间关联信息来辅助不确定对象的位置推导.

实验结果表明,本文所提出的方法可获得较准确的数据推导结果,同时具有良好的执行效率.参考文献:

[1] RAO J,DORAISWAMY S,THAKKAR H,et 

al.Adeferred cleansing method for RFID data analytics[C]∥Proceedings of the 32nd International Conference onVery large Data Bases.Almaden,CA,USA:VLDBEndowment Inc.,2006:175-186.

[2] BAI Y,WANG F,LIU P.Efficiently filtering

 RFIDdata streams[C]∥Proceedings of the 1st InternationalVLDB Workshop on Clean Databases.Almaden,CA,USA:VLDB Endowment Inc.,2006:50-57.

[3] JEFFERY S,ALONSO G,FRANKLIN M,et al.A

pipelined framework for online cleaning

 of sensor datastreams[C]∥Proceedings of the 22nd InternationalConference on Data Engineering.Piscataway,NJ,USA:IEEE,2006:140.

[4] JEFFERY S,GAROFALAKIS M,FRANKLIN M.

Adaptive cleaning for RFID data streams[C]∥Pro-ceedings of the 32nd International Conference on VeryLarge Data Bases.Almaden,CA,USA:VLDB En-dowment Inc.,2006:163-174.

[5] 谷峪,

于戈,李晓静,等.基于动态概率路径事件模型的RFID数据填补算法[J].软件学报,2010,21(3):438-451.

GU Yu,YU Ge,LI Xiaojing,et al.RFID data inter-polation algorithm based on dynamic probabilistic path-event model[J].Journal of Software,2010,21(3):438-451.

[6] GU Yu,YU Ge,CHEN Yueg

uo,et al.EfficientRFID data imputation by analyzing the correlations ofmonitored objects[C]∥Proceedings of the 14th Inter-national Conference on Database Systems for AdvancedApplications.Berlin,Germany:Springer-Verlag

,2009:186-200.[7] 谷峪,

于戈,胡小龙,等.基于监控对象动态聚簇的高效RFID数据清洗模型[J].软件学报,2010,21(4):632-643.

GU Yu,YU Ge,HU Xiaolong,et al.Efficient RFIDdata cleaning model based on dynamic clusters of moni-tored objects[J].Journal of Software,2010,21(4):632-643.

[8] TRAN T,SUTTON C,COCCI R,et al.Probabilistic

inference over RFID streams in mobile environments[C]∥Proceedings of the 25th International Conferenceon Data Engineering.Piscataway,NJ,USA:IEEE,2009:1096-1107.

[9] COCCI R,TRAN T,DIAO Y,et al.Efficient data

interpretation and compression over RFID streams[C]∥Proceedings of the 24th International Conference onData Engineering.Piscataway,NJ,USA:IEEE,2008:1445-1447.

[10]EPCglobal Inc.EPC Tag 

data standard version 1.5[EB/OL].[2010-08-18].http:∥www.gs1.org/gsmp/kc/epcglobal/tds/tds_1_5-standard-20100818.p

df.(编辑 杜秀杰)

5西 安 交 通 大 学 学 报 第45卷 

数学建模案例分析—主成分分析的应用--概率统计方法建模

§8 主成分分析的应用 主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们尽可能多地包含原变量的信息(降维),从而使得用这几个新变量替代原变量分析问题成为可能。即在尽可能少丢失信息的前提下从所研究的m 个变量中求出几个新变量,它们能综合原有变量的信息,相互之间又尽可能不含重复信息,用这几个新变量进行统计分析(例如回归分析、判别分析、聚类分析等等)仍能达到我们的目的。 设有n 个样品,m 个变量(指标)的数据矩阵 (1)1112 1(2)21222()12m m n m n n n nm x x x x x x x x X x x x x ??? ?? ? ? ? ?== ? ? ? ? ????? 寻找k 个新变量12,,,()k y y y k m ≤ ,使得 1、1122,(1,2,,)l l l lm m y a x a x a x l k =+++= 2、12,,k y y y 彼此不相关 这便是主成分分析。主成分的系数向量12(,,,)l l l lm a a a a = 的分量lj a 刻划出第j 个变量关于第l 个主成分的重要性。 可以证明,若12(,,,)T m x x x x = 为m 维随机向量,它的协方差矩阵V 的m 个特征值为 120m λλλ≥≥≥≥ ,相应的标准正交化的特征向量为12,,,m u u u ,则 12(,,,)T m x x x x = 的第i 主成分为(1,2,,)T i i y u x i m == 。 称1 / m i j j λλ =∑为主成分(1,2,,)T i i y u x i m == 的贡献率, 1 1 /k m j j j j λλ ==∑∑为主成分 12,,k y y y 的累计贡献率,它表达了前k 个主成分中包含原变量12,,,m x x x 的信息量大 小,通常取k 使累计贡献率在85%以上即可。当然这不是一个绝对不变的标准,可以根据实 际效果作取舍,例如当后面几个主成分的贡献率较接近时,只选取其中一个就不公平了,若都选入又达不到简化变量的目的,那时常常将它们一同割舍。 计算步骤如下: 1、由已知的原始数据矩阵n m X ?计算样本均值向量12?(,,,)T m x x x x μ== ; 其中1 1(1,2,,)n i ij j x x i m n ===∑

概率波 不确定性关系

高中物理选修3-5同步练习试题解析 概率波 不确定性关系 1.有关光的本性的说法中正确的是( ) A .关于光的本性,牛顿提出了“微粒说”,惠更斯提出了“波动说”,爱因斯坦提出了“光子说”,它们都圆满地说明了光的本性 B .光具有波粒二象性是指:光既可以看成宏观概念上的波,也可以看成微观概念上的粒子 C .光的干涉、衍射现象说明光具有波动性,光电效应说明光具有粒子性 D .在光的双缝干涉实验中,如果光通过双缝时显示波动性,如果光只通过一个缝时显示粒子性 解析:牛顿主张的微粒说中的微粒与实物粒子一样,惠更斯主张的波动说中的波动与宏观机械波等同,这两种观点是相互对立的,都不能说明光的本性,所以A 、B 错,C 正确;在双缝干涉实验中,双缝干涉出现明暗均匀的条纹。当让光子一个一个地通过单缝时,曝光时间短时表现出粒子性,曝光时间长时表现出波动性,因此D 错误。 答案:C 2.关于物质波的认识,正确的是( ) A .电子的衍射证实了物质波的假设是正确的 B .物质波也是一种概率波 C .任何一个物体都有一种波和它对应,这就是物质波 D .物质波就是光波 解析:本题综合考查物质波概念,电子衍射图像的观测证明德布罗意关于物质波的假说是正确的,所以A 正确;只有运动的物质才有物质波与它对应,故C 错误;物质波与光波一样,也是一种概率波,即粒子在各点出现的概率遵循波动规律,但物质波不是光波,所以B 正确,D 错误;即正确选项是A 、B 。 答案:A 、B 3.以下说法正确的是( ) A .物体都具有波动性 B .抖动细绳一端,绳上的波就是物质波 C .通常情况下,质子比电子的波长长 D .核外电子绕核运动时,并没有确定的轨道 解析:任何物体都具有波动性,故A 对;对宏观物体而言,其波动性难以观测,我们 所看到的绳波是机械波,不是物质波,故B 错;电子的动量往往比质子的动量小,由λ=h p 知,电子的波长长,故C 错;核外电子绕核运动的规律是概率问题,无确定的轨道,故D 对。

初中数学-概率与统计

初中数学-概率与统计1将100个数据分成8个组,如下表: 组号 12345678 频数1114121313x1210则第六组的频数为() A. 12 B. 13 C. 14 D. 15 2. 10 位评委给一名歌手打分如下:9.73 , 9.66 , 9.83 , 9.89 , 9.76 , 9.86 , 9.79 , 9.85 , 9.68 , 9.74,若去掉一个最高分和一个最低分,这名歌手的最后得分是() A. 9.79 B. 9.78 C. 9.77 D. 9.76 3.某班50名学生期末考试数学成绩(单位:分)的频率分布条形图如图所示,其中数据不 在分点上,对图中提供的信息作出如下的判断:(1)成绩在49.5分?59.5分段的人数 与89.5分?100分段的人数相等;(2)成绩在79.5?89.5分段的人数占30% (3)成绩 在79.5分以上的学生有20人;(4)本次考试成绩的中位数落在69.5?79.5分段内,其 中正确的判断有() (第4题) 4?如图是九年级(2)班同学的一次体检中每分钟心跳次数的频数分布条形图(次数均为整数).已知该班只有5位同学的心跳每分钟75次,请观察图,指出下列说法中错误的是 () A.数据75落在第2小组 B .第4小组的频率为0.1 1 C.心跳为每分钟75次的人数占该班体检人数的—;D .数据75 一定是中位数 12 5. 在转盘游戏的活动中,小颖根据试验数据绘制出如图所示的扇形统计图,则每转动一 次转盘所获购物券金额的平均数是() 2 A. 22.5元 B. 42.5元 C. 56 -元 D.以上都不对 3 A. 4个 B. 3个 C. 2个 D. 1个

最新初中数学概率分类汇编

最新初中数学概率分类汇编 一、选择题 1.已知一个口袋中装有六个完全相同的小球,小球上分别标有1,2,5,7,8,13六个数,搅匀后一次从中摸出一个小球,将小球上的数记为m ,则使得一次函数y =(﹣m+1)x+11﹣m 经过一、二、四象限且关于x 的分式方程8x x π-=3x+88 x x -的解为整数的概率是( ) A . 12 B . 13 C . 14 D . 2 3 【答案】B 【解析】 【分析】 求出使得一次函数y=(-m+1)x+11-m 经过一、二、四象限且关于x 的分式方程 8 x x π-=3x+ 88x x -的解为整数的数,然后直接利用概率公式求解即可求得答案. 【详解】 解:∵一次函数y =(﹣m+1)x+11﹣m 经过一、二、四象限,﹣m+1<0,11﹣m >0, ∴1<m <11, ∴符合条件的有:2,5,7,8, 把分式方程 m 8x x -=3x+88 x x -去分母,整理得:3x 2﹣16x ﹣mx =0, 解得:x =0,或x =163 π +, ∵x ≠8, ∴ 163π +≠8, ∴m ≠8, ∵分式方程 8mx x -=3x+88 x x -的解为整数, ∴m =2,5, ∴使得一次函数y =(﹣m+1)x+11﹣m 经过一、二、四象限且关于x 的分式方程8 mx x -=3x+ 88 x x -的解为整数的整数有2,5, ∴使得一次函数y =(﹣m+1)x+11﹣m 经过一、二、四象限且关于x 的分式方程8 mx x -=3x+ 88 x x -的解为整数的概率为26=1 3;

故选:B. 【点睛】 本题考查了概率公式的应用、一次函数的图象与系数的关系以及分式方程的解,熟练掌握是解题的关键. 2.如图,在方格纸中,随机选择标有序号①②③④⑤中的一个小正方形涂黑,与图中阴影部分构成轴对称图形的概率是( ) A.1 5 B. 2 5 C. 3 5 D. 4 5 【答案】C 【解析】 【分析】 【详解】 解:根据题意,在方格纸中,随机选择标有序号①②③④⑤中的一个小正方形涂黑,共有5种等可能的结果,使与图中阴影部分构成轴对称图形的有②④⑤,3种情况,因 此可知使与图中阴影部分构成轴对称图形的概率为 3 35 5÷= 故选C 3.袋中有8个红球和若干个黑球,小强从袋中任意摸出一球,记下颜色后又放回袋中,摇匀后又摸出一球,再记下颜色,做了50次,共有16次摸出红球,据此估计袋中有黑球()个. A.15 B.17 C.16 D.18 【答案】B 【解析】 【分析】 根据共摸球50次,其中16次摸到红球,则摸到红球与摸到黑球的次数之比为8: 17,由此可估计口袋中红球和黑球个数之比为8: 17;即可计算出黑球数. 【详解】 ∵共摸了50次,其中16次摸到红球,∴有34次摸到黑球,∴摸到红球与摸到黑球的次 数之比为8: 17,∴口袋中红球和黑球个数之比为8: 17,∴黑球的个数8÷ 8 17 = 17(个),故答 案选B. 【点睛】 本题主要考查的是通过样本去估计总体,只需将样本"成比例地放大”为总体是解本题的关键.

非参数统计分析NonparametricTests菜单详解

非参数统计分析――Nonparametric Tests菜单详解 非参数统计分析――Nonparametric Tests菜单详解 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符

合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法 1、Two Independent Samples Test与 K Independent Samples Test 用于检验两独立样本/多独立样本所在总体是否相同。 Two-lndependent-Samples Test对话框: (1) Test Variable框,指定检验变量。 (2) Grouping Variable框,指定分组变量。Define Groups对话框,Groupl和Groupl后的栏中,可指定分组变量的值。 (3) TestType框,确定用来进行检验的方法。Mann-Whitney U:默认值,相当于两样本秩和检验。Kolmogorov-Smimov Z:K-S检验的一种。Moses extreme reactions:如果施加的处理使得某些个体出现 正向效应,而另一些个体出现负向效应,就应当采用该检验方法。

数学建模案例分析消费分布规律的分类概率统计方法建模

§7 消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类.数据见下表: 其中,X 1:人均粮食支出; X 2:人均副食品支出; X 3:人均烟、酒、茶支出; X 4:人均其它副食品支出; X 5:人均衣着商品支出; X 6:人均日用品支出; X 7:人均燃料支出; X 8:人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题.例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等. 这些问题可以用聚类分析方法来解决. 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q 型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R 型聚类法,使用的统计量是变量间的相似系数. 设共有n 个样品,每个样品i x 有p 个变量,它们的观测值可以表示为 n i x x x x pi i i i ,,2,1),,,,(21 == 一、样品间的距离 下面介绍在聚类分析中常用的几种定义样品i x 与样品j x 间的距离. 1、 Minkowski 距离 m m p k kj ki j i x x x x d 11 ][),(∑=-= 2、绝对值距离 ∑=-=p k kj ki j i x x x x d 1),( 3、欧氏距离 21 21][),(∑=-=p k kj ki j i x x x x d 二、变量间的相似系数 相似系数越接近1,说明变量间的关联程度越好.常用的变量间的相似系数有 1、 夹角余弦

高中物理-概率波、不确定性关系练习

高中物理-概率波、不确定性关系练习 A组 1.物理学家做了一个有趣的实验:在双缝干涉实验中,在光屏处放上照相底片,若减弱光波的强度,使光子只能一个一个地通过狭缝,实验结果表明,如果曝光时间不太长,底片上只出现一些不规则的点;如果曝光时间足够长,底片上就出现了规则的干涉条纹.对这个实验结果,下列认识正确的是() A.曝光时间不太长时,底片上只能出现一些不规则的点子,表现出光的波动性 B.单个光子通过双缝后的落点可以预测 C.只有大量光子的行为才能表现出光的粒子性 D.干涉条纹中明亮的部分是光子到达机会较多的地方 解析:曝光时间不太长时,底片上只能出现一些不规则的点子,表现出光的粒子性,选项A错误;单个光子通过双缝后的落点不可以预测,在某一位置出现的概率受波动规律支配,选项B错误;大量光子的行为才能表现出光的波动性,干涉条纹中明亮的部分是光子到达机会较多的地方,故选项C错误,D正确. 答案:D 2.以下说法正确的是() A.物体都具有波动性 B.抖动细绳一端,绳上的波就是物质波 C.通常情况下,质子比电子的波长长 D.核外电子绕核运动时,并没有确定的轨道 解析:任何物体都具有波动性,故A对;对宏观物体而言,其波动性难以观测,我们所看到的绳波是机械波,不是物质波,故B错;电子的动量往往比质子的动量小,由λ=知,电子的波长长,故C错;核外电子绕核运动的规律是概率问题,无确定的轨道,故D对. 答案:AD 3.电子的运动受波动性的支配,对于氢原子的核外电子,下列说法正确的是() A.氢原子的核外电子可以用确定的坐标描述它们在原子中的位置 B.电子绕核运动时,可以运用牛顿运动定律确定它的轨道 C.电子绕核运动的“轨道”其实是没有意义的 D.电子轨道只不过是电子出现的概率比较大的位置 解析:微观粒子的波动性是一种概率波,对于微观粒子的运动,牛顿运动定律已经不适用了,所以氢原子的核外电子不能用确定的坐标描述它们在原子中的位置,电子的“轨道”其实是没有意义的,电子轨道只不过是电子出现的概率比较大的位置,综上所述,选项C、D正确. 答案:CD 4.关于宏观物体和微观粒子的特性,下列说法正确的是() A.经典物理学中的粒子任意时刻有确定位置和速度以及时空中的确定轨道 B.在光的双缝干涉实验中,如果光通过双缝时显出波动性,那么光只通过一个缝时就显出粒子性 C.光学中某些现象表明光具有波动性,而某些现象又表明光具有粒子性,说明光有时是波,有时是粒子 D.经典物理的粒子模型和波动模型在微观世界变成了波粒二象性模型 解析:任意时刻的确定位置和速度以及时空中的确定轨道,这是经典物理学中粒子运动的基本特征,所以选项A正确;但经典的粒子模型和波动模型在微观世界变成了波粒二象性模型,选项D

初中数学概率初步知识点

概率初步知识点 1、事件类型 (1)确定事件 (a)必然事件:在一定的条件下重复进行试验时,在每次试验中必然发生的事件。如:太阳从东方升起;若a、b、c均为实数,则a(bc) = (ab)c。 (b)不可能事件:有的事件在每次试验中都不会发生,这样的事件叫做不可能事件。如:没有水分种子也能发芽。 (2)随机事件:在一定的条件下,可能发生也可能不发生的事件,称为随机事件。如:掷一次硬币正面朝上。 注意: (a)事件分为确定事件与不确定事件(随机事件)。确定事件又分为必然事件与不可能事件。 (b)事件一般用英文大写字母A、B、C、…表示。 2、事件的概率(probability) (1)事件的概率:对于一个,我们把刻画其发生可能性大小的数值,称为随机事件A发生的概率,记为P(A)。 (2)必然事件发生的概率为1,即P(必然事件) = 1。 (3)不可能事件发生的概率为0,即P(不可能事件) = 0。 (4)如果A为随机事件,那么0 < P(A) < 1。当事件发生的可能性越来越小时,P(A)接近0;当事件发生的可能性越来越大时,P(A)接近1。 (5)对于任意事件A,有0()1 P A ≤≤。 3、频率(frequency):事件实际发生次数与可能发生次数的比率。设在相同条 件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f n 。 如:掷均匀硬币的试验。 注意:前提是在一定的条件下重复进行试验。 注意:频率与概率的关系 (1)频率总是围绕概率上下波动;

(2)样本量n越大,波动幅度越小,频率越接近概率; (3)随着实验次数增至足够大,频率逐渐稳定于某一常数附近,则该常数为概率。 4、古典概型: 一种概率模型。如果一次试验中,有n种可能的结果,并且它们发生的可能性都 相等,事件A中包含其中的m种结果,那么事件A发生的概率为()m P A n 。如:掷一枚均匀的硬币,出现正面的概率。 注意:古典概型与频率的区别。 5、几何概型: 一种概率模型。如果每个事件发生的概率只与构成该事件区域的长度(面积或体积或度数)成比例,则称这样的概率模型为几何概率模型,简称为几何概型。 古典概型与几何概型的主要区别:试验的结果是无限个。 如:往下图中抛点,该点刚好落入四分之一圆内的概率。 6、用列举法求事件发生概率的常用方法 (1)穷举法:如果试验的结果较少,我们可以采用简单列举的方法,把所有的结果直接排列出来。 (2)列表法:当一次试验要涉及两个因素,并且可能出现的结果数目较多时,为了不重不漏地列出所有可能的结果,通常采用列表法。 (3)树状图法:当一次试验要涉及三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果,通常采用树状图法。 掷骰[读tóu]子试验

初中数学概率难题汇编

初中数学概率难题汇编 一、选择题 1.下列说法:①一组对边平行,另一组对边相等的四边形是平行四边形;②经过有交通信号灯的路口,遇到红灯是必然事件;③若甲组数据的方差是0.3,乙组数据的方差是0.1,则甲数据比乙组数据稳定;④圆内接正六边形的边长等于这个圆的半径,其中正确说法的个数是() A.1个B.2个C.3个D.4个 【答案】A 【解析】 【分析】 根据平行四边形的判定去判断①;根据必然事件的定义去判断②;根据方差的意义去判断③;根据圆内接正多边形的相关角度去计算④. 【详解】 一组对边平行,另一组对边相等的四边形也有可能是等腰梯形,①错误;必然事件是一定会发生的事件,遇到红灯是随机事件,②错误;方差越大越不稳定,越小越稳定,乙比甲更稳定,③错误;正六边形的边所对的圆心角是60 ,所以构成等边三角形,④结论正确.所以正确1个,答案选A. 【点睛】 本题涉及的知识点较多,要熟悉平行四边形的常见判定;随机事件、必然事件、不可能事件等的区分;掌握方差的意义;会计算圆内接正多边形相关. 2.一个盒子内装有大小、形状相同的四个球,其中红球1个、绿球1个、白球2个,小明摸出一个球不放回,再摸出一个球,则两次都摸到白球的概率是() A.1 2 B. 1 4 C. 1 6 D. 1 12 【答案】C 【解析】 【分析】 画树状图求出共有12种等可能结果,符合题意得有2种,从而求解.【详解】 解:画树状图得: ∵共有12种等可能的结果,两次都摸到白球的有2种情况,

∴两次都摸到白球的概率是: 21 126 =. 故答案为C. 【点睛】 本题考查画树状图求概率,掌握树状图的画法准确求出所有的等可能结果及符合题意的结果是本题的解题关键. 3.岐山县各学校开展了第二课堂的活动,在某校国学诗词组、篮球足球组、陶艺茶艺组三个活动组织中,若小斌和小宇两名同学每人随机选择其中一个活动参加,则小斌和小宇选到同一活动的概率是() A.1 2 B. 1 3 C. 1 6 D. 1 9 【答案】B 【解析】 【分析】 先画树状图(国学诗词组、篮球足球组、陶艺茶艺组分别用A、B、C表示)展示所有9种等可能的结果数,再找出小斌和小宇两名同学的结果数,然后根据概率公式计算即可.【详解】 画树状图为:(国学诗词组、篮球足球组、陶艺茶艺组分别用A. B. C表示) 共有9种等可能的结果数,其中小斌和小宇两名同学选到同一课程的结果数为3, 所以小斌和小宇两名同学选到同一课程的概率=31 93 =, 故选B. 【点睛】 本题考查的是用列表法或画树状图法求概率.列表法或画树状图法可以不重复不遗漏的列出所有可能的结果,列表法适合于两步完成的事件,树状图法适用于两步或两步以上完成的事件.用到的知识点为:概率=所求情况数与总情况数之比. 4.袋中有8个红球和若干个黑球,小强从袋中任意摸出一球,记下颜色后又放回袋中,摇匀后又摸出一球,再记下颜色,做了50次,共有16次摸出红球,据此估计袋中有黑球()个. A.15 B.17 C.16 D.18 【答案】B 【解析】 【分析】 根据共摸球50次,其中16次摸到红球,则摸到红球与摸到黑球的次数之比为8: 17,由此可估计口袋中红球和黑球个数之比为8: 17;即可计算出黑球数.

初中数学概率专题训练【含详细答案】

概率专题训练 一、填空题:(每题3分,共36分) 1、数 102030 中的 0 出现的频数为_____。 2、在一个装有 2 个红球,2 个白球的袋子里任意摸出一个球,摸出红球的可能性为__。3、不可能发生是指事件发生的机会为_____。 4、“明天会下雨”,这个事件是_____事件。(填“确定”或“不确定”) 5、写出一个必然事件:_______________。 6、10把钥匙中有 3 把能打开门,今任取出一把,能打开门的概率为_____。 7、抛掷两枚骰子,则P(出现 2 个 6)=_____。 8、小射手为练习射击,共射击60次,其中36次击中靶子,试估计小射手依次击中靶 9、小红随意在如图所示的地板上踢键子,则键子恰落在黑色方砖 的概率为_____。 10、足球场上,往往用抛硬币的方式来决定哪方先发球,请问这种做法 公平吗?_____ 11、小明有两件上衣,三条长裤,则他有几种不同的穿法_____。 12、小红、小张,在一起做游戏,需要确定的游戏的先后顺序,他们约定用“剪子,包袱,锤子”的方式确定,小红取胜的概率是_____。 二、选择题:(每题 4 分,共 24 分) 1、下列事件是必然发生的是() A、明天是星期一 B、十五的月亮象细钩 C、早上太阳从东方升起 D、上街遇上朋友2、有五只灯泡,其中两只是次品,从中任取一只恰为合格品的概率为() A、20% B、40% C、50% D、60% 3、抛掷一枚普遍的硬币三次,则下列等式成立的是() A、P(正正正)=P(反反反) B、P(正正正)=20% C、P(两正一反)=P(正正反) D、P(两反一正)=50% 4、一个口袋里有1个红球,2个白球,3个黑球,从中取出一个球,该球是黑色的。这个事件是() A、不确定事件 B、必然事件 C、不可能事件 D、以上都不对 5、在“石头、剪子、布”的游戏中,当你出“石头”时,对手与你打平的概率为() A、 B、 C、 D、 6、从A、B、C、D四人中用抽筌的方式,选取二人打扫卫生,那么能选中A、B的概率为() A、 B、 C、 D、 三、解答题:(每题 9 分,共 54 分) 1、一布袋中放有红、黄、白三种颜色的球各一,它们除颜色处其他都一个样,小明 从中摸出一个球后放回摇匀,再摸出一个球,请你利用树状图分析可能出现的情况。

数学建模案例分析3 随机性人口模型--概率统计方法建模

§3 随机性人口模型 如果研究对象是一个自然村落或一个家族人口,数量不大,需作为离散变量看待时,就利用随机性人口模型来描述其变化过程。 记 ()t Z —时刻t 的人口数(只取整数值) ()()()n t Z p t p n ==—人口为n 的概率 模型假设 1、在[]t t t ?+, 出生一人的概率与t ? 成正比,记作t b n ?,出生二人及二人以上的概 率为()t o ?; 2、在[]t t t ?+, 死亡一人的概率与t ? 成正比,记作t d n ?,死亡二人及二人以上的概率为()t o ?; 3、出生与死亡是相互独立的随机事件; 4、进一步设n b 和n d 均为与n 成正比,记,,n d n b n n μλ==λ和μ分别是单位时间内 1=n 时一个人出生和死亡的概率。 模型建立 由假设3~1,可知()n t t Z =?+可分解为三个互不相容的事件之和:()1-=n t Z 且t ?内出生一人;()1+=n t Z 且t ? 内死亡一人;()n t Z =且t ?内无人出生或死亡。按全概率公式 ()()()()t d t b t p t d t p t b t p t t p n n n n n n n n ?-?-+?+?=?+++--1)(1111 即 ()() ()()())(1111t p d b t p d t p b t t p t t p n n n n n n n n n +-+=?-?+++-- 令0→?t ,得关于()t p n 的微分方程 ()()()()t p d b t p d t p b dt dp n n n n n n n n +-+=++--1111 又由假设4,方程为 ()()()()()()t np t p n t p n dt dp n n n n μλμλ+-++-=+-1111 (1) 若初始时刻)0(=t 人口为确定数量0n ,则()t p n 的初始条件为 ()? ? ?≠== 00 ,0,10n n n n p n (2)

初中数学统计与概率知识点精炼

统计与概率 一、统计的基础知识 1、统计调查的两种基本形式: 普查:对调查对象的全体进行调查; 抽样调查:对调查对象的部分进行调查; 总体:所要考察对象的全体; 个体:总体中每一个考察的对象; 样本:从总体中所抽取的一部分个体; 样本容量:样本中个体的数目(不带单位); 平均数:对于n 个数12,,,n x x x ,我们把121()n x x x n +++ 叫做这n 个数的平均数; 中位数:几个数据按大小顺序排列时,处于最中间的一个数据(或是最中间两个数据的平均数)叫做中位数; 众数:一组数据中出现次数最多的那个数据; 方差:2222121()()()n S x x x x x x n ??=-+-++-?? ,其中n 为样本容量,x 为样本平均数; 标准差:S ,即方差的算术平方根; 极差:一组数据中最大数据与最小数据的差称为这组数据的极差; 频数:将数据分组后落在各小组内的数据个数叫做该小组的频数; 频率:每一小组的频数与样本容量的比值叫做这一小组的频率; ★ 频数和频率的基本关系式:频率 = —————— 各小组频数的总和等于样本容量,各小组频率的总和等于1; 扇形统计图:圆表示总体,扇形表示部分,统计图反映部分占总体的百分比,每个扇形的圆心角度数=360°× 该部分占总体的百分比; 会填写频数分布表,会补全频数分布直方图、频数折线图; 频数 样本容量 各 基 础 统 计 量 频 数 的 分 布 与 应 用 2、 3、

二、概率的基础知识 必然事件:一定条件下必然会发生的事件; 不可能事件:一定条件下必然不会发生的事件; 2、不确定事件(随机事件):在一定条件下可能发生,也可能不发生的事件; 3、概率:某件事情A 发生的可能性称为这件事情的概率,记为P(A); P (必然事件)=1,P(不可能事件)=0,0<P(不确定事件)<1; ★概率计算方法: P(A) = ———————————————— 例如 注:对于两种情况时,需注意第二种情况可能发生的结果总数 例:①袋子中有形状、大小相同的红球3个,白球2个,取出一个球后再取出一个球,求两个球都是白球的概率;P = 1 10 ②袋子中有形状、大小相同的红球3个,白球2个,取出一个球后放回 ..,再取出一个球,求两个球都是白球的概率;P = 4 25 1、确定事件 事件A发生的可能结果总数 所有事件可能发生的结果总数 运用列举法(常用树状图)计算简单事件发生的概率 …………

数学建模案例分析--概率统计方法建模9习题四

习题四 1、在一个人数很多的团体中普查某种疾病,为此要抽验N 个人的血,可以用两种方法进行。(1)将每个人的血分别检验,这就需要验N 次;(2)按k 个人一组进行分组,把从k 个人抽来的血混合在一起进行检验,如果这混合血液呈阴性反应,就说明这k 个人的血都呈阴性反应,这样,这k 个人的血就只需验一次。若呈阳性,则再对这k 个人的血分别进行化验。这样,k 个人的血总共要化验k+1次。假设每个人的血呈阳性的概率为p ,且这些人的试验反应是相互独立的。试说明当p 较小时,选取适当的k ,按第二种方法可以减少化验的次数。并说明当k 取什么值时最适宜? 2、人群中有健康人和病人两类,病人可以通过与健康人接触将疾病传染给健康人。任何两人之间的接触是随机的,当健康人与病人接触时是否被感染也是随机的。如果通过实际数据或经验掌握了这些随机规律,试估计平均每天有多少健康人被感染。 3、某商店要订购一批商品零售,设购进价1c ,售出价2c ,订购费0c (与数量无关)。随机需求量r 的概率密度为p(r),每件商品的贮存费为3c (与时间无关)。问如何确定订购量才能使商店的平均利润最大。这个平均利润是多少?为使这个平均利润为正值,需要对订购费0c 加什么限制? 4、若零件寿命服从指数分布,证明不存在预防性更换策略。又问,若失效率r(t)为减函数,是否会存在预防性更换策略? 5、用连续热轧方法制造钢材时要经过两道工序,第一道是粗轧(热轧),形成钢材的雏形;第二道是精轧(冷轧),得到规定长度的钢材。粗轧时由于设备,环境等方面随机因素的影响,钢材冷却后的长度大致上呈正态分布,其均值可以在轧制过程中由轧机调整,而其均方差则是由设备的精确度决定的,不能随意改变。精轧时把多出规定的部分切掉,但是如果发现粗轧后的钢材已经比规定长度短,则整根报废。精轧设备精度很高,可以认为轧出的成品材完全符合规定长度要求。根据轧制工艺的要求,要在成品材规定长度l 和粗轧后钢材长度的均方差σ已知的条件下,确定粗轧后的均值m ,使得当轧机调整到m 进行粗轧,再精轧后得到成品材时的浪费最少。 6、若上题中钢材粗轧后,长度在l l 与1之间时降级使用(比如经济价值上每一根降级材相当于α根成品材)。长度小于1l 才整根报废。试选用合适的目标函数建立优化模型,使某种意义下的浪费量最小。 7、某种水泥在凝固时放出的热量Y (卡/克)与其中的四种化学成分X 1,X 2,X 3,X 4有关,现有13个水泥样品的样本数据列于下表:

概率波 5 不确定性关系

4 概率波 5 不确定性关系 [先填空] 1.经典的粒子和经典的波 (1)经典的粒子 ①含义:粒子有一定的空间大小,有一定的质量,有的还带有电荷. ②运动的基本特征:遵从牛顿运动定律,任意时刻有确定的位置和速度,在时空中有确定的轨道. (2)经典的波 ①含义:在空间是弥散开来的. ②特征:具有频率和波长,即具有时空的周期性. 2.概率波 (1)光波是一种概率波:光的波动性不是光子之间的相互作用引起的,而是光子自身固定的性质,光子在空间出现的概率可以通过波动的规律确定,所以,

光波是一种概率波. (2)物质波也是概率波:对于电子和其他微观粒子,单个粒子的位置是不确定的,但在某点附近出现的概率的大小可以由波动的规律确定.对于大量粒子,这种概率分布导致确定的宏观结果,所以物质波也是概率波. [再判断] 1.经典粒子的运动适用牛顿第二定律.(√) 2.经典的波在空间传播具有周期性.(√) 3.经典的粒子和经典的波研究对象相同.(×) 4.光子通过狭缝后落在屏上明纹处的概率大些.(√) 5.电子通过狭缝后运动的轨迹是确定的.(×) [后思考] 1.对于经典的粒子,如果知道其初始位置和初速度,能否确定其任意时刻的位置和速度? 【提示】能.经典粒子的运动规律符合牛顿运动定律,其运动轨迹也是可以确定的,因此,某时刻的位置和速度也可以确定. 2.是否可以认为光子之间的相互作用使它表现出波动性? 【提示】不可以.实验说明:如果狭缝只能让一个光子通过,曝光时间足够长,仍然能得到规则的干涉条纹,说明光的波动性不是光子之间相互作用引起的,是光子本身的一种属性. [合作探讨] 在光的双缝干涉实验中,设法控制入射光的强度,使光子一个一个地通过狭缝,经过不同的时间相继得出如图17-4-1光子在胶片上的分布图片. 图17-4-1 探讨1:图甲说明什么问题?

人教版初中数学概率知识点

人教版初中数学概率知识点 一、选择题 1.用2、3、4三个数字排成一个三位数,则排出的数是偶数的概率为( ) A.1 2 B. 1 4 C. 3 5 D. 2 3 【答案】D 【解析】 【分析】 首先利用列举法可得:用2,3,4三个数字排成一个三位数,等可能的结果有:234,243,324,342,423,432;且排出的数是偶数的有:234、324、342、432,然后直接利用概率公式求解即可求得答案 【详解】 解:∵用2,3,4三个数字排成一个三位数,等可能的结果有:234,243,324,342,423,432; ∵排出的数是偶数的有:234、324、342、432; ∴排出的数是偶数的概率为:4 6 = 2 3 . 【点睛】 此题考查了列举法求概率.用到的知识点为:概率=所求情况数与总情况数之比. 2.太原是我国生活垃圾分类的46个试点城市之一,垃圾分类的强制实施也即将提上日程根据规定,我市将垃圾分为了四类可回收垃圾、餐厨垃圾有害垃圾和其他垃圾现有投放这四类垃圾的垃圾桶各1个,若将用不透明垃圾袋分类打包好的两袋不同垃圾随机投进两个不同的垃圾桶,投放正确的概率是() A.1 6 B. 1 8 C. 1 12 D. 1 16 【答案】C 【解析】 【分析】 根据题意,由列表法得到投放的所有结果,然后正确的只有1种,即可求出概率.【详解】 解:由列表法,得:

∴共有12种等可能的结果数,其中将两包垃圾随机投放到其中的两个垃圾箱中,能实现对应投放的结果为1种, ∴投放正确的概率为: 1 12 P=; 故选择:C. 【点睛】 本题考查了列表法与树状图法求概率,解题的关键是正确求出所有等可能的结果数. 3.一个布袋里放有红色、黄色、黑色三种球,它们除颜色外其余都相同,红球、黄球、黑球的个数之比为5:3:1,则从布袋里任意摸出一个球是黄球的概率是() A.5 9 B. 1 3 C. 1 9 D. 3 8 【答案】B 【解析】 分析:用黄球所占的份数除以所有份数的和即可求得是黄球的概率.详解:∵红球、黄球、黑球的个数之比为5:3:1, ∴从布袋里任意摸出一个球是黄球的概率是 31 = 5+3+13 . 故选:B. 点睛:此题考查了概率公式的应用.注意用到的知识点为:概率=所求情况数与总情况数之比. 4.从﹣1、2、3、﹣6这四个数中任取两数,分别记为m、n,那么点(),m n在函数6 y x =图象的概率是() A.1 2 B. 1 3 C. 1 4 D. 1 8 【答案】B 【解析】 【分析】 根据反比例函数图象上点的坐标特征可得出mn=6,列表找出所有mn的值,根据表格中mn=6所占比例即可得出结论. 【详解】

粒子的波动性 概率波 不确定性关系

粒子的波动性 概率波 不确定性关系 一、光是什么? 1、光是一种电磁波,有波长和频率 c =νλ 2、不同颜色的光在真空中传播速度都相同,等于c 3、不同颜色的光频率不同。光的颜色(频率)由光源来决定,在不同介质中传播时波速会变,但频率不变。 4、不同颜色的光在同一种介质中传播速度不相同,频率大的速度小。 二、光电效应 1、光电效应:当光线照射在金属表面时,金属中有电子逸出的现象,称为光电效应。逸出的电子称为光电子。 光电子定向移动形成的电流叫光电流. 2、光电效应实验规律 (1)存在饱和电流:光照不变,增大U AK ,G 表中电流达到某一值后 不再增大,即达到饱和值。 因为光照条件一定时,K 发射的电子数目一定。 实验表明:入射光越强,饱和电流越大,单位时间内发射的光电子数越 多。 (2)存在遏止电压和截止频率 存在遏止电压U C :使光电流减小到零的反向电压,若速度最大的是 v c ,则c 22 1eU v m c e = 实验表明:对于一定颜色(频率)的光,无论光的强弱如何,遏止电 压是一样的。光的频率改变,遏止电压也会改变。 存在截止频率c ν:经研究后发现,对于每种金属,都有相应确定的 截止频率c ν(极限频率)。 当入射光频率ν>c ν时,电子才能逸出金属表面; 当入射光频率ν< c ν时,无论光强多大也无电子逸出金属表面。 (3)具有瞬时性 实验结果:即使入射光的强度非常微弱,只要入射光频率大于被照金属的截止频率,电流表指针也几乎是随着入射光照射就立即偏转。 更精确的研究推知,光电子发射所经过的时间不超过10 -9秒(这个现象一般称作“光电子的瞬 时发射”)。

最新初中数学概率解析

最新初中数学概率解析 一、选择题 1.从﹣4,﹣3,﹣2,﹣1,0,1,3,4,5这九个数中,随机抽取一个数,记为a ,则数 a 使关于x 的不等式组()124212 2123 x a x x ?--≤???-?<+??至少有四个整数解,且关于x 的分式方程 2 33 a x x x ++--=1有非负整数解的概率是( ) A . 29 B . 13 C . 49 D . 59 【答案】C 【解析】 【分析】 先解出不等式组,找出满足条件的a 的值,然后解分式方程,找出满足非负整数解的a 的值,然后利用同时满足不等式和分式方程的a 的个数除以总数即可求出概率. 【详解】 解不等式组得:7x a x ≤??>-? , 由不等式组至少有四个整数解,得到a≥﹣3, ∴a 的值可能为:﹣3,﹣2,﹣1,0,1,3,4,5, 分式方程去分母得:﹣a ﹣x+2=x ﹣3, 解得:x = 52 a - , ∵分式方程有非负整数解, ∴a =5、3、1、﹣3, 则这9个数中所有满足条件的a 的值有4个, ∴P = 49 故选:C . 【点睛】 本题主要考查解一元一次不等式组,分式方程的非负整数解,随机事件的概率,掌握概率公式是解题的关键. 2.太原是我国生活垃圾分类的46个试点城市之一,垃圾分类的强制实施也即将提上日程根据规定,我市将垃圾分为了四类可回收垃圾、餐厨垃圾有害垃圾和其他垃圾现有投放这四类垃圾的垃圾桶各1个,若将用不透明垃圾袋分类打包好的两袋不同垃圾随机投进两个不同的垃圾桶,投放正确的概率是( )

A.1 6 B. 1 8 C. 1 12 D. 1 16 【答案】C 【解析】 【分析】 根据题意,由列表法得到投放的所有结果,然后正确的只有1种,即可求出概率. 【详解】 解:由列表法,得: ∴共有12种等可能的结果数,其中将两包垃圾随机投放到其中的两个垃圾箱中,能实现对应投放的结果为1种, ∴投放正确的概率为: 1 12 P ; 故选择:C. 【点睛】 本题考查了列表法与树状图法求概率,解题的关键是正确求出所有等可能的结果数. 3.如图,在方格纸中,随机选择标有序号①②③④⑤中的一个小正方形涂黑,与图中阴影部分构成轴对称图形的概率是( ) A.1 5 B. 2 5 C. 3 5 D. 4 5 【答案】C 【解析】 【分析】 【详解】 解:根据题意,在方格纸中,随机选择标有序号①②③④⑤中的一个小正方形涂黑,共有5种等可能的结果,使与图中阴影部分构成轴对称图形的有②④⑤,3种情况,因

数学建模案例分析5化妆品销售量的预测--概率统计方法建模

数学建模案例分析5化妆品销售量的预测--概率统计方法建模

§5 化妆品销售量的预测 某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数 x和人均收入2x。数据见下表: 1

要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入),(2 1 x x 时,能够预测在这个 城市的销售量。 这个问题本质上就是多元线性回归模型,如果随机变量Y 与固定变量m x x x ,,,2 1 之间有显著的线性相 关关系,即 ) ,0(~,222110σεεN x b x b x b b Y m m +++++= 称为m 元线性回归模型。 一、 模型中的参数估计 设通过实验或历史资料得到观测数据 ) ,,2,1(),,,,,(21n i x x x y im i i i =。令 ???? ? ? ? ??=??????? ? ?=??????? ??=m nm n n m m n b b b B x x x x x x x x x X y y y Y 102 1222 21 1121121,111, 由最小二乘估计,得 Y X X X B T T 1)(?-= 称m m x b x b x b b y ?????22110 ++++= 为变量Y 关于变量m x x x ,,,2 1 的线 性回归方程。 同样还可以得到2 σ的估计量为 ∑=---=n i i i y y m n 122 )?(11 ?σ 这里),,2,1(?????22110n i x b x b x b b y im m i i i =++++=。 二、回归模型的显著性检验

相关文档
相关文档 最新文档