文档库 最新最全的文档下载
当前位置:文档库 › 行为识别国内外现状

行为识别国内外现状

行为识别国内外现状
行为识别国内外现状

1.原始视频的特征提取

(1)光流场

光流场是空间运动物体在观测成像面上像素运动的瞬时速度。它利用图像序列中的像素强度数据的时域变化和相关性来研究图像的灰度在时间上的变化与场景巾物体结构及其运动的关系。光流法通常假设相邻帧的图像差异非常小,从而获取对真实运动场的近似估计【31。它不用预知任何先验知识,即能提供有关运动速度及图像中运动区域的简洁描述,适用于摄像机运动的情形。但光流法易受噪声及光照变化的影响,且计算较为复杂,很难用于实时的视频监控系统。

(2)点轨迹

目标的运动轨迹也可以作为特征,从而大致推断出目标运动所属的行为类别。但图像平面上的轨迹对平移、旋转和缩放等变换比较敏感,因此在大多情形下,此特征显得不够可靠。常用的替代特征表达有轨迹速度、时空曲率等【4,51。运动轨迹的获取比较依赖于精确的跟踪算法。从原始视频中提取点轨迹特征同样容易受到噪声、遮挡及混乱背景等的影响。

(3)人体形状表达

在摄像机固定的情形下,假设背景已知,通过背景剪除法可以很容易得到运动人体形状。基于全局、边界及骨架等的描绘子都可以用来表达人体形状。全局方法16,71如剪影、矩等是在整体形状区域内计算描绘子,而边界方法仅考虑形状轮廓【8l,骨架i方法则是用一组lD骨架曲线代表一个复杂的人体形状,比如中轴变换[91等。

(4)滤波器响应

空时滤波器响应是一个广义上的分类。Zhang等【lo】存时间轴上计算高斯导数,将滤波器响应较高的区域作为运动区域。LaptevI¨1利用一组空时高斯导数滤波器将Harris角点检测扩展应用于三维的视频数据从而检测出空时兴趣点。这类方法大都基于简单的卷积操作,运算快速而简便。当视频分辨率较低的情形下,提取光流或剪影特征较为困难,利用滤波器响应特性可以从视频数据中提取有效的底层特征。

2.低层特征的描述与识别

我们将低层特征的描述与识别方法分为三类①:非参数方法、空时体方法和参数时序法,分别对现有方法进行归类,并作一个简短的综述。

2.1非参数方法

(1)模板匹配法

这类方法需要对每种行为的特征建立相应的模板,将获取的特征数据与模板相匹配,通过计算两者之间的相似度进行识别。Polana和Nelson[4刀将整个序列分解为多个周期行为,利用二维网格特征识别各种行为。Bobick和Davis[391将图像序列转换为运动能量图像(膨酣)和运动历史图像(朋m)模板,MEI反映运动覆盖的范围及强度,而MHI反映运动在时间上的变化情况。Weinland等【拍】提出运动历史体积(MHV)模板,从多个视角重建目标并将其投影到圆柱坐标系,提取Fourier变换特征以描述行为。Wang和Suter[451也将整个行为过程融合为基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(彳^扭)两个模板。模板匹配法计算复杂度低、实现简单,但它本身无法描述动态系统,也不能完全反映数据在空问上的分布属性,具有一定的局限性。而且不同行为之间执行速率的不同、噪声、光照等因素都会影响模板匹配的准确性。

(2)目标建模法

行为可以通过建立人体动态表观模型进行描述。常见的人体模型有棍图模型【109]、2D模型例及3D模型51。3D人体建模是最常用的人体结构表征方法,通过跟踪人体模型中主要关节点的坐标、关节之间的角度、关节点运动的速度及角速度可以分析人体各种行为。3D模型包含深度信息,因此它能够有效解决自遮挡和自碰撞问题。行为本身也可以看成是一个3D空时目标,如Mahmood等【1刁在联合X.Y-T空间将整个行为表示为圆柱体模型。Yalmaz和Shahll31将跟踪获得的人体2D轮廓堆叠成联合X.Y-T空间中的目标,这种表达同时刻画了人体表观及动态运动特性。从X.Y玎空问的表达中提取的各种几何特征,如峰、凹点、谷及脊等,可以作为目标表面的捕述,但它需要建立序列帧点与点之间的对应关系。Gorelick等【6】采用背景剪除后的二值剪影替代人体轮廓,构造出X.Y-T空间一上的空时目标,虽然它不需要建立序列l;!!ji之间轮廓点之间的对应关系,但仅适用于摄像机固定的情形。

(3)流形学习法

行为识别中所处理的视频数据处于三维空间,若将序列中每帧图像转换为向量并按时序排列构成矩阵处理,将会遭遇“维数灾难”,同时也会引起小样本问题。而流形学习方法假设数据均匀采样J:高维欧氏空间中的低维流彤,从高维采样数据中恢复低维流形结构,并求出相应的嵌入映射,以实现降维。它可分为线性方法及非线性方法。线性流形学习假设数据位于线性空问,包括PCA、ICA等方法。但在实际情形下,数据并非位于线性空间,需要从大量样本中学习流形的内部几何结构。非线性流形学习方法大体分为两类,一类基于全局方法,如等距映射(届∞纠尸),计算每一个数据点与其他数据点关系而建立全连接图。另一类方法基于局部,即考虑每个数据点与它邻域内的点的关系,定义图中的边及其权重,如拉普拉斯特征映射。一些非线性方法的线性近似,如Lppt48,108l,加入类别信息的流形方法如LSTDE[491,可以直接求得投影矩阵用于解决新样本的低维嵌入问题。流形学习方法可用于行为分析中原始数据的降维,采用NN/kNN、SVM 及Boosting等方法对低维空间中的特征数据进行分类可以识别不同行为。

2.2空时体方法

(1)空时滤波法

视频数据可以看成由每帧图像按时序构成的空时体,具有三维空时结构的滤波器可以用来描述视频数据的空时特性,进而提取行为特征。Chomat和Crowley/¨1从视频中分割出不同的空时体,用方向和空间上的不同尺度及时问上的单一尺度构成的Gabor滤波器组在每个像素点上计算局部表观模型,通过每帧中单个像素点概率空间的平均值对行为进行识别。为了适应不同的执行速率,Manor等f”】在时间上的不同尺度得到空时梯度表示的归一化局部直方图,并使用卡方距离度量它与存储模板之间的相似度。滤波器方法虽然实现简单,但在实际应用中,滤波器的合适带宽并非先验已知,需要不同空间和时间尺度上的滤波器组获取其动态行为,且每个滤波器产生的响应与输入体的维数相同,因此这种方法必须付出较高的计算代价。

(2)基于部分的方法

视频数据可以看成是局部的集合,其中每个子部分都包含着明显的运动模式。Laptev[111将Harris角点检测器扩展到空时表示形式,在不同级别的尺度上计算空时梯度,由每个点及其邻域内的梯度信息产生空时二阶矩的估计,从而提取局部特征。Dollar等fl 61在训练数据中的空时兴趣点上提取空时梯度,采用K 均值聚类方法获取特征原型,对视频体进行建模。Niebles掣"1从包含空时兴趣点的子体积中提取特征并聚类乍成Bag.of-Words模型,采用SVMs识别各种行为。不同的行为可能包含相似的空时子部分,而子部分之间的几何关系却各不相同。但以上这些方法都不能对局部的全局几何进行建模,在不同行为之间可能造成歧义性。Boiman等f18】和Wong掣1叨将全局几何引入到基于部分的视频体表示,将其看成是各子部分的星群。当子部分数目较多时,这种方法的计算量也会相应地增大。Song等1201采用三角化的方法逼近星群之问的连接关系,从而解决计算花费偏高的问题。Niebles和Li[2”提出一个层级模型,其中较高的层级是各部分的星群,星群中的各部分则由低层Bag.of-Features构成。基于部分的方法大多需要基于空时兴趣点提取梯度或强度特征,在比较平滑的运动中,兴趣点十分稀疏,在行为本身不连续或视频质量不高的情形下,梯度或强度特征也显得不够可靠。

(3)分体匹配法

分体匹配法一般通过匹配输入视频体与三维模板分体之间的相似度从而对人体

行为进行分析。与基于部分的方法不同,它不需要在不同尺度空问中获取行为特征,而是直接判断其所包含的局部空时片段(Local Spatio.Temporal Patches)之间的运动相似度来寻求匹配。然而,从视频体分割出分体再进一步得到空时片段,反复地匹配空时片段之间的相似度,同样也会产生巨大的计算花费。Shechtman和Irani[221通过发掘空时运动之间的相关性实现未知行为数据与模板之间的匹配。Ke掣241通过空间观上的像素点聚类得到分体,分体是空间上的连续区域,而视频体可以看成是任意形状分体的集合。给定的一段视频被重复分割成多个分体,将每个分体区域与已知行为的模板相匹配,寻找与模板达到最大匹配的最少分体的集合。Yuan等【5I】利用基于贝叶斯的互信息最大化方法将提取的空时兴趣点根据其所属的行为类别按正/负投票输出,行为检测即是寻

找包含最大投票输出值的分体。分体匹配法容易受到背景变化的影响,但对噪声及遮挡等干扰因素则具有一定征【23】,则可降低这类方法对表观变化的敏感性。

(4)基于张量的方法

将行为表示为三维空时体,则可以很自然地作为一个三阶张量,其中两维表示空间,另一维表示时间。传统的视频处理方法需要将视频中人体行为所在的每帧图像转为向量并按时问顺序堆叠成矩阵处理,由于矩阵的向量由图像转换而来,一般具有很高的维数,以100x120大小的图像为例,对应于矩阵中的向量为12000维。与这种传统表示相比,张量以自然地形式表示数据,既避免造成了维数灾难,又保留了视频数据内部图像的窄问结构信息。Kim等【25】将典型性相关分析(CCA)扩展应用到三阶张量情形,实现测试行为与已知类别行为之间相关性的直接度量。Vasilescu[261将行为类别、人的身份及关节轨迹分别作为张量独立的一维,构成高阶(三阶或三阶以上)张量,张量分解为对应的模式则可得到行为类别或行为者的身份。Wblf等[27】把Low.Rank SVM扩展到张量空间并用于行为识别。当然,张量方法也可与其它方法相结合,如凌等【521采用Tensor PCA、Tensor LPP及有监督的Tensor LPP获取行为的低维特征表示,进而通过最近邻方法识别各种不同行为。基于张量的方法不需要中间层表示,比如部分、分体等,直接在行为之间实现整体匹配。其它特征如光流场、空时滤波响应等也可加入到张量框架中,作为张量空间中任何独立的一维构成高阶张量,以增强不同行为之问的可辨识度。

2.3参数时序方法

非参数方法和空时体方法一般用于识别简单行为固,而参数时序法则更适用于复杂行为,如芭蕾舞视频中的旋转动作,交响乐中的指挥手势等。

(1)隐马尔可夫模型(删)

隐马尔可夫模型能够匹配时变数据,是一种比较常用的状态空问法。它涉及训练和分类两个阶段。训练阶段指定模型的隐藏状态数,优化相应的状态转换和输m 概率,便于产生与特定行为特征相对应的输出类别符号。分类阶段需要计算HMM 对应于行为特征的不同测试符号的概率。Yamato等【281对每个行为类别的前景图像序列建模,能够识别击球、拦网等网球动作。随后,HMM也被广泛用于手势识别‘29'301。场景中一般存在着交互式行为,但HMM的结构导致它只能为单一的动态过程建模,为解决此问题,Brand等【31】提出耦合隐马尔可夫模型(CoupledHMM)为多个交互的动态过程进行建模,可以将多个动态过程的特征空问分解,减少状态个数并降低了算法复杂度。Honggeng和Nevatial321将状态间隔的先验置信度引入HMM,提出半监督隐马尔可夫模型(Semi-supervisedHMM)。Nguyen等【33】采用分层隐马尔可夫模型(Hierarchical删)分析长时间内的人体行为,能够更 HMM具有很强的泛化能力,可以用于时序数据的建模,在行为单元起止时间未知的情形下,HMM同样适用。但HMM只能识别预先定义的行为,

其内部状态转移矩阵和观测模型中参数估计的复杂度随目标个体的数目增加呈指数型增长。

(2)线性动态系统(三D.S)

线性动态系统是HMM的一般形式,状态空间不必受限于符号的有限集合,可以扩展到状态空间中的连续数值。更准确地说,LDS是带高斯观察模型的HMM在连续状态空间上的泛化。Vaswani等【34】将连续状态空间下的HMM用于检测异常行为。Cuntoor和Chellappa/351将视频分成小段,假定每段的目标动力(Dynamics ofObjects)为线性,以缩影(Epitomic)的方式对行为进行建模。和HMM一样,LDS 也是时不变模型,不适用于非平稳行为的识别。

(3)非线性动态系统

HMM和LDS是非常有效的建模工具,但它们只限用于线性平稳的动力中。假设一个人弯腰捡起东西放到附近的桌子上再在椅子上休息,这一行为包含一系列的片段,每个片段都必须使用LDS建模。整个过程即在不同的LDSs之间切换,生成切换线性动态系统(Switching LDS)。SLDS带有切换函数,通过控制模型参数在不同的LDSs之间进行切换。Bregler[蚓提出一种多层SLDS方法识别复杂的行为。North等f37】用离散成分表示连续的状态向量,构成一个混合状态,每个离散成分表示运动的模式,即切换的一种状态。对于每个切换状态,采用高斯自回归模型表示其动力,利用最大概率化方法学习得到每种行为的模型参数。Pavlovic 和Rehg[38】对非线性运动建模,动力由LDS建模,切换过程采用概率有限状态机建模。与LDS及HMM相比,SLDS的行为描述和建模能力更强,但SLDS的学习和推理都十分复杂,一般都采用近似的方法,且切换状态的个数也很不确定,需要大量的训练数据和繁琐的手工调参。

国内外相关研究现状综述知识分享

1.2 国内外相关研究现状综述 1.2.1国外研究综述 1)人力资源外包 Lever觉得外包是一种管理策略,将非核心业务委托给外部专家执行,使公司能专注于本身核心业务发展,以提高竞争优势[3]。而人力资源管理外包,则是一种特殊的外包形式。greer认为,外包是由外部伙伴在重复基础上从事原来由企业内部从事的人力资源任务[4]。 对于人力资源外包,许多国外学者认为,对许多企业来说,外包浪潮的兴起并不意味着一定要实行人力资源管理外包,人力资源管理的实践性很强,往往对适合的企业才最好。 在总结外包优势的基础上,Rodriguez和Carlos指出与专业的雇佣组织签订合同来处理企业的人力资源职能是一个可变的结论,专业雇佣组织可以与他的顾客建立一个雇佣合作关系。Greet认为有五项竞争因素使企业将人力资源部分或是全部外包,分别是企业精简、快速成长或衰退、全球化、竞争增加以及企业再造,而在这些竞争因素背后的根本因素其实就是降低成本与增加人力资源的服务品质。 关于人力资源外包的风险,Quelin认为一个是企业在外包过程中对外包商的过分依赖,他们认为外包后企业就不用再过问这部分工作了,全部由外包商负责就行,很少进行沟通。另外一个是外包商的工作效率及能力不能达到既定目标,影响组织绩效的完成,把工作交给外包商后,企业失去了对这部分工作的控制,至少不能完全控制,于是当外包商的能力及效率不能达到原来期望的时候,就会影响企业的整体绩效。Bahli,Bouchaib等根据交易成本的观点,归纳了外包所具有的风险带来的不确定性有以下两点:交易的不确定性;委托的不确定性和所提供服务的不确定性。 以上研究表明国外的人力资源外包相关研究大多集中在外包决策、外包作用与外包风险上。主要关注的是企业人力资源外包在实际运用中的可行性与实践中的问题。在人力资源外包中引入信任的研究不多。国外学者对信任的研究集中在信任的作用、类型与建立上。这里只摘录其中的一部分。 2)信任 梅耶、戴维斯、斯库尔曼认为:信任是指一方在有能力监控或控制另一方的情况下,宁愿放弃这种能力而使自己处于弱点暴露、利益有可能受到对方损害的状态。Sabel认为:“相互信任就是合作各方坚信,没有一方会利用另一方的脆弱点去获取利益。”胡孔河将信任定义为:在一定情境下,一方凭借自己对对方的

人脸识别技术的应用背景及研究现状

1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面: (1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:

2019年我国人脸识别技术发展情况及发展趋势综合分析

2019年我国人脸识别技术发展情况 及发展趋势综合分析 2019年2月14日 一、全球生物识别细行业市场占比情况分析 生物识别指的是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段相结合,利用人体固有的生理特性来进行个人身份鉴定技术。按不同的识别方式,生物识别可分为指纹识别、虹膜识别、语音识别、静脉识别和人脸识别。 伴随着生物识别产品逐渐从单一的PC处理转变为分布式计算。 用独立的前端独立设备来完成生物特征的采集、预处理、特征提取和比对,通过中心PC或服务器完成与业务相关的处理。随着生物特征 识别技术的不断发展和提高,生物特征识别技术的应用场景不断拓展,预计2015-2020年全球生物识别细分行业复合增长率分别为:人脸识别复合增长率为167%;语音识别为100%;虹膜识别为100%;指纹识别复合增长率为73%。

全球生物识别细行业市场占比情况 二、中国人脸识别技术发展情况分析 1、中国人脸识别行业发展历程 人脸识别技术在中国的发展起步于上世纪九十年代末,经历了技术引进-专业市场导入-技术完善-技术应用-各行业领域使用等五个阶段。其中,2014年是深度学习应用于人脸识别的关键一年,该年FaceBook发表一篇名为“DeepFace系统:达到肉眼级别的人脸识别系统”(翻译名),之后Face++创始人印奇团队以及香港中文大学汤晓鸥团队均在深度学习结合人脸识别领域取得优异效果,两者在LFW数据集上识别准确度均超过了99%,而肉眼在该数据集上的识别准确度仅为97.52%,可以说深度学习技术让计算机人脸识别能力超越人类的识别程度。

人脸识别与其他生物识别方式相比,优势在于自然性、不被察觉性等特点。自然性即该识别方式同人类进行个体识别时所利用的生物特征相同。指纹识别、虹膜识别等均不具有自然性。不被察觉的特点使该识别方法不易使人抵触,而指纹识别或虹膜识别需利用电子压力传感器或红外线采集指纹、虹膜图像,在采集过程中体验感不佳。目前人脸识别需要解决的难题是在不同场景、脸部遮挡等应用时如何保证识别率。此外,隐私性和安全性也是值得考虑的问题。 2、3D人脸识别与2D人脸识别数据对比 目前,国内的人脸识别技术已经相对发展成熟,该技术越来越多的被推广到安防领域,延伸出考勤机、门禁机等多种产品,产品系列达20多种类型,可以全面覆盖煤矿、楼宇、银行、军队、社会福利 保障、电子商务及安全防务等领域,人脸识别的全面应用时代已经到来。 中游人脸识别技术的进步,是推动下游场景应用拓展的关键所在。目前,人脸识别市场的解决方案主要包括2D识别、3D识别技术。市场上主流的识别方案是采用摄像头的2D方案,但由于人的脸部并非 平坦,因此2D识别在将3D人脸信息平面化投影的过程中存在特征信息损失。3D识别使用三维人脸立体建模方法,可最大程度保留有效 信息,因此3D人脸识别技术的算法比2D算法更合理并拥有更高精度。

2020年公需课考试-人工智能技术及其发展趋势(100分)

单选题 1.()是自然语言处理的重要应用,也可以说是最基础的应用。(3.0分) A.文本识别 B.机器翻译 C.文本分类 D.问答系统 我的答案:C√答对 2.(),中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。( 3.0分) A.2018年3月15日 B.2018年10月31日 C.2018年12月31日 D.2019年1月31日 我的答案:B√答对 3.()是通过建立人工神经网络,用层次化机制来表示客观世界,并解释所获取的知识,例如图像、声音和文本。(3.0分) A.深度学习 B.机器学习 C.人机交互 D.智能芯片 我的答案:A√答对 4.生物特征识别技术不包括()。(3.0分) A.体感交互 B.指纹识别 C.人脸识别 D.虹膜识别 我的答案:A√答对 5.()是指直接通过肢体动作与周边数字设备和环境进行交互。(3.0分) A.体感交互 B.指纹识别 C.人脸识别 D.虹膜识别 我的答案:A√答对 6.下列对人工智能芯片的表述,不正确的是()。(3.0分) A.一种专门用于处理人工智能应用中大量计算任务的芯片 B.能够更好地适应人工智能中大量矩阵运算 C.目前处于成熟高速发展阶段 D.相对于传统的CPU处理器,智能芯片具有很好的并行计算性能 我的答案:C√答对

7.下列选项中,不属于生物特征识别技术的是()。(3.0分) A.步态识别 B.声纹识别 C.文本识别 D.虹膜识别 我的答案:C√答对 8.立体视觉是()领域的一个重要课题,它的目的在于重构场景的三维几何信息。(3.0分) A.人机交互 B.虚拟现实 C.自然语言处理 D.计算机视觉 我的答案:D√答对 9.()是人工智能的核心,是使计算机具有智能的主要方法,其应用遍及人工智能的各个领域。(3.0分) A.深度学习 B.机器学习 C.人机交互 D.智能芯片 我的答案:B√答对 10.关于专用人工智能与通用人工智能,下列表述不当的是()。(3.0分) A.人工智能的近期进展主要集中在专用智能领域 B.专用人工智能形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能 C.通用人工智能可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题 D.真正意义上完备的人工智能系统应该是一个专用的智能系统 我的答案:D√答对 多选题 1.人工智能研究范畴广泛而又异常复杂,其发展需要与()和社会科学等学科深度融合。(4.0分)) A.计算机科学 B.数学 C.认知科学 D.神经科学 我的答案:ABCD√答对 2.机器学习的相关算法包括()。(4.0分)) A.轨迹跟踪 B.决策树 C.数据挖掘 D.K近邻算法 我的答案:BCD√答对 3.目前,深度学习主要包括()。( 4.0分))

行为识别国内外现状

1.原始视频的特征提取 (1)光流场 光流场是空间运动物体在观测成像面上像素运动的瞬时速度。它利用图像序列中的像素强度数据的时域变化和相关性来研究图像的灰度在时间上的变化与场景巾物体结构及其运动的关系。光流法通常假设相邻帧的图像差异非常小,从而获取对真实运动场的近似估计【31。它不用预知任何先验知识,即能提供有关运动速度及图像中运动区域的简洁描述,适用于摄像机运动的情形。但光流法易受噪声及光照变化的影响,且计算较为复杂,很难用于实时的视频监控系统。 (2)点轨迹 目标的运动轨迹也可以作为特征,从而大致推断出目标运动所属的行为类别。但图像平面上的轨迹对平移、旋转和缩放等变换比较敏感,因此在大多情形下,此特征显得不够可靠。常用的替代特征表达有轨迹速度、时空曲率等【4,51。运动轨迹的获取比较依赖于精确的跟踪算法。从原始视频中提取点轨迹特征同样容易受到噪声、遮挡及混乱背景等的影响。(3)人体形状表达 在摄像机固定的情形下,假设背景已知,通过背景剪除法可以很容易得到运动人体形状。基于全局、边界及骨架等的描绘子都可以用来表达人体形状。全局方法16,71如剪影、矩等是在整体形状区域内计算描绘子,而边界方法仅考虑形状轮廓【8l,骨架i方法则是用一组lD 骨架曲线代表一个复杂的人体形状,比如中轴变换[91等。 (4)滤波器响应 空时滤波器响应是一个广义上的分类。Zhang等【lo】存时间轴上计算高斯导数,将滤波器响应较高的区域作为运动区域。LaptevI¨1利用一组空时高斯导数滤波器将Harris角点检测扩展应用于三维的视频数据从而检测出空时兴趣点。这类方法大都基于简单的卷积操作,运算快速而简便。当视频分辨率较低的情形下,提取光流或剪影特征较为困难,利用滤波器响应特性可以从视频数据中提取有效的底层特征。 2.低层特征的描述与识别 我们将低层特征的描述与识别方法分为三类①:非参数方法、空时体方法和参数时序法,分别对现有方法进行归类,并作一个简短的综述。 2.1非参数方法 (1)模板匹配法 这类方法需要对每种行为的特征建立相应的模板,将获取的特征数据与模板相匹配,通过计算两者之间的相似度进行识别。Polana和Nelson[4刀将整个序列分解为多个周期行为,利用二维网格特征识别各种行为。Bobick和Davis[391将图像序列转换为运动能量图像(膨酣)和运动历史图像(朋m)模板,MEI反映运动覆盖的范围及强度,而MHI反映运动在时间上的变化情况。Weinland等【拍】提出运动历史体积(MHV)模板,从多个视角重建目标并将其投影到圆柱坐标系,提取Fourier变换特征以描述行为。Wang和Suter[451也将整个行为过程融合为基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(彳^扭)两个模板。模板匹配法计算复杂度低、实现简单,但它本身无法描述动态系统,也不能完全反映数据在空问上的分布属性,具有一定的局限性。而且不同行为之间执行速率的不同、噪声、光照等因素都会影响模板匹配的准确性。 (2)目标建模法 行为可以通过建立人体动态表观模型进行描述。常见的人体模型有棍图模型【109]、2D模型例及3D模型51。3D人体建模是最常用的人体结构表征方法,通过跟踪人体模型中主要

(完整版)2019年我国人脸识别技术发展情况及发展趋势综合分析.doc

2019 年我国人脸识别技术发展情况 及发展趋势综合分析 2019 年 2 月 14 日 一、全球生物识别细行业市场占比情况分析 生物识别指的是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段相结合,利用人体固有的生理特性来进行个人身份鉴定技术。按不同的识别方式,生物识别可分为指纹识别、虹膜识别、语音识别、静脉识别和人脸识别。 伴随着生物识别产品逐渐从单一的PC处理转变为分布式计算。用独立的前端独立设备来完成生物特征的采集、预处理、特征提取和比对,通过中心PC或服务器完成与业务相关的处理。随着生物特征 识别技术的不断发展和提高,生物特征识别技术的应用场景不断拓展,预计 2015-2020 年全球生物识别细分行业复合增长率分别为:人脸识别复合增长率为167%;语音识别为 100%;虹膜识别为 100%;指纹识别复合增长率为73%。

全球生物识别细行业市场占比情况 二、中国人脸识别技术发展情况分析 1、中国人脸识别行业发展历程 人脸识别技术在中国的发展起步于上世纪九十年代末,经历了技术引进 - 专业市场导入 - 技术完善 - 技术应用 - 各行业领域使用等五个阶段。其中, 2014 年是深度学习应用于人脸识别的关键一年,该年FaceBook发表一篇名为“ DeepFace系统:达到肉眼级别的人脸识别系统”(翻译名),之后Face++创始人印奇团队以及香港中文大学汤晓鸥团队均在深度学习结合人脸识别领域取得优异效果,两者在LFW数据集上识别准确度均超过了99%,而肉眼在该数据集上的识别准确度仅为 97.52%,可以说深度学习技术让计算机人脸识别能力超 越人类的识别程度。

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

人脸识别技术的应用背景及研究现状1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面: (1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 ??(2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。

?(3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,着名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Compute r Interface Institute,Microsoft Research,英国的Department of Engine ering in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面: (1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较多。但是由于人脸特征的变化很大,很难得到有效的模板来表示人脸的共性。变形模板在原理上与固定模板相同,但其中包含一些非固定的元素,一种方法是手工构造参数化的曲线和曲面以表征人脸中的某些非固定特征,如眼

人脸识别技术市场发展现状

人脸识别技术市场发展现状 有这样一群人,一直在进行着各种各样的努力,攻破一个又一个技术难关。而他们的目的,却是为了以貌取人。 不是玩笑,更不是天方夜谭。因为这些人所从事的工作,正是人脸识别技术的研发与应用。从一指禅到面面观秋去冬来,瑟瑟寒风中,一双厚厚的手套让我们倍感温度。相信,没有谁愿意在零下几度的时候摘下它。但是,由于指纹打卡机的应用,使得我们每天不得不站在公司门口练习一指禅的功夫。试想,如果有一种产品,能够让我们这些君子既不动口也不动手,便能完成身份识别的工作,那将是事半功倍的。而人脸识别技术的发展及应用,恰好满足了我们的需求。 近年来,由于反恐、国土安全和社会安全的需要,世界各国都对安防领域加大了投入。而身份识别正是安防的一个核心问题。在这种大环境下,生物特征识别迎来了一个快速发展的时期,人脸识别技术在这样的环境下异军突起,犹如七八点钟的太阳冉冉升起。截止2007年,人脸识别的市场份额由原来的微不足道,迅速上升到12.9%,市场份额仅仅小于指纹识别,并且比重还在不断增加,彻底打破了国际生物识别市场上指纹一统天下的局面。 放眼国内人脸识别技术市场,从2007年便开始经历迅速的发展,而且发展的脚步越来越快。由于科技界和社会各个方面都认识到人脸识别技术的重要性,国家政策对人脸识别技术研究给予了很大支持,使得我国人脸识别技术取得了很大进展。而且,除了传统的考勤、门禁等应用外,各种新的应用需求的不断涌现,也极大地推动了这一市场的发展。例如,视频监控环境下的身份识别正成为一种迫切的需求,即在一个较复杂的场景中,在较远的距离上识别出特定人的身份,这显然是指纹识别的方法所不能满足的。而人脸识别却是一个极佳的选择。此外,人脸识别系统的市场大小,很大程度上是和人口的数量大小相关的。而我国有13亿人口,这就从本质上决定了我国是世界上规模最大的生物识别市场。 从一指禅到面面观,看起来只是个时间的问题。 掀起技术的盖头来指纹识别应该是目前应用最广泛、最普及的一种生物特征识别技术,在全球也是如此;人脸识别技术,目前在全球所占份额不小,但在国内,由于进口产品价格

关于注意国内外研究现状及发展趋向研究

关于注意国内外研究现状及发展趋向研究 刘建义 ( 上海体育学院上海 200438 ) 1有关心理学角度注意力的研究 注意是什么?这是心理学家长期以来不愿回答却又难以回避的一个问题。虽 然令人遗憾的是,时至今日在注意的界定问题上心理学界仍未达成共识,但这并 未影响人们从理论和实践两个层面对注意展开广泛而深入的研究。早在1890年,著名心理学家詹姆斯就说过,注意是心理学的中心课题,在现代认知心理学中,它也是信息加工理论框架的中心概念。认知心理学目前主要强调注意的选择性维量,将注意看作一种内部机制,借以实现对刺激选择的控制并调节行为(Kahneman, 1973),也即舍弃了一部分信息,以便有效地加工重要的信息。从这个角度出发,认知心理学主要着重研究注意的作用过程,提出了一些注意的模型,企图从理论上来研究注意机制。最初,注意的选择性通常被概念化为一个促进的过程,即在信息加工系统中,对于专注信息的加工被选择性地加强了。【1】伴随 1950s 认知心理学的崛起,专业研究人员对注意的研究兴趣迅速提升,此时刚刚起步的运动心理学亦开始关注运动员的注意特征,并持续至今:关注适宜刺激被认为是区分运动专家与新手最重要的认知特点之一(Landers, Salazar, Petruzzello, Kubitz, Gannon, & Han, 1994);对运动情境中适宜刺激的选择性注意能力至关重要&&选择性注意也许是成功运动员最重要的一项心理特点了(Cox,1996);&&对运动技能的学习和执行而言,人们很难想象还有什么比专心致志于当前的任务更为重要的了(Abernethy,1998)。虽然这些陈述尚无法概括注意在运动领域作用的全部,但足可见运动注意研究价值之一斑。 检索国外相关资料不难发现,迄今运动心理学领域针对注意已开展过一定数量的研究工作,涉及的选题相对广泛,采用的研究范式亦很多样。如目前运动心理学主要从认知(心理努力,mental effort)、行为(动作控制,action control)和生理(警觉,altertness)三个方面对运动员的注意特征与状态进行研究与测查。在权威的《运动心理学研究手册》第二版注意一章中,较第一版略去警觉或准备性注意(attention as alertness and preparedness),而集中讨论容量或资源限制性注意(attention as a limited capacity and resource)和选择性情景中的注意(attention in the context of selectivity)两方面的主要理论模型、研究范式、测量方法,与运动技能获得、技能水平提升、教学训练安排的关系,以及专家-新手注意活动方面的比较等(Singer,Hausenblas,Janelle, 2001)。与国外研究相比,我国运动心理学在注意研究的选题上相对集中,主要致力于运动员注意品质的探索及注意能力测试评价系统的研发(王晓芬,姚家新,2001;殷恒婵,孟庆茂,钱铭佳,2001;殷恒婵,2002;李永瑞,2002),亦有少数学者借用认知心理学的研究范式展开运动员注意特征的研究(章建成,1994;廖彦罡,2003)。注意的品质主要有注意的广度、注意的紧张性、注意的稳定性、注意的分配和注意的转移。【2】注意的广度又称注意的范围,指在同一时间内一个人清楚直觉对象的数量,注意对象数量越多说明我们的注意广度越大。注意紧张性指心理活动对一定对象的高度集中程度,是注意的强度特征。注意的稳定性也称注意的持久性,是指注意在一定时间内相对稳定地保持在注意对象上,注意的稳定性表现的是注意的时间特征。注意的分配时指人在同时进行两种或几种活动时,能够指向不同的注意对象,学生在课堂上边听边记便是注意的分配活动。注意的转移指根据新任务,主动地把注意从一个对象转移到另一个对象上,即是注意的切换速度的特征。注意力转移(Mental rotation)是视觉影像处理的一种形式,由Shepard和Metzler[1]在1971年首先提出,它的深入研究对探索脑认知功能具有重要的科学意义。受试者要求识别三维转动物体的影像和镜像。在注意转动角度不等的物体时,反应时间不同。实际的物体(图形)转动时,受试者要在头脑中转动其影像。把这种视觉影像处理形式称为注意力转移。【3】

2019年人脸识别现状讨论

人脸识别市场情况数据隐私保护 一、简要分析当下人脸识别市场的发展情况 国内的人脸识别技术发展起步于上世纪九十年代末,经历了技术引进-专业市场导入-技术完善-技术应用-各行业领域使用等五个阶段。目前国内人脸识别技术已经相对发展成熟,正在各个领域加强推广。经过20年的技术发展和沉淀,目前人脸识别应用已经在各行各业遍地开花,有面向公安的场景,如人脸布控、人脸搜索,也有面向交通的场景,如机场、车站的人证核验、还有面向个人的场景,如人脸支付、人脸门禁等。现在的人脸识别技术市场规模庞大、落地场景应用众多,并且在很多场景中,人脸识别应用都会成为一个标配,现阶段已经形成了几个头部玩家。 从市场发展规模来看,根据权威机构统计,2013年中国人脸识别市场规模仅仅达8.63亿元,并呈现出逐年快速增长的趋势。2014年中国人脸识别市场规模突破了10亿元。截止至2017年中国人脸识别市场规模增长至21.9亿元,2018年我国多座火车站在乘客身份识别中使用人脸识别技术,市场规模明显提高,约为27.6亿元,较2017年增长26%,处在快速发展阶段。 人脸识别是基于人的脸部特征信息进行是识别的一终技术,属于生物特征识别的一种。近些年人脸识别技术在安防、交通、教育、新零售、政府治理等各个领域快速落地,国内市场规模达到了百亿级别,且发展迅猛。与其他各种生物识别技术相比,人脸识别在行业规模的增幅上居于首位,超过了语音识别、指纹识别、虹膜识别等。 人脸识别技术在国内应用的突飞猛进,,一方面得益于以深度学习为代表的算法的长足进步,以及计算平台算力的大幅提升,另一方面,也离不开从中央到地方各级政府对人工智能发展的大力支持。 未来人脸识别市场的竞争也将更加激烈,算法和算力技术壁垒的降低梗加速了这一过程。这就更加考验企业对细分行业的理解深度、产品研发落地的能力以及新技术的引入和研发速度。 人脸识别是目前最火爆、增速最快的生物识别及CV(计算机视觉)应用,也是诸多行业巨头(传统生物识别公司、CV独角兽)以及跨界巨头(海康、大华、华为等)重点投入和角逐的领域。 人脸识别是最直观的识别方式——人类认识他人,天生本能即是通过人脸辨认。与指纹识别、静脉识别、掌纹识别等相比,它具有非接触式采集、识别的优势。可广泛应用于监督应用场景及非监督使用场景,甚至隐蔽采集识别场景。正是这些优势,使它在诸多生物识别分支技术中脱颖而出,广受各类应用系统采纳。 从技术角度而言,因为大数据采集的可能性,人脸识别算法在大数据和深度学习的加持下飞速发展,短短几年的时间,即进化迭代到足以支撑大规模(全国范围,百万级、千万级乃至亿级数十亿级)实际布局应用。 二、关于人脸数据无需扩散、滥用、隐私保护等问题备 敏感数据扩散滥用和隐私保护,是指网络系统线上服务及交易系统中对敏感数据采集、存储、使用、共享等环节的松散管理或恶意扩散等问题。它与人脸识别和其他生物识别技术无关,属于应用系统的问题。生物识别技术只是在这类应用系统中被用于客户身份认证而已。人脸识别及其他生物是被技术的安全问题,则主要是指它们的防伪抗攻击能力和对策。 在敏感和隐私数据中,主要又可分为人脸图像及其标注,以及与该人脸ID相关的行为踪迹和交易记录等等数据,相较而言,后者更为敏感。

行为识别国内外现状资料

1.原始视频的特征提取 (1) 光流场光流场是空间运动物体在观测成像面上像素运动的瞬时速度。它利用图像序列中的像素强度数据的时域变化和相关性来研究图像的灰度在时间上的变化与场景巾物体结构及其运动的关系。光流法通常假设相邻帧的图像差异非常小,从而获取对真实运动场的近似估计【31。它不用预知任何先验知识,即能提供有关运动速度及图像中运动区域的简洁描述,适用于摄像机运动的情形。但光流法易受噪声及光照变化的影响,且计算较为复杂,很难用于实时的视频监控系统。 (2) 点轨迹目标的运动轨迹也可以作为特征,从而大致推断出目标运动所属的行为类别。但图像平面上的轨迹对平移、旋转和缩放等变换比较敏感,因此在大多情形下,此特征显得不够可靠。常用的替代特征表达有轨迹速度、时空曲率等【4,51。运动轨迹的获取比较依赖于精确的跟 踪算法。从原始视频中提取点轨迹特征同样容易受到噪声、遮挡及混乱背景等的影响。 (3) 人体形状表达在摄像机固定的情形下,假设背景已知,通过背景剪除法可以很容易得到运动人体形状。基于全局、边界及骨架等的描绘子都可以用来表达人体形状。全局方法16,71 如剪影、矩等是在整体形状区域内计算描绘子,而边界方法仅考虑形状轮廓【81,骨架i方法则是用一组ID 骨架曲线代表一个复杂的人体形状,比如中轴变换[91 等。 (4) 滤波器响应 空时滤波器响应是一个广义上的分类。Zhang等【Io】存时间轴上计算高斯导数,将滤波器 响应较高的区域作为运动区域。Laptevl " 1利用一组空时高斯导数滤波器将Harris角点检测 扩展应用于三维的视频数据从而检测出空时兴趣点。这类方法大都基于简单的卷积操作, 运算快速而简便。当视频分辨率较低的情形下, 提取光流或剪影特征较为困难, 利用滤波器响应特性可以从视频数据中提取有效的底层特征。 2.低层特征的描述与识别 我们将低层特征的描述与识别方法分为三类①:非参数方法、空时体方法和参数时序法, 分别对现有方法进行归类,并作一个简短的综述。 2.1 非参数方法 (1 )模板匹配法这类方法需要对每种行为的特征建立相应的模板, 将获取的特征数据与模板相匹配, 通过计算两者之间的相似度进行识别。PoIana 和NeIson[4 刀将整个序列分解为多个周期行为,利用二维网格特征识别各种行为。Bobick 和Davis[391 将图像序列转换为运动能量图像(膨酣)和运动历史图像(朋m)模板,MEI反映运动覆盖的范围及强度,而MHI反映运动在时间上的 变化情况。Weinland等【拍】提出运动历史体积(MHV)模板,从多个视角重建目标并将其投影到圆柱坐标系,提取Fourier 变换特征以描述行为。Wang 和Suter[451 也将整个行为过程融合为基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(彳A扭)两个模板。模 板匹配法计算复杂度低、实现简单, 但它本身无法描述动态系统, 也不能完全反映数据在空问上的分布属性,具有一定的局限性。而且不同行为之间执行速率的不同、噪声、光照等因 素都会影响模板匹配的准确性。 (2) 目标建模法行为可以通过建立人体动态表观模型进行描述。常见的人体模型有棍图模型【109] 、2D 模

人脸识别技术研究的意义应用与发展现状教学内容

人脸识别技术研究的意义应用与发展现状

人脸识别技术研究的意义应用与发展现状 1人脸识别的发展 人脸是人类情感表达和交流的最重要、最直接的载体。通过人脸可以推断出一个人的种族、地域,甚至身份、地位等信息;人们还能通过人脸丰富而复杂细小的变化,得到对方的个性和情绪状态。科学界从计算机图形学、图像处理、计算机视觉、人类学等多个学科对人脸进行研究。最早的人脸识别技术的研究可以追溯到20世纪50年代,当时的研究人员主要涉及的是社会心理学领域;到了60年代,开始有一些工程文献陆续发表出来;但是,真正的自动人脸识别的研究是从20世纪70年代的Kanade和Kelly开始的,当时采用的技术基本上都是典型的模式识别技术,例如利用脸部重要特征点之间的距离进行分类识别。随着计算机技术的发展,从80年代到90年代初期,人脸识别技术得到了很大的发展并进入了实际应用领域。在这一阶段,基于人脸外貌的统计识别方法得到了很大的发展,其中Eigenfaces和Fisherfaces在大规模的人脸数据库上进行的实验得到了相当不错的结果[1]。同时,基于人脸特征的识别方法也逐渐发展起来,此类方法对光线和视角的变化、人脸的定位都不太敏感,有利于识别率的提高,但是其采用的特征提取方法还不够成熟和可靠[2]。 2人脸识别的应用 自90年代后期以来,一些商业性的人脸识别系统逐渐进入市场;近几年来人脸识别作为计算机安全技术在全球范围内迅速发展起来,特别是美国遭受911恐怖袭击以后,人脸识别技术更引起了广泛的关注。在这一阶段,更多的研究集中在基于视频的人脸识别上面。人脸识别技术具有广泛的应用前景,在国家安全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照验证等是典型的应用;在民事和经济领域,各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证、社会保险人的身份验证等具有重要的应用价值;在家庭娱乐等领域,人脸识别也具有一些有趣有益的应用,比如能够识别主人身份的智能玩具、家政机器人、具有真实面像的虚拟游戏玩家等。 今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。

人脸识别技术的应用背景及研究现状word版本

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面: (1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。

这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineering in Univers ity of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:(1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较多。但是由于人脸特征的变化很大,很难得到有效的模板来表示人脸的共性。变形模板在原理上与固定模板相同,但其中包含一些非固定的元素,一种方法是手工构造参数化的曲线和曲面以表征人脸中的某些非固定特征,如眼睛,鼻子和嘴唇等。另一种方法是系统自动生成自适应的曲线或曲面,以构成变形人脸模板。检测方法是:将模板与测试图像进行弹性匹配,并加入惩罚机制,利用某种能量函数表示匹配程度。

人脸识别技术研究的意义应用与发展现状

人脸识别技术研究的意义应用与发展现状 1人脸识别的发展 人脸是人类情感表达和交流的最重要、最直接的载体。通过人脸可以推断出一个人的种族、地域,甚至身份、地位等信息;人们还能通过人脸丰富而复杂细小的变化,得到对方的个性和情绪状态。科学界从计算机图形学、图像处理、计算机视觉、人类学等多个学科对人脸进行研究。最早的人脸识别技术的研究可以追溯到20世纪50年代,当时的研究人员主要涉及的是社会心理学领域;到了60年代,开始有一些工程文献陆续发表出来;但是,真正的自动人脸识别的研究是从20世纪70年代的Kanade和Kelly开始的,当时采用的技术基本上都是典型的模式识别技术,例如利用脸部重要特征点之间的距离进行分类识别。随着计算机技术的发展,从80年代到90年代初期,人脸识别技术得到了很大的发展并进入了实际应用领域。在这一阶段,基于人脸外貌的统计识别方法得到了很大的发展,其中Eigenfaces和Fisherfaces在大规模的人脸数据库上进行的实验[1]。同时,基于人脸特征的识别方法也逐渐发展起来,此得到了相当不错的结果类方法对光线和视角的变化、人脸的定位都不太敏感,有利于识别率的提高,但[2]。是其采用的特征提取方法还不够成熟和可靠 2人脸识别的应用 自90年代后期以来,一些商业性的人脸识别系统逐渐进入市场;近几年来人脸识别作为计算机安全技术在全球范围内迅速发展起来,特别是美国遭受911恐怖袭击以后,人脸识别技术更引起了广泛的关注。在这一阶段,更多的研究集中在基于视频的人脸识别上面。人脸识别技术具有广泛的应用前景,在国家安全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照验证等是典型的应用;在民事和经济领域,各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证、社会保险人的身份验证等具有重要的应用价值;在家庭娱乐等领域,人脸识别也具有一些有趣有益的应用,比如能够识别主人身份的智能玩具、家政机器人、具有真实面像的虚拟游戏玩家等。 今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。 人脸识别的意义3.

人脸识别研究背景历史与发展现状及研究范围和方法

人脸识别研究背景历史与发展现状及研究范围和方法 1人脸识别研究背景 2人脸识别的发展历史和现状 3国外人脸识别的研究范围及主要方法 3.1人脸识别的研究范围 3.2人脸识别的研究方法 1人脸识别研究背景 人类进入21世纪,随着计算机和网络技术的日渐发达,信息安全体的隐患日益突出,自从911恐怖袭击以后,各国越来越重视社会的公共安全,信息识别与检测显示出前所未有的重要性,其应用领域之广,几乎可以包含社会的各个领域。现今生活中主要采用号码、磁卡、口令等识别方法,这些都存在着易丢失、易伪造、易遗忘等诸多问题。随着技术的不断发展,传统的身份识别方法已经受到越来越多的挑战,可靠性大为降低,势必出现新的信息识别和检测技术。人们逐渐的把目光转向了生物体征,这些都是人类遗传的DNA所决定的,并且每个人都拥有自己独一无二的生物体征。 生物识别技术大致可以分为两大类,一类是物体体征,例如指纹、虹膜、人脸、体味等。另一类是行为体征,例如书写、步频、惯性动作等,这些都可以通过现在的计算机图像处理技术进行识别。与其他人类的生理特征相比,人脸存在易采集、非接触、静态等优点,比较容易被大众所接受。 据调查,人与人接触时,90%的人是通过观察一个人的脸部特征来了解对方,获取对方的基本信息,这就是所谓的第一印象。虽然外部条件例如年龄、表情、光照等发生巨大变化,是一个人的面部特征发生巨大变化,但是人类仍然可以识别,这一现象说明人的脸部存有大量特征信息,通过提出人脸部的特征信息,就可以判断一个人。 人脸识别过程主要分为三个部分。首先,采集人脸图像样本。很多科研机构都建立的自己的人脸图像库,最著名的有美国国防部发起建立的FERET人脸库和英国剑桥大学建立的ORL人脸库;其次,进行特征提出,然后将提取的特征数据导入特征数据库;最后,鉴定某个人身份信息时,用特定的匹配算法将数据库中的特征数据通这个待识别人的人脸特征进行匹配,从而实现身份鉴定。 据相关市场调查,人脸识别技术在产业中占据一定份额,其主动、直接、简便、友好等特点,必将促进其持续增长。所以人脸识别技术的市场前景将十分广泛。

相关文档
相关文档 最新文档