文档库 最新最全的文档下载
当前位置:文档库 › 手势识别技术综述

手势识别技术综述

手势识别技术综述
手势识别技术综述

手势识别技术综述

作者单位:河北工业大学计算机科学与软件学院

内容摘要:

手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。

Abstract:

Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future.

1.定义

说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

被按下这一动作。”

从定义上讲,手势识别是一种利用数学算法,包括计算机图形学,辅以摄像头、数据手套等输入工具,针对收集到的信息,比如手掌、手指各关节的方位、角度等进行判断、分析并作出正确回复的技术。许多测试品已开始使用三维手势识别来提升准确率及反应速度。但是,分析手势的特点,回顾手势识别的发展历史,可以更好地把握其发展脉络,从而对未来手势识别的潜力与可能方向做出基本判断。

2.发展过程

手势是任意的,手不同部位的方向、角度及弯曲程度等的不同信息可能会有实际意义上的天壤之别。所以手势识别应该基于用户与程序、设备之间的约定。

针对手势的任意性,最初的手势识别主要使用各种与手及手臂通过直接的接触式有线机器设备进行数据采集。它可以直接检测诸如手指、关节及手臂的方位、角度等。典型的设备有数据手套等。通过内含许多传感器的数据手套,可以十分精确地获取手势识别所需的各种信息,此外其反应速度、识别准确度、稳定性也得到了保障。但是该设备在实际中的造价比较高昂,更重要的是会对手的灵活性有一定限制,因而没有得到有效推广。此后推出的穿戴式光学标记可通过红外线将手指及手掌变化传输到屏幕上,也保持了数据手套的优点。该设备虽减轻了重量,提高了手部的灵活性,但是仍需较复杂的输入输出转换设备,此外也会对手部动作的自然性产生影响。【1】

基于视觉的手势识别技术能够使手部动作的表达更加自然,同时也可以为未来其他的肢体识别技术所应用,因此成为了主流。手型模型是通过计算机图形学对二维的手势图像属性,如手的颜色、纹理、边界、轮廓等进行分析。【6】该方法主要使用三种组件:探测组件、运动轨迹组件、识别组件。【6】探测组件负责有针对性地收集有特点的视觉信号并将手势信号整理成码。运动轨迹组件负责实时定位,虽然它对于只需静态手势的设备并不是必要的组件,但是其可以优化手部中各部位的运动曲线,提升设备精度。

基于视觉的手势识别按手势的动态特点可以分为静态的与动态的两种,静态手势识别针对单个手型,主要包括手势分割及手势识别两部分,前者是后者的基础。【3】静态手势识别方法难以识别区分度较小的手势、实时性差,因此向动态手势识别过渡已经成为一种趋势。【3】

大部分手势识别应用是将每个手势作为一个整体,之后通过计算相似度来进行模式匹配。这种方法显而易见的缺点是只有当收集到的数据与预设模型的相似程度很高时才会比较准确,另外对于某些比较相似的手势区分效果不好。【6】

3.研究方法

目前常用的手势识别研究方法主要有以下几种:

(1)基于人工神经网络的手势识别

神经网络基于统计和概率学方法的组织和判断具有抗干扰、自学习、易控制和处理高效的特点,可用于处理信息缺失的模式并进行模式推广。如果整个神经

网络包括的全部神经元都是时空效能好的算法,那就可以判断手势细微部分的运动。但人工神经网络对时间序列处理能力不强。在静态手势的识别中应用较多,动态手势识别中几乎没有应用。此外,尽管对神经网络的相关研究及应用已经有了几十年,但是该方法本身的复杂性使成功构建一个效果良好的神经网络对大多数人比较困难。【2】

(2)基于隐马尔可夫模型的手势识别

隐马尔可夫模型是一种能细致描述信号的时空变化统计分析模型,适用于动态手势的识别。由于其分析复杂,计算量大,速度慢,故而大多采用离散马尔可夫模型。

(3)基于几何特征的手势识别,包括手势分割法与几何特征法

手势分割包括2种方法:单目视觉和立体视觉。基于单目视觉的方法又分为基于徒手的表观特征(肤色,轮廓);人为增加限制,如要求使用者戴上有色手套及各种光学标识;建立数据库的方法。【12】

手势的几何特征指手势的边缘(如轮廓)和手势区域特征(如手掌颜色、面积)。【4】基于几何特征的手势识别技术,大多采用各种距离公式进行模板匹配,如量度度量空间中真子集之间距离的Hausdorff距离等。几何特征识别方法主要有3种: 模板匹配法(自动提取每一帧特征图像与模板库匹配后识别手势,多用于静态手势识别);神经网络法,统计分析法(如隐马尔可夫模型法HMM)等。

动态手势识别的算法比较复杂。除了进行手势识别的算法外,还需要其他辅助算法及过程。

某些具有手部整体运动轨迹的手势可以是肢体动作的一部分,比如挥手、打招呼等。这些手势识别需要准确地从手腕部对手势及手臂进行识别并分割。此外,在动态手势识别中还需同时进行方位定位及识别工作,其核心是动态时间空间跃迁算法(DSTW),一种可以在时间空间成对排列搜索请求及模型手势的算法。【11】

此外,涉及随机信号及过程的光谱分析法已经在大量科学学科中使用了几十年,尽管随机性会给时间域特性分析带来困难,像特征值及频率仍然是有价值的光谱信息。傅里叶分析是频率域光谱分析的常见方法。【8】

尽管存在诸多的方法,而且手势识别仍在不断发展中,但是手势识别本身的特点在某些方面成为了障碍。与人脸识别最显著的区别是,基于图像的手势识别与人脸识别虽然都是根据二维图像,但是手部没有类似人脸那样丰富的可以标记及区分的数据特征对象。人脸的表情丰富,可以作为理想的数据库。典型的人脸切尔诺夫模型拥有18个变量,而自1973年来经过几十年的发展,面部特征又得到了丰富,非对称的切尔诺夫脸可显示多达36维的脸部特征。手部的特征明显要少得多,基本上就是各关节、手掌的坐标,指尖的朝向等。而且脸部特征基本上是在一个平面上的,没有旋转特征,脸部的自由度小。手部在手势定位及旋转上至少需要6维信息,包括手部的三维坐标及三维方向。而完全对手势进行分辨需要超过20个的自由度变量,这使得手势的甄别十分复杂。

4.当前的应用

(1)用于虚拟环境的交互

手势识别可以用于虚拟制造和虚拟装配、产品设计等。虚拟装配通过手的运动直接进行零件的装配,同时通过手势与语音的合成来灵活的定义零件之间的装配关系。还可以将手势识别用于复杂设计信息的输入。【9】

(2)用于手语识别。

手语是聋哑人使用的语言,是由手型动作辅之以表情姿势由符号构成的比较稳定的表达系统,是一种靠动作Π视觉交际的语言。手语识别的研究目标是让机器“看懂”聋人的语言。手语识别和手语合成相结合,构成一个“人2机手语翻译系统”,便于聋人与周围环境的交流。手语识别同样分为基于数据手套的和基于视觉的手语识别两种。基于DGMM的中国手语识别系统选取Cyberglove型号数据手套作为手语输入设备,采用了动态高斯混合模型DGMM(DynamicGaussianMixtureModel)作为系统的识别技术,可识别中国手语字典中的274个词条,识别率为98.2%。【9】

(3)用于多通道、多媒体用户界面。

正如鼠标没有取代键盘,手势输入也不能取代键盘、鼠标等传统交互设备,这一方面由于手势识别的设备和技术问题,另一方面也由于手势固有的多义性、多样性、差异性、不精确性等特点。手势识别要想取得比较高的识别率,仍有很长的路要走。手势输入在人机交互中应用的精髓不在于用来独立地用作空间指点,而是为语言、视线、唇语等交互手段通道提供空间的或其他的约束信息,以消除在单通道输入时存在的歧义。这种做法是试图以充分性取代精确性。

(4)用于机器人机械手的抓取

机器人机械手的自然抓取一直是机器人研究领域的难点。手势识别,尤其是基于数据手套的手势识别的研究对克服这个问题有重要的意义,是手势识别的重要应用领域之一。

5.前景

提供一个自然而且有效的人机交互界面始终是人机交互研究的目的。【1】那么手势识别以后的发展也要围绕这一点。在未来的发展中,口语、手势和人脸在虚拟环境中的互补是必要的。因为手形有两种建模方式:基于三维的建模和基于图像的建模。【4】基于三维的建模有强大的表达能力,几乎能够表达所有的手形,但是缺乏效率。而后者简单高效,但是缺乏通用性。手势由一段时间内的一系列手形组成。手势的分解和分类是手势识别的两个重要问题。在多用户虚拟环境中,人脸又可以作为区分用户的属性。只有综合利用他们,才能在人机交互系统中产生深远的影响。

然而在手势识别的发展中还有以下几个难点:现有的手势识别方法的局限性:单一颜色或静态背景;干净的肤色分割;手腕的界定;手动初始化。【10】到目前为止,大多数研究都集中在静态手势识别技术,而我们不仅要对手势进行跟踪,还要进行识别,其计算工作量很大且速度慢,不能用于实时识别系统。当前阻止我们进行实时识别的难点有手势目标检测困难手势目标识别困难。当前

还未能找到解决问题的理想方法,针对具体的某一系统,在实现时要假设一定的限制条件,以达到较好的识别效果。

虽然有许多许多的困难,但是现在全世界已有不少工作者投入到手势识别这项研究中,例如:美国的麻省理工学院,乔治理工学院,加州圣何塞公司等。如上所言,这项研究肯定有许多的难点问题需要去思考,去克服。在他发展的道路上,我认为分析师拉兹罗所言的:“无论何时,如果你想引进一种新的用户界面,他是否简单和容易操作总是成败的关键。当年鼠标问世时也不是一下子就得到了大众的接受。”非常适合此处。所以无论是学生还是公司,只要坚持对该系统的研究,必然会获得成功。

目前多个科技公司都纷纷推出了自己的手势识别产品或申请专利。2012年,Leap Motion 横空出世。作为一种继Kinect之后又一款革命性的交互产品,它只需将其用USB连接到电脑上,便可以准确识别出来显示器前方的动作。2016年4月,苹果公司获得了来自美国专利商标局一项新专利的批准。通过Apple Watch 上多种传感器的检测,iPhone可转化成文字或语音消息,实现忽略来电、静音等功能。此外,2016年4月2日公布的三星公司为VR研发的新传感器允许用户凌空操作VR应用,可以通过虚拟现实世界中瞄准线实现菜单、图标、照片、视频等的点击运行,而完全不需要使用到设备上的任何真实按钮。

参考文献:

【1】任雅祥,《基于手势识别的人机交互发展研究》,《计算机工程与设计》27卷第七期

【2】武霞、张崎、许艳旭,《手势识别发展现状综述》,《电子科技》2013年26卷6期【3】杨波、宋晓娜、冯志全,《复杂背景下基于空间分布特征的手势识别算法》,《计算机辅助设计与图形学学报》2010.10 第22卷第10期

【4】冯志全、蒋彦,《手势识别研究综述》,《济南大学学报(自然科学版)》2013年10月第27卷第4期

【6】Hong Cheng,Zhoujun Dai,Zicheng Liu,, 55(2016)137—147)

【7】Shweta K.Yewale,Pankaj K.Bharne,, Vol.3 No.4 April 2011

【8】Ali Boyali,Naohisa Hashimoto,, 24(2016) 11-18

【9】李清水、方志刚、沈模卫、陈育伟. 《手势识别技术及其在人机交互中的应用》,人类工效学.2002年3月第8卷第1期

【10】徐慧琳. 《手势识别系统的发展趋势》.科教导刊.2003年第11期

【11】Ankit Chaudhary,J. L. Raheja. < Intelligent Approaches to interact with Machines using Hand Gesture Recognition in Natural way:A Survey>.International Journal of Computer

Science & Engineering Survey (IJCSES) V ol.2, No.1, Feb 2011

【12】MISS. SHWETA K. YEWALE..Shweta K. Yewale et al. / International Journal of Engineering Science and Technology (IJEST)

手势识别技术综述

手势识别技术综述 作者单位:河北工业大学计算机科学与软件学院 内容摘要: 手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。 Abstract: Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future. 1.定义 说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

基于手势识别的智能电视交互专利技术综述

基于手势识别的智能电视交互专利技术综述 智能电视具有操作系统,支持第三方应用资源实现功能扩展,支持多网络接入功能,具备人机交互、与其他智能设备进行交互等。随着计算机视觉的发展和人机交互的需要,手势识别研究取得了蓬勃的发展,通过手势识别对智能电视进行控制和操作,能够更轻松、高效地使用电视设备。文章利用专利数据库对智能电视手势识别技术进行了数据统计和分析,对该领域的专利申请趋势等情况做了归纳总结。 标签:智能电视;手势识别;发展状况;专利 Abstract:Intelligent TV has the operating system,which supports the third party application resources to realize the function expansion,supports the multi-network access function,has the man-machine interaction,and carries on the interaction with other intelligent devices. With the development of computer vision and the need of human-computer interaction,the research of gesture recognition has made great progress. By controlling and operating intelligent TV through gesture recognition,one can more easily and more efficiently use TV equipment. This paper makes use of patent database to analyze the data of intelligent TV gesture recognition technology,and summarizes the trend of patent application in this field. Keywords:intelligent TV;gesture recognition;development status;patent 引言 电视是家庭娱乐休闲必不可少的家用电器。如今,电视依然是最为普及的信息传播载体,用户在观看普通节目的同时,还可以上网、娱乐等。从用户的角度出发,通过自然简单、人性化的方式完成交互,无疑是用户完成电视操作的最佳方式。而手势具有直观、自然、丰富的特点,是一种符合人们日常习惯的交互手段,是表達信息和特定意图的良好载体,由于手势具有上述特性,因此在对智能电视进行操控中得到了良好的运用,实现了对智能电视自然灵活地操作。 1 基于手势识别的智能电视控制技术发展状态分析 1.1 技术分解 本文通过检索获得的专利申请进行统计分析,对基于手势识别的智能电视控制所涉及的具体技术和应用领域进行分解。 根据手势采集设备可以将手势识别系统大致分为基于数据手套和基于视觉的两种手势识别系统。其中,数据手套通过多个传感器反馈各关节的数据,并通过位置跟踪器返回人手所在的三维坐标,从而获取手势在三维空间中的位置信息和手指的运动信息。通过数据手套可以直接获取人手在三维空间中的位置和运动

三种简单手势识别

简单手势识别

一、背景 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加易‘引。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

二、手势识别概述 2.1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的手转化为的手势动作,观察者看到的是手势动作的图像。手势的产生过程如图2-1所示。 图2-1 手势的产生过程 手势识别的过程则找一个从图像V到概念动作G的变换而,如图2-2所示。

2.2、手势识别流程 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加容易。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

关于计算机视觉的手势识别综述

关于计算机视觉的手势识别综述 蒋指挥 (江苏科技大学江苏镇江 213022) 摘要:计算机技术的高速发展也产生了许多新领域,在此对以计算机视觉为基础的手势检测识别技术展开综述。主要阐述该技术的发展历程、实现方法、研究现状以及其存在的不足之处和发展方向。结果表明简单的可穿戴设备的手势识别和深度视觉传感器的手势识别和多方法交叉融合的手势识别是未来该领域的发展方向。 关键词:计算机视觉;手势识别;人机交互 A survey of gesture recognition in computer vision//Jiang Zhi Hui Abstract;With the rapid development of computer technology, a lot of new fields have been developed. In this paper, the technology of gesture detection and recognition based on computer vision is reviewed. This paper describes the development of the technology, the realization method, the research status and its shortcomings and development direction. The results show that the simple wearable device for hand gesture recognition and depth vision sensor for hand gesture recognition and multi method cross fusion for gesture recognition is the future direction of the development of the field. Key words:Computer vision; gesture recognition; human-computer interaction 计算机在我们的生活中越来越不可或缺,我们同时也对计算机提出了更高的要求,计算机视觉的手势识别正是对计算机应用拓展的重要途径,例如现在的VR技术,就是应用了手势识别才实现的。ABIResearch公司高级分析师约书亚·弗拉德(JoshuaFlood)指出:“免提操作或手势识别很快将成为高端旗舰智能手机、媒体平板电脑和智能眼镜区别于其他同类产品的一个关键因素。三星电子最新推出银河S4已经将这项技术用于其手机中,并以其全新的用户体验获得用户交口称赞。此外,在一系列新型智能眼镜产品即将发布之时,不难想象这类技术将被采用。”其实手势识别技术涵盖了许多领域,比如物理学、生物学等,实现手势识别的方式有很多种从一开始的二维手型识别、二维手势识别到后来的三维手势识别,正是计算机视觉技术的发展使得手势识别的实现方式更加多样。但目前的技术仍然很繁琐,冗杂的可穿戴设备就直接影响了使用者的舒适感,其还有很大的发展空间。 1、手势识别的发展历程及其实现方法

基于3D 体感技术的动态手势识别

第27卷第4期2012年8月 光电技术应用 ELECTRO-OPTIC TECHNOLOGY APPLICATION Vol.27,No.4August ,2012 随着机器智能领域的迅猛发展,手作为人身体上最灵活的一个部位及人机交互的一个媒介,得到越来越多的应用。因此基于手势识别的各种应用也是层出不穷。手势是一种自然而直观的人际交流模式。手势识别也理所当然地成为了实现新一代人机交互不可缺少的一项关键技术。然而,由于手势本身具有的多样性(包括肤色、形态的差异性)、多义性(不同手势具有不同的意义)、以及时间和空间上的差异性(会受到光照等因素的影响)等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性并具有很大应用空间的研究方向[1] 。 1手势识别技术的发展 手势识别分为两种,一种是静态的手势识别,即在 摄像头下检测到某个手势时就给出命令。另一种是动态手势识别,即能够识别手做的一些动作。随着3D 体感技术的出现,手势识别进入一个全新的领域。1.1静态手势识别 静态手势识别的常用方法主要有:基于模版匹配的,用边缘特征像素点作为识别特征,并利用Hausdorff 距离模板匹配完成静态手势识别[2];基于SVM 支持向量机,通过皮肤颜色模型进行手势分割, 并用傅里叶描述子描述轮廓,采用针对小样本特别有效且范化误差有界的最小二乘支持向量机(LS -SVM )作为分类器进行手势识别[3]以及集合模版匹配和机器学习理论的手势识别方法[4]等。但由于静态手势识别技术应用的局限性较大,不够灵活,使用人数在减少。 收稿日期:2012-06-24 作者简介:淦创(1990-),男,辽宁锦州人,大学本科,研究方向为计算机图像处理. ·信号与信息处理· 基于3D 体感技术的动态手势识别 淦 创 (北京航空航天大学,北京100191) 摘要:提出了一种基于3D 体感机Kinect 的图像处理手势识别算法,通过深度图像和骨骼图像的方法实现动态手势识别。首先在Kinect 提供的骨骼图像中20个骨点中,选取2个离手部最近的骨骼点,通过追踪这两个骨骼点的位置来实现对手部的追踪,再通过判断手部的深度(即其相对于摄像头的距离)的变化来实现动态手势识别。 关键词:深度图像;骨骼图像;手部追踪;动态手势识别中图分类号:TN94 文献标识码:A 文章编号:1673-1255(2012)04-0055-04 Dynamic Gesture Recognition Based on 3D Kinect GAN Chuang (Beijing University of aeronautics and astronautics,Beijing 100191,China ) Abstract :A kind of gesture recognition algorithm of image processing based on 3D Kinect is proposed.The dynamic gesture recognition algorithm is performed by skeleton images and depth images.At first,two skeleton points which are nearest to hands are choosen from 20skeleton points in a skeleton image.The process of tracking hands is performed by tracking the positions of the two skeleton points.Then the dynamic gesture recognition pro?cess is realized by the change of depths of hands (the distance between a hand and a camera). Key words :depth image;skeleton image;hands tracking;dynamic gesture recognition

手势识别---人工神经网络

手势识别---人工神经网络 一.手势识别综述 随着计算机性能的逐步提高和各领域对计算机使用的不断深入,人与计算机的交互活动越来越成为人们日常生活中的一个重要组成部分。鼠标和键盘等传统的的人机交互方式越来越显示出它们的局限性,尤其在虚拟现实、增强现实和可穿戴计算等新兴的应用中变得更为明显。近年来,手势交互作为一种新的人机交互方式被越来越多地采用,特别是基于视觉的手势交互,由于其简单、自然、直观和非侵犯性等特性已成为手势交互的重要方式之一。 手势是一种自然、直观、易于学习的人机交互手段。以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。手势研究分为手势合成和手势识别,前者属于计算机图形学的问题,后者属于模式识别的问题。手势识别技术分为基于数据手套和基于计算机视觉两大类。 1.1 手势识别的发展 最初的研究主要集中在做一种专用硬件设备来进行输入。例如数据手套,即人可以戴上一个类似于手套的传感器,计算机通过它可以获:取手的位置、手指的伸展状况等丰富信息。如l993年B.Thamas等人做的自由手遥控目标的系统是凭借数据手套作为输入的媒介,但这需要实验者呆上一个专用设备。之后人们又致力于标记手势的研究,即通过在手上作标记,例如在手腕和手指处贴上或画上特殊颜色的圆点,用来识别手势。这虽然给识别带来了方便,但同样给实验者带来麻烦。最后人们终于把注意力集中到自然手上,通过专用加速硬件和脱机训练,一些研究者成功地研制了手势系统,但其识别的手势仅限几种。例如Freeman 和Roth等人提出的基于方向直方图的手势识别系统。l994年,作

基于摄像头的手势识别技术初步版本

基于摄像头的手势识别技术 1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的于转化为的于势动作,观察者看到的是于势动作的图像雎1。手势的产生过程如图1-1所示。 图1-1 手势识别的过程则找一个从图像V到概念动作G的变换而,如图下所示。 2、手势识别流程 手势识别流程包手势图像获取、手势分割、手势特征提取、手势识别四大部分,如图2-1所示。 图2-1

3. 手势建模 在手势识别框架中,手势模型是一个最基本的部分。根据不同的应用背景,于势识别采用的模型会有不同,而对于不同的手势模型,采用的手势检测与跟踪算法、特征提取、识别技术也会有差别。手势建模主要分为基于表观的手势模型与基于三维的于势模型。 基于表观的手势建模是一种二维建模,从二维平面观察得到的平面图像信息描述于的特征。 基于表观的手势模型主要包括基于颜色的模型与基于轮廓的模型两种。 基于颜色的手势模型是把手势图像看作像素颜色的集合,通过提取手部的颜色的特征来描述手势。 基于颜色的手势模型的常用特征是颜色直方图。基于轮廓的手势模型是把手看作一个轮廓,通过提取手部图像中手的轮廓的几何特征来描述手势。 4. 手势检测与跟踪 手势检测与跟踪是手势识别处理流程中最前端的处理部分,它处理从摄像头获取到手势图像(序列),从中检测和分割手势对象。如果是动态手势识别,还要对手进行跟踪。 基于运动信息的方法: 基于运动信息的方法是假设在视频中只有手是运动物体。 其中一种方法是背景减法。 它要求背景静止不变,把视频中的每帧与背景相减,背景相同的部分变为零,不同的部分就认为是运动的物体,即手。

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

2019年全球主要手势识别技术系统细分行业分析

2019年全球主要手势识别技术系统细分行业分析 1、以数据手套为输入设备的手势识别系统 目前使用广泛的人机交互设备是数据手套(DataGlove)。数据手套反馈各关节的数据,并经一个位置跟踪器返回人手所在的三维坐标,从而来测量手势在三维空间中的位置信息和手指等关节的运动信息。这种系统可以直接获得人手在3D空间中的坐标和手指运动的参数,数据的精确度高,可识别的手势多且辨识率高。缺点是数据手套和位置跟踪器价格昂贵,有时也会给用户带来不便,如持戴的手部出汗等。 由于神经网络很适合用快速、交互的方式进行训练,可用于静态手势和动态手势的输入,网络连接的权值也可以根据情况调整,各种用户都能适应手势识别系统。它的缺点是对设备的依赖性高,一旦需更换数据手套,则须重新训练网络。 2、以摄像机为输入设备的手势识别系统 输入设备可用单个或多个摄像头或摄像机来采集手势信息,经计算机系统分析获取的图像来识别手势。摄像头或摄像机的价格相对较低,但计算过程较复杂,其识别率和实时性均较差。其优点是学习和使用简单灵活,不干扰用户,是更自然和直接的人与计算机的交互方式。 目前较成功的实现手势识别的系统,均为依据手掌轮廓区域的几何特征,如手的重心及轮廓、手指的方向和形状等进行分析完成识别,或根据手掌的其他特征,如手掌的运动轨迹、手掌的肤色及纹理等进行分析识别。 手势模型的选取在手势识别系统中,对确定识别范围起着关键性作用。模型的选取往往跟具体应用有关, 不同的应用目的选取不同的模型。比如,对于某个给定的目的,可以先建立简单粗糙的模型,而后再跟据需要建立精细有效的手势模型,这对于实现自然的人机交互是必须的,可使绝大部分手势都能被系统正确的识别出来。 目前,手势模型有基于表观的手势模型和基于3D模型的手势模型。前者通过分析手势在图像(序列)里的表观特征给手势建模,它是建立在手(臂)图像的表观之上的。后者的建模方法则略有不同,其先对手和臂的运动姿态建模,然后再估计手势模型参数。 图表1:同一手势的5种模型图 资料来源:蒂华森咨询

表情识别技术综述

表情识别技术综述 摘要:表情识别作为一种人机交互的方式,成为研究的热点。基于对表情识别的基本分析,文章重点介绍了面部表情识别的国内外研究情况和面部表情特征的提取方法。 关键词:表情识别;特征提取;表情分类。 前言:进入21世纪,随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。如果实现计算机对人脸表情的理解与识别将从根本上改变人与计算机的关系,这将对未来人机交互领域产生重大的意义。 正文:一、面部表情识别的国内外研究情况 面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。 进入90年代,对面部表情识别的研究变得非常活跃,吸引了大量的研究人员和基金支持。美国、日本、英国、德国、荷兰、法国等经济发达国家和印度、新加坡都有专门的研究组进行这方面的研究。其中MIT的多媒体实验室的感知计算组、CMu、Ma州大学的计算机视觉实验室、Standford大学、日本城蹊大学、大阪大学、ArR研究所的贡献尤为突出。 国内的清华大学、哈尔滨工业大学、中科院、中国科技大学、南京理工大学、北方交通大学等都有专业人员从事人脸表情识别的研究,并取得了一定的成绩。在1999年的国家自然科学基金中的“和谐人机环境中情感计算理论研究”被列为了重点项目。同时中国科学院自动化所、心理所以及国内众多高校也在这方面取得了一定的进展。2003年,在北京举行了第一届中国情感计算与智能交互学术会议,会议期间集中展示了国内各研究机构近几年来从认知、心理、模式识别、系统集成等多种角度在情感计算领域取得的研究成果,一定程度上弥补了我国这方面的空白。国家“863”计划、“973”项目、国家自然科学基金等也都对人脸表情识别技术的研究提供了项目资助。 二、面部表情特征的提取方法 表情特征提取是表情识别系统中最重要的部分,有效的表情特征提取工作将使识别的性能大大提高,当前的研究工作也大部分是针对表情特征的提取。 目前为止的人脸面部表情特征提取方法大都是从人脸识别的特征提取方法别演变而来,所用到的识别特征主要有:灰度特征、运动特征和频率特征三种阎。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据。运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别。频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。在具体的表情识别方法上,分类方向主要有三个:整体识别法和局部识别法、形变提取法和运动提取法、几何特征法和容貌特征法。 整体识别法中,无论是从脸部的变形出发还是从脸部的运动出发,都是将表情人脸作为一个整体来分析,找出各种表情下的图像差别。其中典型的方法有:基于特征脸的主成分分析(prineipalComponentAnalysis,pCA)法、独立分量分析法(Indendent ComPonent Analysis,ICA)、Fisher线性判别法(Fisher’s Linear Discriminants,FLD)、局部特征分析(LoealFeatureAnalysis,LFA)、Fishe诞动法(Fisher^ctions)、隐马尔科夫模型法(HideMarkovModel,HMM)和聚类分析法。

基于卷积神经网络的简单背景手势识别方法概述

基于卷积神经网络的简单背景手势识别方法概述 摘要在手勢识别研究方法日益成熟的今天,研究人员把主要精力放在新算法的研究以及旧方法的改进上,均取得了很好的成果。本文利用时下流行的卷积神经网络训练方法,避开大量的算法研究工作,把主要工作放在手势数据的获取以及处理上,在一定的数据范围内取得了很好的结果。在一定程度上给手势识别工作提供了新的思路。 关键词手势识别;手势数据;卷积神经网络 Abstract Today,as gesture recognition research methods become more and more mature,researchers have made great efforts to focus on the research of new algorithms and the improvement of old methods. In this paper,we use the popular Convolutional Neural Network (CNN)training method to avoid a lot of algorithm research work. The main work is on the acquisition and processing of gesture data,and it has achieved good results in a certain data range. To a certain extent,it provides a new idea for gesture recognition. Keywords Gesture recognition;Gesture data;Convolutional neural network 前言 以输入数据来区分,手势识别可以分为静态手势识别和动态手势识别。动态手势识别是基于视频流数据,实现手势动作捕捉,本质上是把视频流分为每一帧图像数据,处理每一帧图像之间的关系,从而识别出动态手势的含义。静态手势识别也称为手型识别,其输入数据是一副静态的手势图像,计算机系统通过前期对大量手势图像的训练学习,熟知手势图像的特征,从而识别出这一副静态手势图像的含义。本文的主要工作是通过卷积神经网络方法对简单背景的手势图像进行训练,得到训练模型,利用该训练模型对新采集的手势图像数据进行识别,达到预期的识别率。 1 研究方法 手势识别的研究方法有很多种,例如利用SIFT特征提取配合SVM训练的方法[1],利用HOG特征提取的研究方法[2]等。但这些研究方法对于图像质量太多依赖,如SIFT方法太过依赖局部梯度主方向,而获取局部梯度主方向往往都会有偏差,因此图像质量不佳容易导致特征提取的错误。且SIFT是一种只利用到灰度性质的算法,忽略了色彩信息,对于彩色图像的识别无能为力。 而本文采用的卷积神经网络方法则不存在该问题,卷积神经网络对于图像的容错性较强,可以不考虑图像质量、色彩等影响,关键是训练的样本量足够大,就可以得到相对理想的结果。且卷积神经网络的算法通用性强,对于识别任何类型的静态图像,都可以用几乎相同的训练模型进行,区别仅仅在于某些参数的调

2019年全球手势识别技术系统行业竞争分析

2019年全球手势识别技术系统行业竞争分析 重点手势识别技术系统企业市场份额 图表1:2016年我国手势识别技术系统主要品牌市场份额 数据来源:国家统计局手势识别技术系统行业市场集中度 图表2:2016年我国手势识别技术系统行业市场集中度分析 数据来源:国家统计局行业竞争群组 新进入者越来越多,竞争越来越激烈。对于整个手势识别技术系统行业来说,也是存在着新进入者的威胁的。由于行业技术壁垒和资金壁垒都不算很高,随时都可能有新的更大

规模的资金的企业进入,高新技术产品替代普通产品威胁大。 在手势识别技术系统市场上,大企业的产量都在全行业的总产量中占较大份额,从而产量和价格的变动都会对其他竞争对手以至整个行业的产量和价格产生举足轻重的影响。从而每个手势识别技术系统厂商在采取某项行动之前,必须首先推测或掌握自己这一行动对其他厂商的影响以及其他厂商可能做出的反应,考虑到这些因素之后,才能采取最有利的行动。整体来看,手势识别技术系统企业对价格的控制能力较强。 潜在进入者 新进入者在给行业带来新生产能力、新资源的同时,将希望在已被现有企业瓜分完毕的市场中赢得一席之地,这就有可能会与现有企业发生原材料与市场份额的竞争,最终导致行业中现有企业盈利水平降低,严重的话还有可能危及这些企业的生存。竞争性进入威胁的严重程度取决于两方面的因素,这就是进入新领域的障碍大小与预期现有企业对于进入者的反应情况。 进入障碍主要包括规模经济、产品差异、资本需要、转换成本、销售渠道开拓、政府行为与政策(如国家综合平衡统一建设的石化企业)、不受规模支配的成本劣势(如商业秘密、产供销关系、学习与经验曲线效应等)、自然资源(如冶金业对矿产的拥有)、地理环境(如造船厂只能建在海滨城市)等方面,这其中有些障碍是很难借助复制或仿造的方式来突破的。预期现有企业对进入者的反应情况,主要是采取报复行动的可能性大小,则取决于有关厂商的财力情况、报复记录、固定资产规模、行业增长速度等。总之,新企业进入一个行业的可能性大小,取决于进入者主观估计进入所能带来的潜在利益、所需花费的代价与所要承担的风险这三者的相对大小情况。 规模经济形成的进入障碍: ①表现于企业的某项或几项职能上,如在生产、研究与开发、采购、市场营销等职能上的规模经济,都可能是进入的主要障碍。 ②表现为某种或几种经营业务和活动上。 ③表现为联合成本,即企业在生产主导产品的同时并能生产副产品,使主导产品成本降低,这就迫使新加入者也必须能生产副产品,不然就会处于不利地位。 通过规模经济,能够合理的降低成本以及提高市场竞争力,因此手势识别技术系统行业对规模化的要求在逐渐的提高。由于手势识别技术系统行业的规模的提高,这也给潜在进入者造成一定的进入壁垒。同时政策的要求也给新进入者造成一定的限制。这些因素在一定程度上降低了手势识别技术系统领域的竞争力度。 替代品威胁 两个处于同行业或不同行业中的企业,可能会由于所生产的产品是互为替代品,从而在它们之间产生相互竞争行为,这种源自于替代品的竞争会以各种形式影响行业中现有企业的竞争战略。 首先,现有企业产品售价以及获利潜力的提高,将由于存在着能被用户方便接受的替代品而受到限制; 第二,由于替代品生产者的侵入,使得现有企业必须提高产品质量、或者通过降低成本来降低售价、或者使其产品具有特色,否则其销量与利润增长的目标就有可能受挫; 第三,源自替代品生产者的竞争强度,受产品买主转换成本高低的影响。总之,替代品价格越低、质量越好、用户转换成本越低,其所能产生的竞争压力就强;而这种来自替代品生产者的竞争压力的强度,可以具体通过考察替代品销售增长率、替代品厂家生产能力与盈利扩张情况来加以描述。

手势识别技术原理及解决方案

手势识别对于我们来说并不陌生,手势识别技术很早就有,目前也在逐渐成熟,现在大部分消费类应用都在试图增加这一识别功能,无论是智能家居,智能可穿戴以及VR 等应用领域,增加了手势识别控制功能,必能成为该应用产品的一大卖点。手势识别可以带来很多的好处,功能炫酷,操作方便,在很多应用场合都起到了良好的助力功能。 手势识别技术的发展 说起手势识别技术的发展,可以粗略分为两个阶段:二维手势识别以及三维手势识别。 早期的手势识别识别是基于二维彩色图像的识别技术,所谓的二维彩色图像是指通过普通摄像头拍出场景后,得到二维的静态图像,然后再通过计算机图形算法进行图像中内容的识别。二维的手型识别的只能识别出几个静态的手势动作,而且这些动作必须要提前进行预设好。 相比较二维手势识别,三维手势识别增加了一个Z轴的信息,它可以识别各种手型、手势和动作。三维手势识别也是现在手势识别发展的主要方向。不过这种包含一定深度信息的手势识别,需要特别的硬件来实现。常见的有通过传感器和光学摄像头来完成。 手势识别的关键技术 手势识别中最关键的包括对手势动作的跟踪以及后续的计算机数据处理。关于手势动作捕捉主要是通过光学和传感器两种方式来实现。手势识别推测的算法,包括模板匹配技术(二维手势识别技术使用的)、通过统计样本特征以及深度学习神经网络技术。

根据硬件实现方式的不同,目前行业内所采用的手势识别大约有三种: 1、结构光(Structure Light),通过激光的折射以及算法计算出物体的位置和深度信息,进而复原整个三维空间。结构光的代表产品有微软的Kinect一代。不过由于以来折射光的落点位移来计算位置,这种技术不能计算出精确的深度信息,对识别的距离也有严格的要求。 2、光飞时间(TIme of Flight),加载一个发光元件,通过CMOS传感器来捕捉计算光子的飞行时间,根据光子飞行时间推算出光子飞行的距离,也就得到了物体的深度信息。代表作品为Intel带手势识别功能的三维摄像头。 3、多角成像(MulTI-camera),现在手势识别领域的佼佼者Leap MoTIon使用的就是这种技术。它使用两个或者两个以上的摄像头同时采集图像,通过比对这些不同摄像头在同一时刻获得的图像的差别,使用算法来计算深度信息,从而多角三维成像。 简单介绍两个手势识别解决方案: 1、基于NXP LPC824 和Vishay VCNL4020 的手势识别方案 推出基于NXP LPC824 和Vishay VCNL4020 的手势识别方案,可以判断手势运动的

手势识别综述

手势识别综述 【摘要】介绍了手势识别的定义、分类,手势识别的过程,动态手势识别的过程。 【关键词】手势建模;傅里叶描述子;动态手势 1手势定义和分类 通常在人机交互领域手势定义为:人类通过手掌和手指的不同姿势组合形成的具有特定含义的信息的集合体称为手势。 手势通常可以分为操作性手势和交流性手势:如钢琴伴奏家在弹奏钢琴时的手指动作属于操作性手势,通过十个手指的不同组合,在键盘上发出不同声音形成乐曲的弹奏,只有操作的含义,不含有视觉上信息。马路上交警指挥路况时手上的动作属于交流性手势,通过司机观察交通警察手上不同动作理解警察的意思,含有视觉上的信息。 按照手势在表达的信息中所处的地位分为自主性手势和非自主性手势:哑语演示时表演者手上的手势动作完全表达了哑语表演者的思想,手势在语义交流中占主导地位,属于自主性手势,演员表演节目时有时为了更好的表达情感会用手势加深语义表达,但是手势只是为了更好表达意思,起到对演员表达思想的补充,这种手势动作这属于非自主性手势,在语义表达中不占主导地位。按照手势在交流活动中手势的作用对象分为离心手势和向心手势:比如说话人在下命令时手指向受命人这种手势属于离心手势,例如交通警察在交通管制中的手势属于离心手势,当听到某消息时听者会有相应的情感反应这时的手势属于向心手势,例如小朋友表示不同意时摇手即为向心手势。当操作者利用手势表达思想的时候有两种方式,一种是手臂不动完全通过手指和手掌的运动来表达操作者的意思,还有一种是忽略手指的运动,通过手的运动轨迹来表达思想。当我们做研究时会遇到手和手指同时运动的情况这时为了分类方便,需要做相应约束,当手是动的应忽略手指的动作,反之如果手指在动这时应忽略手的运动轨迹。因为基于表观的手势识别最终面临的是手的2D图像如果手和手指的运动同时考虑的话会给分类造成不必要的麻烦。 2手势识别的分类 按照对手势数据采集的方式分为数据手套型和摄像头型。 2.1数据手套 虚拟现实中重要组成部分,是一种通用的人机接口他可以将手指的复杂动作通过传感器反应到虚拟环境中去,在虚拟环境中真实再现手部动作。数据手套使用的效果关键是手套能不能将手指、手掌、手腕的弯曲真实的以数据形势反演到系统数据库中,让系统根据模型对手势进行有效识别,由于手部软组织和计算复杂性,数据手套的计算速度总是存在延时,同时从人机交互的角度手套佩戴也十分不方便,如果多人使用还存在卫生等问题,因此数据手套目前来说只是应用在试验阶段,真正推广到社会应用还有很多问题要解决。例如由海军某课题组开发的某型飞机训练仿真系统采用了数据手套,将人的动作如拉升飞机操纵杆通过数据手套反应到系统中,但是不足之处是手套存在一定的延时,通常第二个动作都准备做了,第一个动作系统往往还没执行,这和真实的飞机操作存在很大的差别,但是要想系统及时接受数据手套传感来的数据,往往对系统的中央处理器要求很高,需要大量投入经费和人力,存在一定的矛盾。因此数据手套在虚拟仿真中往

基于深度图像技术的手势识别方法

龙源期刊网 https://www.wendangku.net/doc/0816601940.html, 基于深度图像技术的手势识别方法 作者:付学娜 来源:《电子技术与软件工程》2015年第04期 所谓手势是指人手或手臂同人手结合而产生的动作或姿势,作为人机交互的一项重要技术,手势识别通过在人手安置相关的硬件设备,并通过硬件设备中的计算模块对人手的位置和速度等信息进行获取,对于识别过程中的定位和跟踪均都具有良好的指导和保障作用。本文通过对手势识别系统与深度图像的成像原理进行阐述,进而结合手势区域分割的相关理论,对基于深度图像技术的手势识别方法展开了深入研究。 【关键词】深度图像技术手势识别圆形轨迹像素值变化点 随着科技的不断发展,基于视觉的手势识别已成为新一代人机交互中的核心技术。在借助相关图像信息的基础上,计算机可以对人手的各种姿态信息以及不同的手势信息尽心准确识别,有效提高了识别的速度与质量。本文以基于深度图像技术的手势识别作为研究对象,通过对手势识别系统及深度图像成像原理进行分析,从手势区域分割以及手势特征提取两方面出发,对深度图像技术下手势识别的方法做出了详细分析。 1 手势识别系统与深度图像成像原理 基于深度图像技术的手势识别系统主要包括了手势、深度图像、手势区域分割、手势特征提取以及手势识别和人机交互等,深度图像以非接触测量的方式对场景中的深度信息进行采集,而所采集的深度信息具有较强的稳定性和可靠性,即不受物体(人手)自身颜色、背景环境和纹理特征等因素的影响。本文以微软的Kinect作为图像采集和获取深度信息的工具,进而对手势识别展开分析。 基于Kinect下的深度图像技术下所采集的640×480深度图像信息的速度可达30f/s,且信息的分辨率维持在5mm左右,在应用方面具有较强的合理性。通过在相关场景采集的场景深度值进行转换,使其转移到灰度值空间,并使深度图像中所有的像素点灰度值大小与实际场景中不同的深度值相对应,进而显示成像。值得注意的是品拍摄区域与深度摄像头之间的距离与图像中的灰度值呈现出明显的负相关关系,即灰度值越大,距离越近。 2 基于深度图像技术的手势识别 2.1 手势区域分割 虽然具有相同深度的像素点,其在深度图像中所具有的灰度值也具有较高的一致性,但由于在每次对人手手势进行拍摄时,人手同深度摄像头间的距离存在差异。因此,无法利用单一的固定阈值对手势区域进行分割,故本文以灰度值直方图作为主要研究方法,进而确定出相关背景及手势区域分割的阈值。由于人手做出相关姿势的区域距离深度摄像头较近,且相对于整

相关文档