文档库 最新最全的文档下载
当前位置:文档库 › 基于内容的图像检索技术研究

基于内容的图像检索技术研究

基于内容的图像检索技术研究
基于内容的图像检索技术研究

基于内容的图像检索技术研究

学号:10404400204 姓名:陈萍班级:数字媒体艺术1002班学院:包装与材料工程

〔摘要〕基于内容的图像检索技术是对图像的物理内容为加工对象的检索技术之一,主要实现方式包括基于颜色、纹理、形状和语义等。其中基于颜色的图像检索发展最为成熟,而基于语义的检索则尚处于探讨、研究阶段。

关键词:图像检索、内容、语义

引言

随着信息技术的普及与发展及应用,数字图像的数量正以惊人的速度增长。如何将数字图像处理、计算机视觉技术与传统数据库技术相结合,建立基于对图像内容自动或半自动描述的新一代图像视频数据库成为现在亟待解决的课题。基于内容的图像检索(CBIR)是解决这一问题的关键技术之一。CBIR与传统的检索手段不同,它是利用图像的颜色、纹理、形状等基本特征进行检索,并把这些量化特征与图像存储在一起,它的特点是:直接从媒体内容中提取信息线索。基于内容的检索是一种近似匹配;特征提取和索引建立常需要用人机交互的方法,学习人的主观相似度感受。它主要使用的是基于相似度量的示例查询方法。

2 基于内容的图像检索技术

基于内容的图像检索的前提是基于内容的描述。图像内容既包括了颜色、纹理、形状等低层次视觉特征,又包括了对目标意义的复杂推理等的高层语义特征。检索进行查询的层次基本可分为三层:

(1 )基于原始数据的查询。这是最低层次的查找,每一幅图像为像素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较,这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。

(2 )基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存,查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。(3 )基于语义的查询。这是最高层次的查询,可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。目前实现图像检索的手段有很多,包括基于分数维的图像检索,基于多颜色空间的图像检索方法,基于内容的图像检索,基于区域的图像匹配算法的关键技术研究,基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未到图像语义的图像检索阶段。

2.1 基于颜色特征

颜色是一种重要的,目前使用最广的视觉特征,同一类事物通常有着相似或相同的颜色特征。因此可以利用颜色特征来区分不同物体, 也是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色往往和图像中所包含的物体或场景十分相关,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。基于颜色特征的检索主要采用的方法包括颜色直方图、颜色矩、颜色相关图等。颜色直方图是在许多图像检索系统中被广泛采用的颜色特征,特别适于描述那些难以进行自动分割的图像。

2.2 基于形状特征

形状是刻画物体的本质特征之一,在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述。目前的基于形状检索方法大多围绕着从形状的外轮廓特征和形状的区域特征建立

图像索引,总的来说,形状表示法可以分为2 类:基于边界的和基于区域的。前者仅使用形状外边界,而后者则用了整个形状的区域信息。在基于形状的图像检索中有3个问题需要解决,首先,形状通常与图像中的特定目标对象有关, 因此形状比颜色和纹理的语义性更强,要获得目标的形状参数,先要进行图像分割,所以形状特性会受到图像分割效果的影响。其次,描述目标的形状是一个非常复杂的问题,人对形状的感觉是视网膜感受和现实世界的知识相结合的结果。事实上,目前还没有找到与人的主观感觉完全匹配的形状模型。第三,从不同的视角获得的形状可能会有很大差别,为了准确进行形状匹配,需要解决平移、缩放、旋转中的不变性问题。形状的表示方法有两类:基于边界的表示和基于区域的表示,这两种表示方法的典型代表分别是傅里叶描述子和不变矩。傅里叶描述子的基本思想是用对图像进行傅里叶变换得到的边界作为形状描述,它的优点就是把二维问题简化为一维问题。傅里叶变换的高频分量对应细节而低频分量对应总体形状,所以可以只用一些对应低频分量的傅里叶系数来近似描述边界形状。比较了基于区域的方法、基于边界的方法和两种方法的综合使用,实验结果表明,两种方法综合使用效果更好。

2.3 基于纹理特征

在许多类图像中,纹理是一种十分重要的特征。通常人们将那些在图像局部区域内呈现不规则性,儿在整体上表现出某种规律性的特征称为纹理。例如,大部分航空和卫星遥感图像医学显微图像以及石油地球物理勘探所得到的人工地震剖面图像等。因此研究对纹理的描述、纹理图像的分割、分类等,不仅是图像处理领域的重要理论研究课题,同时也有着广泛的应用前景。图像或物体的纹理特征反映了图像或物体本身的属性,常用粗糙性、方向性和对比度等来描述。对纹理图像的描述常借助纹理的统计特性或结构特性进行,对基于空域的性质也常可转换到频域进行活动,所以常用的纹理描述方法是:统计法、频域法、结构法。统计法从图像有关属性的统计分析出发;结构法则力图找出纹理基元,再从结构组成上探索纹理的组成规律。一般来说,统计分析方法能够取得较好的效果,所以一直占据着主导地位。早期的研究方法主要有马尔可夫随机场理论GMRF(Gaussian Markov random field)和吉布斯分布(Gibbs distribution)理论,这些方法主要考虑了一定范围内图像点的关系。随着小波的出现及其在图像处理中的应用,基于多尺度多分辨率的算法逐渐成为主流。Michael Unser采用如下算法:对纹理图像进行小波变换;计算各予频带内小波系数的平方和的均值作为特征向量;通过计算Bayes距离,碍出样本与各融知纹理的相似度,从而进行分类。

2.4 基于语义特征

与基于低层物理特征查询不同,语义特征查询是基于文字的查询,查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。图像语义具有模糊性、复杂性、抽象性,一般包括3个语义层次:特征语义、目标和空间关系语义。高层语义特征语义就是图像的颜色、形状、纹理等低级视觉特征,与视觉感知直接相连;目标语义和空间关系语义需要识别和提取图像中的目标类别目标之间的空间位置等关系,涉及到模式识别和逻辑推理的相关技术。一般而言,高层的图像语义往往建立在较低层次的语义获得的基础上,并且层次越高,语义越复杂,涉及的领域知识越多。基于语义的图像检索一般指的是基于目标和高级语义的图像检索方法。

3 基于内容的图像检索的效果评价

在基于内容的检索中, 由于检索算法比较多,需要对各种算法的检索结果进行评判,以比较其优劣从研究情况来看,对于系统的响应时间和吞吐率的评价论述的较少,对检索效果评价更多地放在对检索结果的正确与否,主要使用查找率评价检索效果。

4 总结

综上所述,可以看出基于内容的图像检索仍然是一个开放性的研究课题,其研究将涉及认知科学、人工智能、模式识别、图像处理、信息检索等多个领域。对于基于内容的图像检

索中存在的重要问题,在图像处理和模式识别方面今后较长的时间内仍需要继续完善图像特征的提取、表达、相似性度量。目前国际上MPEG标准化组织正在制定的MPEG - 7 标准, 其目标就是实现集高层语义特征和低层视觉特征的基于内容的多特征综合检索,今后研究的热点之一将是高层的基于语义内容的图像检索。寻找快速智能的检索算法和如何设计用户的反馈方式并充分反馈信息也是今后一个重要的研究方向。

参考文献:

[1]姚弘,基于内容的图像检索技术研究,中国新技术新产品,2010,(8):20—21.

[2]盛永华,基于内容的图像检索技术,信息科学,2010.

[3]戴磊,基于内容的图像检索关键技术的改进策略,福建电脑,2010,(5):12—13.

[4]陈桂兰1, 曲天伟2, 陈小丹1,基于内容的图像检索技术,信息技术,2010,(2):15—17.

[5]张红霞,基于内容的图像检索技术简析,考试周刊,2011,(17):156—158.

[6]王剑,贾世杰,基于内容的图像检索技术研究,信息技术,2009,(8):18—23.

[7] 王伟平,基于内容的图像检索技术研究进展及其在数字图书馆中的应用,信息技术,2008.

[8] 钱万里,基于内容的图像检索技术在数字档案馆建设中的应用,信息技术,2009,155(3):109—116.

[9]孟祥娜1,李玉萍1,王春立2,基于内容的图像检索技术综述,渤海大学学报(自然科学版),2009.

[10]刘佳,钮可,基于内容的图像检索特征提取技术,科技信息,2010.

[11]Jvrgen Assfalg,Marco Bertini,Alberto Del Bimbo,Content-Based Retrieval of 3-D Objects Using Spin Image Signatures,IEEE TRANSACTIONS ON MULTIMEDIA,2007.

关于图像检索的学习报告

关于“图像检索”的查析报告 图像检索 定义: 在图像集合中查找具有指定特征或包含指定内容的图像的技术。 何为图像检索 在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。 基于文本的图像检索 基于文本的图像检索沿用了传统文本检索技术,回避对图像可视化元素的分析,而是从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像,一般以关键词形式的提问查询图像,或者是根据等级目录的形式浏览查找特定类目下的图像。图像所在页面的主题、图像的文件名称、与图像密切环绕的文字内容、图像的链接地址等都被用作图像分析的依据,根据这些文本分析结果推断其中图像的特征。 在基于文本的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题:一是这种方法需要较多的人工参与,而且随着图像数目的增加,这种方法很难实现; 二是由于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果不能很好地符合用户的需求。 因此,利用图像本身的内容进行检索势在必行。 基于内容的图像检索 基于内容的图像检索,即CBIR(Content-based image retrieval),是计算机视觉领域中关注大规模数字图像内容检索的研究分支。基于内容的图像检索的研究还涉及了图像处理(Image Processing)、图像检索(Image Retrieval)等多个研究领域。 工作流程 基于CBIR 技术的图像检索系统,在建立图像数据库时,系统对输入的图像进行分析并分类统一建模,然后根据各种图像模型提取图像特征存入特征库,同时对特征库建立索引以提高查找效率。而用户在通过用户接口设置查询条件时,可以采用一种或几种的特征组合来表示,然后系统采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度,然后按照相似度从大到小的顺序将匹配图像反馈给用户。用户可根据自己的满意程度,选择是否修改查询条件,

人脸识别技术的应用背景及研究现状

1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面: (1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

图像哈希检索背景综述(一)

慌乱挣扎的第一个学期终于马上就要结束。 差不多忙活了一个学期,最近终于开始慢慢理清楚这个思路,也准备开始使用一些benchmark的数据集来对某一篇paper的算法做一下实验,实现一下。 感觉自己的思路有时候不太清晰,因此现在开始想写一点东西,把自己做的事情和思路一步步记录下来,包括以后每次看的paper的理解,也能够成为见证自己学习的一个过程。现在从最开始的背景综述开始写起。 现在的图像检索技术基本上还是分为两类,基于文本的图像检索(Text-based Image Retrieval,TBIR)和基于内容的图像检索(Content-based Image Retrieval, CBIR)。 基于文本的图像检索也就是主要利用文本描述的方式对一幅图像进行特征的描述,建立相应的描述子或者key words,比如图像的年代、作者、尺寸、编码、名称等一些关键性的信息,将它们进行自动或者人工采集标注,产生图像的索引数据库,然后将用户输入的关键字,进行匹配查找,再返回结果的一种图像检索方式。它易于实现,查准率也较高,但是存在文本描述有限,有些图像特征不好描述甚至无法描述,而且存在不同描述人的较大的主观性,并且需要人工标注,在海量数据的处理中越来越失去应用价值,进而也不能满足检索的要求。 基于内容的检索技术是由计算机对图像的特征进行分析,提取特征,如颜色、纹理和形状等,将提取的特征作为向量存入图像数据库,对于输入的检索图片做相同的处理,利用相似性准则计算该查询图片与图像特征库中的每一个特征向量的相似度,根据相似度排序后,输出给定阈值下的检索结果。其优点在于使用机器对图像的内容进行判别性的信息提取,得到特征的描述子,不需要人为地对图像进行文本标注;并且,该过程作为一个近似匹配的过程,对于检索效率的提升也有了很大的贡献,但是对于图像特征的提取上,复杂的算法需要实现从最底层图像特征到高层的语义信息的联系显得有点困难,因此检索准确性上不是很高。 随着CBIR成为研究热点,目前国内外有了许多以图搜图的图像搜索引擎系统。总结了一下目前以图搜图的一些搜索引擎有以下: picitup,Google的按图搜索,图想,百度试图,TinEye,千视惠搜,搜鞋客等。 在海量数字图像数据再互联网上泛滥之后,对于图像的快速和有效检索就显得日益重要。传统的方法有基于树的索引结构,如k-d树,但它仅仅在处理低维数据时可以有效提高检索速度,当数据维度超过20维时,其检索效率就接近于穷举的搜索方式。因此,目前针对高维数据的快速检索问题,图像哈希技术在上世纪九十年代末诞生。

4-基于内容的图像检索

研究生课程 数字图像处理Digital Image Processing 彭宇新 北京大学计算机科学技术研究所E_mail:pengyuxin@https://www.wendangku.net/doc/af17882644.html,

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

为什么需要基于内容的图像检索? ●当前图像内容的特征 ?海量的图像内容出现 人类已有的:历史、地理、军事、医学… 每天新增的:数码相机、互联网?图像内容的特征:没有索引、目录或摘要 ?怎样找到需要的图像?

●基于文字描述的图像检索 ?丰富的图像内容很难用文字来全面描述 ?文字的选取因人而异,带有很大的主观性 ?耗费大量的人力和时间 ●结论:对于海量的图像,基于人工标注文字的检索已不可能 ●问题:目前搜索引擎提供的基于文字的图像检索,能够解决问题吗?解决得好吗?为什么需要基于内容的图像检索?

●为什么需要基于内容的图像检索(CBIR)? ?提供图像的检索功能 ?不需要人手工标注,计算机自动分析和检索,节省人力和时间 ?使海量图像的管理和索引成为可能 ?存在的问题: 人类高级语义特征与计算机底层特征表示的矛盾 查询方式问题 为什么需要基于内容的图像检索?

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

基于内容的图像检索技术研究

基于内容的图像检索技术研究 学号:10404400204 姓名:陈萍班级:数字媒体艺术1002班学院:包装与材料工程 〔摘要〕基于内容的图像检索技术是对图像的物理内容为加工对象的检索技术之一,主要实现方式包括基于颜色、纹理、形状和语义等。其中基于颜色的图像检索发展最为成熟,而基于语义的检索则尚处于探讨、研究阶段。 关键词:图像检索、内容、语义 引言 随着信息技术的普及与发展及应用,数字图像的数量正以惊人的速度增长。如何将数字图像处理、计算机视觉技术与传统数据库技术相结合,建立基于对图像内容自动或半自动描述的新一代图像视频数据库成为现在亟待解决的课题。基于内容的图像检索(CBIR)是解决这一问题的关键技术之一。CBIR与传统的检索手段不同,它是利用图像的颜色、纹理、形状等基本特征进行检索,并把这些量化特征与图像存储在一起,它的特点是:直接从媒体内容中提取信息线索。基于内容的检索是一种近似匹配;特征提取和索引建立常需要用人机交互的方法,学习人的主观相似度感受。它主要使用的是基于相似度量的示例查询方法。 2 基于内容的图像检索技术 基于内容的图像检索的前提是基于内容的描述。图像内容既包括了颜色、纹理、形状等低层次视觉特征,又包括了对目标意义的复杂推理等的高层语义特征。检索进行查询的层次基本可分为三层: (1 )基于原始数据的查询。这是最低层次的查找,每一幅图像为像素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较,这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。 (2 )基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存,查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。(3 )基于语义的查询。这是最高层次的查询,可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。目前实现图像检索的手段有很多,包括基于分数维的图像检索,基于多颜色空间的图像检索方法,基于内容的图像检索,基于区域的图像匹配算法的关键技术研究,基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未到图像语义的图像检索阶段。 2.1 基于颜色特征 颜色是一种重要的,目前使用最广的视觉特征,同一类事物通常有着相似或相同的颜色特征。因此可以利用颜色特征来区分不同物体, 也是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色往往和图像中所包含的物体或场景十分相关,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。基于颜色特征的检索主要采用的方法包括颜色直方图、颜色矩、颜色相关图等。颜色直方图是在许多图像检索系统中被广泛采用的颜色特征,特别适于描述那些难以进行自动分割的图像。 2.2 基于形状特征 形状是刻画物体的本质特征之一,在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述。目前的基于形状检索方法大多围绕着从形状的外轮廓特征和形状的区域特征建立

语义图像检索研究进展

语义图像检索研究进展 【摘要】本文探讨了基于语义图像检索相关技术,并且通过对语义图像检索技术的了解,我们讨论了语义图像检索存在的问题与其的发展方向。本文的研究具有重要的理论价值,同时为语义图像检索的发展起到启迪的作用。 【关键词】语义;图像检索;研究;进展 一、前言 在当今社会发展不断快捷的今天,人们有时候需要快速地检索出自己需要的图像,但是现在的图像信息是巨大的,这时候我们就需要某项技术能够帮助人们更快的找到我们需要的图像,基于语义的图像检索技术就是检索图像的方式之一,相信通过对其的研究能够达到更好的图像检索效果。 二、基于语义图像检索相关技术 1、图像语义模型 由于人们对图像内容的理解有着不同的层次,有人从图像的颜色去理解,有人从图像的对象去理解,也有人从图像所表现出来的行为去理解,也就是说图像的语义是具有不同层次的。王惠锋、孙正兴在他们的文章中给出了一个图像语义层次模型所示。他们把图像的语义定义为六个层次,从上到下依次为,特征语义,是指图像低层物理特征(颜色、形状、纹理)及其之间的相互组合,如蓝色的天空、红色的太阳;对象语义,是指图像当中出现的具有一定意义的对象,如一条狗、一座山;空间关系语义,是指图像各个对象之间的空间关系,如人旁边有条狗,狗旁边有只猫;场景语义,是指所有图像中对象所在的背景环境,如学校、森林;行为语义,是指图像内容所表现出的某种行为。 2、图像语义表示 如何描述图像的语义对语义的提取以及检索的效率有着十分重要的影响。语义的表示不仅要把图像的内容准确而客观的描述出来,对不同的内容有着不同的抽象,而且表示形式应当尽量简单、直观,同时考虑不同用户的不同需求。目前图像语义的表示方法大概有以下几种。 (1)文本形式。文本形式是最简单,也是最直观的图像语义表示方法。它是用关键字对整幅图像或图像的区域进行注解,另外还可以利用WordNet[26]将关键字之间的语义关系联系起来,而且它具有一定地同义词解析以及模糊匹配的能力。目前大多数的图像检索系统都是采用这种方法来表示图像语义的,比如IRIS 系统。但其不足之处也相当明显,它对具有复杂丰富内容的图像显得无能为力,而且自动获取这些关键字也存在着相当大的困难。 (2)知识表示方法。它是基于人工智能中的一些知识表示方法,如语义网

图像识别技术发展状况及前景

医学图像配准技术 罗述谦综述 首都医科大学生物医学工程系(100054) 吕维雪审 浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价 值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评 估方法。 关键词医学图像配准多模 1 医学图像配准的概念 在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。 医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。 医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换 对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。 处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

基于内容的图像检索技术

第二部分 基于内容的图像检索技术 近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的速度增长。无论是军用还是民用设备,每天都会产生容量相当于数千兆字节的图像。这些数字图像中包含了大量有用的信息。然而,由于这些图像是无序地分布在世界各地,图像中包含的信息无法被有效地访问和利用。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。自从20世纪70年代以来,在数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术已逐渐成为一个非常活跃的研究领域。数据库和计算机视觉两大领域是从不同的角度来研究图像检索技术的,前者基于文本的,而后者是基于视觉的。 基于文本的图像检索技术(text-based image retrieval)的历史可以追溯到20世纪70年代末期。当时流行的图像检索系统是将图像作为数据库中存储的一个对象,用关键字或自由文本对其进行描述。查询操作是基于该图像的文本描述进行精确匹配或概率匹配,有些系统的检索模型还是有词典支持的。另外,图像数据模型、多维索引、查询评价等技术都在这样一个框架之下发展起来。然而,完全基于文本的图像检索技术存在着严重的问题。首先,目前的计算机视觉和人工智能技术都无法自动对图像进行标注,而必须依赖于人工对图像做出标注。这项工作不但费时费力,而且手工的标注往往是不准确或不完整的,还不可避免地带有主观偏差。也就是说,不同的人对同一幅图像有不同的理解方法,这种主观理解的差异将导致图像检索中的失配错误。此外,图像中所包含的丰富的视觉特征(颜色或纹理等)往往无法用文本进行客观地描述的。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。此后几年中,这个研究领域中的许多技术发展起来,一大批研究性的或商用的图像检索系统被建立起来。这个领域的发展主要来归功于计算机视觉技术的进步,在文献[]中有对这一领域的详细介绍。 应该认识到,基于内容的图像检索系统具有与传统基于文本的检索系统完全不同的构架。首先,由于图像依赖其视觉特征而非文本描述进行索引,查询将根据图像视觉特征的相似度进行。用户通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由系统查找与例子图像在视觉内容上比较相似的图像,按相似度大小排列返回给用户。这就是所谓的通过例子图像的检索(query by image example)。另外,基于内容的检索系统一般通过可视化界面和用户进行频繁的交互,以便于用户能够方便地构造查询、评估检索结果和改进检索结果。 下图表示了基于内容的图像检索系统的体系结构。系统的核心是图像特征数据库。图像特征既可以从图像本身提取得到,又可以通过用户交互获得,并用于计算图像之间的相似度。用户和系统之间的关系是双向的:用户可以向系统提出查询要求,系统根据查询要求返回查询结果,用户还通过对查询结果的相关反馈来改进查询结果。图中还标出了基于内容的图像检索中的一些关键环节: 1) 选择、提取和索引能够充分表达图像的视觉特征。

基于内容的图像检索系统报告

第六届浙江省大学生电子商务竞赛 作品名称:基于内容的网络商品图像检 索系统 作品类别:技术类 2011年3月13日

目录 第1章项目背景 (3) 第2章关键技术介绍 (6) 第3章系统分析与设计 (8) 3.1需求分析 (8) 3.1.1功能性需求分析 (8) 3.1.2非功能性需求分析 (8) 3.2系统设计 (10) 3.2.1 总体结构设计 (10) 3.2.2 功能模块设计 (11) 3.2.3 检索流程设计 (12) 3.2.4数据存储设计 (14) 3.2.5 算法设计 (17) 第4章系统实现 (25) 4.1 数据采集模块 (25) 4.2 数据检索模块 (28) 4.3 数据显示模块 (29) 4.4 数据推送模块 (34) 第5章盈利模式与市场营销推广策略 (36) 5.1目标市场 (36) 5.2盈利模式 (36) 5.3 系统推广策略 (37) 第6章财务分析 (41) 6.1搜索系统建设成本 (41) 6.2搜索引擎运行维护成本 (41) 6.3搜索系统宣传推广成本 (42) 第7章风险及对策 (43)

7.1市场风险及对策 (43) 7.2技术风险及对策 (43) 7.3项目风险及对策 (44) 7.4竞争风险及对策 (44) 第8章创新点 (45) 第9章总结 (46) 【参考文献】 (47)

第1章项目背景 随着计算机软硬件和互联网技术的飞速发展,多媒体数据的数量以惊人的速度增长。各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。因此如何利用如此众多的图像信息并从中定位感兴趣的图像,是对图像信息的查询技术提出的重大挑战。 早在1951年,信息检索(Information Retrieval)这一术语就被Calvin M oores描述为使用户的信息需求能够变为最终的有用信息的过程。当然,他当时指的是文本格式的文件检索。但他的描述却揭示了信息检索系统的实质:帮助用户具体定位相关信息。 在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(Image Retrieval)的研究成为热点。由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。数据库管理领域的研究采用基于文本的图像检索方法,而计算机视觉领域则偏重于基于视觉的图像检索。 基于文本的图像检索(text-based image retrieval),主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;其二,许多图像很难用文字的方式进行描述;其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的阻碍。因此基于文本方式的图像检索存在很大的局限性。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术

图像检索系统

摘要 基于文本的图像检索技术存在两个缺点。首先,标注每个图像是比较困难的;再次主观性和图像注释的不精确性在检索过程中可能引起适应性问题。基于内容的图像检索技术克服了传统的图像检索技术的缺点。基于内容的图像检索技术分为特征提取和查询两个部分。本文主要介绍基于颜色特征的图像检索技术颜色特征是图像的基本特征也是最为直观的特征之一。着重探讨了颜色空间的选取颜色特征的提取和表达颜色的相似度以及现有的图像的检索系统和存在的问题。在这里颜色空间的选取有RGB颜色模式HSV颜色模型。颜色提取的基本思想是用颜色直方图来统计每种颜色出现的概率。目前相关的系统有QBIC系统、Photo book系统、CORE系统等等。 关键词:基于内容的图像检索技术;特征提取;特征表达;颜色直方图; Abstract Traditional text-based image retrieval techniques have two shortcomings: First, it has been difficulties to note each image. Second, the subjectivity and no precision of image anno-tation may lead to the adaptation in the retrieval process. CBIR overcome the shortcomings of the traditional text-based image retrieval .Content-based image retrieval can divide into two parts, that is feature extraction and query. In this paper, based Color Image Retrieval is mainly introduced. Color features are the basic characteristics of the image as well as are one of the most intuitive features. Here we focused on the selection of color space, color feature extrac-tion and expression, color similarity, and the existing image retrieval systems and problems. There are many color models to express color such as the RGB color model, the HSV color model. The basic idea to extract color is to use color histogram to calculate the probability statistics of each color .Currently there are some related systems QBIC system related system, Photo book system, CORE system and so on. Keywords: Content-based image retrieval; Feather extraction; Feather presentation; color histogram;

基于内容的图像检索方法研究现状

基于内容的图像检索方法研究现状 【摘要】本文对基于内容的图像检索方法做了较详细的总结,其中主要讨论了空间域图像检索算法,基于颜色、形状、纹理、频率域的图像检索算法,进行研究比较。 【关键词】图像检索方法;颜色图像检索算法、形状图像检索算法、纹理图像检索算法、频率域的图像检索算法 一、引言 为了解决基于文本关键字的图像检索存在的问题,基于内容的图像检索方法成为图像检索的研究热点。基于内容的图像检索方法就是在将图像存入图像库的同时,自动提取反映该图像内容的特征向量,并存入与图像库相连的特征库。在进行图像检索时,对每一幅给定的查询图像自动提取该图像的特征向量,通过将该图像特征向量与特征库中的特征向量进行匹配,并根据匹配结果到图像库中搜索,就可提取出与所查询图像最相似的图像。 二、空间域图像检索算法 随着基于内容图像检索算法为人们所逐渐重视,空间(像素)域图像检索算法被广泛研究。所谓空间域图像检索是指直接在数字图像矩阵上提取图像特征,对图像进行相似性匹配,提取特征为颜色,形状和纹理信息。 2.1基于颜色的图像检索方法 颜色具有一定的稳定性,是图像最直观而明显的特征,因此成为检索中最常用的视觉特征。基于颜色的图像特征一般采用直方图来描述,其算法基本上都是以颜色直方图相交算法为基础而设计。用色彩特征进行图像检索可以追溯到Swain和Ballard提出的色彩直方图的方法。主要可以分为两类:全局色彩特征索引和局部色彩特征索引。 1、全局色彩特征索引 全局色彩特征索引方法目前采用最多的是色彩直方图的方法。Pass等人提出以图像的色彩聚合矢量CCV来作为图像的索引,它是图像直方图的一种演变。Stricker和Orengo提出了累计色彩直方图方法,并提出了色彩矩的方法,认为色彩信息集中在图像色彩的低阶矩中。他们对每种色彩分量的一阶、二阶和三阶矩进行统计。Rickman和Stonham提出了色彩元组直方图的方法,将一幅图像中的所有色彩用一些色彩元组来表示,这些色彩元组特征形成了一个特征编码簿,然后对一幅图像中特定位置的n个采样点所对应的色彩元组的特征值在特征编码簿中出现概率进行统计,就形成了一个色彩元组的直方图。

关于人工智能中的图像识别技术的研究

191 关于人工智能中的图像识别技术的研究 翁和王 (武夷学院数学与计算机学院,福建武夷山354300) 摘要:图像识别技术作为在信息时代发展起来的一项信息技术,其主要是利用计算机对人工进行替代,实现对众多的物 理信息进行处理。计算机技术快速发展也推动了图像识别技术得以迅猛的发展。文章就图像识别的技术原理、模式识别进行图像识别技术概述,并对其识别过程进行一定的分析,重点对神经网络以及非线性降维两个形式的图像识别技术加以分析。以期对图像识别有关的研究人员与应用人士有所参考。关键词:人工智能;原理与过程;图像识别技术;非线性;神经网络中图分类号:TP18文献标识码:A 文章编号:1673-1131(2016)10-0191-02 0引言 图像识别技术作为人工智能内的重要领域之一,在计算机技术和信息技术快速发展的背景下,其也得到了愈发广泛的使用,其在医疗诊断、指纹识别、面部识别以及卫星云图识别等方面具有着很好的应用。图像识别技术通常是指利用计算机对系统前端捕获的图片根据既定的目标对其进行处理。图像识别在人们日常的生活中也得到普遍的应用,诸如条码识别、车牌捕捉以及手写识别等。随着其不断的发展与完善,其今后的应用领域也会更加的广泛。 1图像识别技术的概述1.1图像识别的技术原理 事实上,图像识别具有的原理并非很深奥,主要是图像识别所需处理的信息非常的复杂。计算机中的所有处理技术均不能随意出现,是众多学者通过实践获得的启示,通过程序使其得到模拟与实现。计算机实现图像识别所需的原理与人类进行图像识别所需的原理基本上是一致的,仅仅是计算机不存在人类视觉和感觉方面的影响。人类在进行图像识别过程中并非仅是利用这一图像存在于脑海内的记忆加以识别,而是通过图像自身拥有的特征对其进行相应的分类,之后利用各个类别拥有的特征使图片被识别出来。当我们看到图片时,大脑便会快速感知出以前见过这张或与之相类似的图片与否。事实上在看到和感知间已经实现了快速的识别,这一识别与搜索存在一定的相似性[1]。在识别过程中,大脑将会按照存储记忆内被分好类的图片展开识别,检查其是否和这一图像存在相同或者是类似特征记忆存储,便识别出以往时候看见过这一图片。计算机进行图像识别的原理也是这样,利用分类和提取出图像的重要特征,并对多余的无用特征加以有效地排除,以此实现对图像的识别。计算机所能提取出来的上述特征有时会较为明显,而有时也会非常的普通,这在极大程度上对计算机识别效率造成一定的影响。总而言之,利用计算机进行视觉识别时,图像中的内容一般是通过图像特征对其加以描述的[2]。 1.2模式识别 模式识别作为信息科学与人工智能中的重要组成,其通 常是对现象和事物处于不同形式中信息实现处理与分析,以便能够达到对现象与事物进行分类、描述以及辨认等目标。而计算机能够实现图像识别便是对人类进行图像识别时的一种模拟,在实现图像识别时,能够展开模式识别是不可或缺的。以往的模式识别仅仅是人类所掌握基本智能之一,伴随人工智能以及计算机技术得到兴起与发展,人类自身具有的识别 模式便无法再满足人类的生活需求,对此人们便需要利用计算机来对人类脑力劳动进行一定程度的替代与扩展。这也就产生了计算机形式的模式识别。简而言之,模式识别便是对数据实现分类,其是一门和数学有着密切联系的科学,其所运 用的大量思想便是数学中的统计和概率[3] 。可以将模式识别分成统计模糊模式、识别模式识别以及句法模式识别三类。 2图像识别技术的识别过程 由于计算机进行图像识别和人类进行图像识别所采用的是一样的原理,因此上述两种识别过程也会存在一定的相似性。可以将图像识别技术划分为如下几步:第一步,信息的获取,其是指利用传感器将声音和光等信息装换为电信号,简而言之便是获取识别对象具有的基本信息,同时将其装换成为计算机可以识别的信息。第二步,预处理,其是指对图像进行去噪、变换以及平滑等处理操作,以此来提升图像所具有的重要特点。第三步,特征抽取与选择,其是在模式识别过程中,要对图像进行特征的抽取与选择,简而言之便是识别的图像是多种多样的,若想通过一定的方式将其分离开,便要对图像中拥有的自身特征进行识别,在特征的获取时便称为特征抽取[4]。在进行特征抽取过程中,获取的特征并非一定对本次识别有所价值,此时便要对所获取的特征进行一定的提取,这便是特征选择。对于图像识别整个过程而言,特征抽取与选择时期中最为关键的步骤之一,因此,这一步使进行图像识别理解时的重点内容。第四步,分类器设计与分类决策,其中分类器设计即利用训练来制定出一个识别规则,借此识别规则便能够获得一个特征种类,从而让图像识别可以达到更高的辨识率。而分类决策则是对特征空间内的被识别对象实现分类的最佳识别方法。 3图像识别技术的研究分析 3.1神经网络形式的图像识别技术 神经网络形式的图像识别是目前较为新型的技术,其是基于以往的图像识别方式,并将神经网络算法进行有效的融合。这里所说的神经网络指的是人工神经网络,换句话说便是该神经网络并非是动物体所拥有的神经网络,而是人类根据动物神经网络进行人工模拟的一种神经网络。对于神经网络形式的图像识别技术而言,遗传算法和BP 神经网络进行有效的结合是目前基于神经网络形式的图像识别技术内最为经典的模型,其在诸多的领域之中均有所应用。对图像识别系统运用神经网络系统,通常先对图像特征进行提取,之后将图像特征向神经网络中加以映射,以此实现对图像的识别与分类。例如,对于智能汽车监控中拍照识别技术而言, 2016 (Sum.No 166) 信息通信 INFORMATION &COMMUNICATIONS 2016年第10期(总第166期)

相关文档