文档库

最新最全的文档下载
当前位置:文档库 > 图像检索技术综述_向友君

图像检索技术综述_向友君

第18卷第3期重庆邮电学院学报(自然科学版)V ol.18 No.3 2006年6月Journal of Chongqing U niversity of Posts and T elecommunications(N atural Science)Jun.2006

文章编号:100425694(2006)0320348207

图像检索技术综述3

向友君,谢胜利

(华南理工大学智能信息处理实验室,广州510640)

摘 要:对于一个图像检索系统,最重要的是信息获取的准确性、快速性和有效性。通过对现有信息检索技术的分析和比较,包括基于内容的信息检索、基于语义的信息检索、基于反馈的信息检索和基于知识的信息检索,指出了现有图像检索系统的难点和不足,同时指出了图像检索技术的发展趋势和研究方向。

关键词:基于内容图像检索;基于语义图像检索;基于反馈图像检索;基于知识图像检索

中图分类号:TN911.73 文献标识码:A

0引 言

基于内容的视觉信息检索(content2based visu2 al information ret rieval,CV IR)是视觉信息研究中的新热点。国际标准化组织ISO/IEC制定的M PEG27国际标准,对不同多媒体信息的描述进行统一标准,极大地促进了对各种多媒体信息的快速查询和访问。最初的图像检索方法利用传统的文本检索技术,为图像作出文字化的注释,以诠释图像的内容。这种方法的特点是简单、易于理解,但是其存在几个根本的问题难以解决。首先,随着图像/视频数据的不断增加,内容不断丰富,很难用文字标签来准确完全地表达其含义,同时对其进行注释的工作量也是非常巨大的。其次,传统的图像注释多采用手工完成,图像注释是靠观察者选出来加上去的,因此受主观因素影响很大,不同的观察者或同一观察者在不同条件下对同一幅图像可能作出不同的描述。最后,对不同的应用需要,可能需要对图像/视频进行不同的描述,这就需要对整个数据库中的数据进行重新制作,更新文字标签,因此这种方法只适用于特定的查询要求,不能满足不同的用户的需求。在本文中,我们根据不同的检索方法对现有的各种信息检索技术进行了系统分析和比较,重点研究了基于语义、反馈和知识的图像检索技术。其中,基于知识的图像检索技术将传统的基于文本的检索和基于特征的检索方法结合起来,融入了基于知识的处理方法,能够更有效地表达图像内容,实现对图像快速有效地检索,因此得到了越来越多的关注。1基于内容的图像检索

20世纪90年代以来,基于内容的图像检索(content2based image ret rieval,CBIR)的研究和应用得到了长足的发展[1,2]。CBIR利用图像的颜色、形状、纹理、轮廓、对象的空间关系等基本视觉特征进行检索,这些特征都是客观独立地存在于图像中的。因此这种图像检索方法的主要特点是利用图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的提取和存储等。目前基于内容图像检索技术已经取得了不少的成就,一些著名的图像检索系统相继被推出,有IBM的QBIC系统[3],哥伦比亚大学开发的Visual2 SEE K[4,5],M IT多媒体实验室开发的Photo2 Book[6],U C Berkeley开发的Chabot[7]系统等。

颜色特征的表达方法有许多种,包括直方图法、累计直方图法、局部直方图法等。颜色直方图法具有运算速度快、存储空间要求低的特点,并且对图像的尺度及旋转变化不敏感,因此得到了广泛关注。但是,由于颜色描述符选择不完全统一,国际标准M PEG27中给出的颜色空间包括R G B,YCbCr, HSV,HMMD,相对于R G B的线性变换矩阵和单色空间。基于不同的颜色空间进行的检索效果也不尽相同,因此,给各种检索系统的评价带来了一定的难度[8]。另外,虽然颜色直方图直观地描述了图像全局的颜色分布,但它不包含任何位置的图像内容中反映空间内容和关系的信息。为了克服这种缺陷,人们试图将空间信息应用到基于颜色特征的检

3收稿日期:2005204208 修订日期:2006204203

基金项目:国家自然科学基金项目(60274006);国家杰出青年自然科学基金项目(60325310)和教育部跨世纪优秀人才基金资助项目

作者简介:向友君(19772),女,湖南省保靖县人,硕士研究生,主要研究方向为图像处理和视频压缩编解码,E2mail:yix2 iang@http://www.wendangku.net/doc/8ba5ec2df18583d0496459cb.html;谢胜利,男,教授,博导,IEEE高级会员,主要研究方向为自适应多路回波消除、盲信号处理以及图像处理等研究。