当前位置：文档库 › 基于分块主颜色匹配的图像检索

基于分块主颜色匹配的图像检索

—186

—

第13期

ol 2010年7月

Jul 基于分块主颜色匹配的图像检索

林克正，张彩华，刘丕娥

(哈尔滨理工大学计算机科学与技术学院，哈尔滨 150080)

摘要：针对颜色直方图无法表达颜色空间分布信息的问题，提出一种基于分块主颜色匹配的图像检索算法，对图像进行新的重叠分块，提取各分块的主颜色，将简化的二次式距离计算方法应用到分块主颜色的匹配中，并对图像各个分块的颜色特征采用不同的加权系数。实验结果表明，该算法在保持较高检索精度的同时，能够降低特征空间维度，提高检索性能。关键词：图像检索；重叠分块；主颜色提取；相似度匹配

Image Retrieval Based on Sub-block Dominant Color Matching

LIN Ke-zheng, ZHANG Cai-hua, LIU Pi-e

(College of Computer Science and Technology, Harbin University of Science and Technology, Harbin 150080)

【Abstract 】In order to solve the problem of lacking the spatial knowledge of color histogram, an approach of image retrieval based on dominant color of partition is presented. It designs overlapped sub-blocks to get the color accumulative histogram in each block. Meanwhile, the reduced quadratic form distance method is applied to decrease arithmetic complexity. The similarity is calculated based on the accumulative histogram of each region. Experimental results show the algorithm can greatly reduce the dimension of color feature, and keep high retrieval precision simultaneity.

【Key words 】image retrieval; overlapped sub-block; dominant colors extraction; similarity matching

计算机工程 Computer Engineering 第36卷V .36 No.13 y 2010

像处理· 文章编号：1000—3428(2010)13—0186—03

文献标识码：A

中图分类号：N945

·图形图1 概述

为了从海量图像集中准确、快速地查找所需的图像信息，

基于内容的图像检索(Content-Based Image Retrieval, CBIR)技术应运而生。CBIR 系统主要使用图像的颜色、纹理、形状和空间关系等特征进行检索[1-3]。由于图像内容的特征很难准确提取和描述，特征的相似度计算与人眼的感知存在一定差异，CBIR 系统还存在许多具体问题需要解决。

颜色是描述一幅图像最简便而有效的特征。一些基于颜色特征的图像检索方法已被提出[4]。最常用的检索技术是由 Swain 等人提出的颜色直方图相交方法。该方法具有特征提取简单和相似度计算高效的优点，但存在由颜色量化引起的颜色信息丢失和缺少颜色的空间分布信息的缺点。改进的Swain 方法有：使用累加直方图的检索算法[5]，基于HSI 颜色直方图的检索算法。这些算法在一定程度上对原有算法做了改进，但它们都基于全局颜色直方图，无法包含图像的空间分布信息，不能充分限制背景信息。为此，人们提出基于均匀分块的图像检索算法，但这种方法不能很好地反映人们对图像不同区域具有不同关注程度的特点。

本文提出一种新的基于分块主颜色的图像检索算法，将图像的颜色值从RGB 空间转换到HSV 空间，然后对图像的二维空间进行重叠分块，提取各分块的主颜色作为该分块的颜色特征。在检索时先逐一计算对应分块的主颜色之间的距离，将所有分块的距离进行加权累加，作为2幅图像之间的实际距离。

2 算法描述

2.1 颜色空间的选择与量化

RGB 颜色空间是一种常见的颜色表示法[6]，但是RGB 颜色空间与人眼的感知差异很大，其空间的相似不代表实际颜色的相似。为了使算法对于颜色距离的定义符合人的视觉特征，同时由于从RGB 到HSV 的转换是一个简单且快速的非线性变换，本文采用较能符合人眼感知特性的HSV 颜色空间(色调H 、饱和度S 和亮度V )。考虑到一幅图像包含的颜色非常多，尤其是真彩色图像，直方图矢量的维数会非常多，因此，有必要对HSV 空间进行适当的量化以减少计算量、提高检索的效率。由于人眼对色调、饱和度和亮度的感知不尽相同，对色调比对饱和度和亮度敏感，因此本文对这3个分量进行非均匀量化：将色调H 分成8份，饱和度S 和亮度V 分成3份，具体的颜色量化和编码方法如式(1)所示：

0,[316,20]1,[21,40]2,[41,75]3,[76,155]4,[156,190]5,[191,270]6,[271,295]7,[296,315]0,[0,0.2]1,[0.2,0.7]2,[0.7,1]0,[0,0.2]1,[0.2,0.7]

2,[0.7,1]h h h h H h h h h v V v v s S s s ∈??∈?

?∈?

∈?=?

∈??∈?

∈??

=∈??∈?

∈??

=∈??∈?

(1) 基金项目：黑龙江省教育厅科技基金资助项目(11551087)

作者简介：林克正(1962－)，男，教授、博士，主研方向：图像处理与机器视觉，模式识别；张彩华，硕士研究生；刘丕娥，教授收稿日期：2010-02-03 E-mail ：link@https://www.wendangku.net/doc/364305374.html,

量化后，把3个颜色分量合成为如式(2)所示的一维特征向量G ：

S V V Q Q H Q S V =++G (2)

其中，和分别表示和V 的量化级数，可由实验确定，如,，则由式(2)可得G ：

S Q V Q S 3S Q =3V Q =93H S V =++G (3)

这样，H ,,V 3个分量在一维矢量上分布开来，形成

72级。根据式(3)，G 取值范围为[0,1,…,71]，经过量化后，可有效减少图像受光照强度的影响。

S 2.2 图像分块策略

传统的颜色直方图只反映了图像颜色的统计分布信息，而丢失了颜色的空间分布信息，极大地影响了人们对图像的相似性判断。

2幅看起来完全不同的图像(如“蓝天”和“大海”)可能具有相同的颜色直方图，从而降低了图像的检索效率。为了获得颜色的空间分布信息可以将图像分块。

常用的分块策略是将图像平均分成m ×n 块，但这种分块方法没有突出图像中间的主体部分，而且容易将主体划分在不同块内，破坏了其完整性，另外也没有考虑到各个分块之间的联系。

一般情况下图像的主体部分分布在图像的中心区域，而图像4个角为图像主体部分的背景。将图像分为较多的块数可提高空间分辨率，但同时增大了特征的存储空间，而且可能使物体分得过于破碎或颜色信息不够丰富，从而使颜色直方图的检索性能下降。为此，本文提出一种新的基于重叠分块的图像分块方法，如图1所示。

P 11 P 12 P 13 P 14 P 21 P 22 P 23 P 24 P 31 P 32 P 33 P 34 P 41

P 42

P 43

P 44

图1 图像分块

具体步骤如下：

(1)将一幅图像均匀分割成4×4的子块，A ,B ,C ,D 分别表示图像的左上、右上、左下、右下4个子块，即：A ={P 11}, B ={P 14}, C ={P 41}, D ={P 44}。然后

用2×2子块匹配余下部分，具体对应关系为 E ={P 21, P 22, P 31, P 32} F ={P 12, P 13, P 22, P 23} G ={P 23, P 24, P 33, P 34} H ={P 32, P 33, P 42, P 43} I ={P 22, P 23, P 32, P 33}。

E ,

F ,

G ,

H ,

I 5个部分是相互重叠的，这样的分块方法使得图像的中心部分被包围3次，而图像的4个角部分只被包围一次，既在一定程度上避免了因图像分割过碎而破坏图像完整性的缺点，又可以突出图像中间的主体部分及限制背景的范围。

(2)对图像的不同分块赋予不同的权值k ω。权值k ω的选取直接影响到算法的准确率，应根据图像的特点决定，通常来说图像中间部分为图像的主体部分，对应着较大的权值；边缘部分对应着较小的权值。

本文在依据面积划分[7]确定权值(即用每个重叠分块的面积除以图像的总面积的值作为权值)方法的基础上，

提出了一种新的权值计算方法：首先统计每个重叠分块的各个子块在重叠分块时出现的次数，再计算各个子块出现的总次数

，然后计算每个重叠分块的各个子块出现的次数和

(k=A ,B ,…,I )，则权值ij N 4

,ij i j N N =∑k N k ω定义为k

k N N

ω=

。

2.3 分块主颜色的提取和相似度计算

主颜色是指在图像中出现频率较高，并且在图像语义信息表达中起较重要作用的颜色。在物理意义上，主颜色就是用较少的颜色表示原图像，并且在视觉上与原图像相似，从而大大减少颜色特征的维数。根据视觉心理学理论，人眼在观察一幅图像时，视觉系统善于抓住具有代表性的色彩特征，而忽略次要的色彩细节，因此可以采用主颜色方法对图像进行检索。本文采用一种改进的分块主颜色提取算法：首先采用2.2节的划分方法对图像进行分块，然后为每个分块统计颜色直方图，提取分块直方图中象素点数目最多的那种颜色作为该分块的主颜色，并将其作为此分块的颜色特征。在检索时首先逐一计算对应分块的主颜色之间的距离，然后将所有分块的距离进行某种程度的加权累加作为两幅图像之间的实际距离。2幅图像间的距离越小，则相应的图像间的视觉差异也越小。设示例图像为Q ，图像库中图像为P ，本文采用简化的二次式距离法计算图像对应分块的主色之间的距离，二次式距离的计算公式为

T ()(=??)D P Q A P Q (4)

其中，P 和Q 分别为2幅图像的颜色直方图信息；A 为颜色相似性矩阵，是指颜色直方图下标为i ,的2种颜色之间的距离。由于A 的计算量太大，本文将其简化为

[]ij a =A j ||2i j ij a ??=，由式(4)可得图像P 和Q 对应块之间的距离i (,)i D P Q ：

22(,)2i i

i i i i i PQ D P Q P Q PQ a =+? (5)

最后考虑到子块权值i ω，将式(5)中不同分块之间的距离再次进行加权累加作为衡量图像P 和Q 之间的距离，即：

(,)(,)n

i i i D ω=∑D P Q P Q

3 实验结果及分析

本文在Windows XP 操作系统上使用Matlab6.5编程平台进行图像检索的实验，实验的图像库在标准的测试图像库Corel 中选取，其中包括有花卉、汽车、动物等内容的图库共1 000幅JPEG 格式的彩色图像。通过浏览图像，从每个分类库中选取50幅感官上类似的图像作为待查询的图像库。查准率(precision)和查全率(recall)是基于内容的图像检索系统性能的2个重要的指标[8]。

查全率反映系统检索相关图像的能力，而查准率则反映系统拒绝无关图像的能力。查准率和查全率越高，表明该检索系统的效果越好。然而对于大多数系统而言，不可能同时获得查准率和查全率这2个目标的最大值，查准率高则查全率低，反之查全率高则查准率低，系统设计应尽可能优化这2个目标。

设A 为图像库中所有和查询图像相关的图像集，B 是所有检索到的图像集合，a 为一次查询的相关图像数目，b 为一次检索过程中所检索到的不相关的图像数目，c 为图像库中和查询图像相关但没有被检索到的图像数目，d 为在图像

—187—

库中既和查询图像不相关也没有被检索到的图像数目，这样查全率和查准率[9]可表示为

()(|)()()(|)()P A B a p P A B P B a b P A B a r P B A P A a ?

===?c +?

?===

?+?

I I (6) 为了检验算法的有效性，将本文提出的方法与累加直方

图加权距离法及3×3分块主颜色特征提取算法进行比较。

实验在图像库中选取同一类图像，本文选取金鱼和树木2类图像，并对于每次查询，计算当在查全率分别为0.1,0.2,…,1.0时相应的查准率。

实验结果见表1。

表1 不同检索算法的查准率比较

查全率

累加直方图加权距离法 3×3分块主颜色特征提取法

本文方法

0.1 0.694 0.721 0.825 0.2 0.462 0.595 0.686 0.3 0.405 0.454 0.571 0.4 0.314 0.377 0.435 0.5 0.228 0.284 0.385 0.6 0.205

0.249 0.304

0.7 0.158 0.185 0.269

0.8 0.142 0.156 0.194

0.9 0.125 0.134 0.161 1.0 0.104 0.113 0.140

由表1的实验结果可以看出，本文检索方法的查准率和查全率均高于累加直方图方法和3×3分块主颜色提取算法。根据表1中的统计数据可以生成折线图如图2所示。 0.0

0.10.20.30.40.50.60.70.80.90.1

0.2

0.3

0.4

0.5

0.60.7

0.8

0.9

1.0

查全率

查准率

累加直方图加权距离法3×3分块主颜色特征提取算法本文方法

图2 不同算法的检索性能比较

由图2可以看出，对于一个图像检索系统而言，查准率和查全率很难同时达到最优的效果。

由于采用HSV 颜色空间对颜色进行了非均匀的量化，突出了图像的主体部分，对图像重叠分块并对每个分块赋以不同的权值，在一定程度上克服了图像均匀分块后图像显得支

离破碎的缺点，可以更加灵活、准确地表示图像主体内容的特征，符合人眼视觉特性和观察要求，采用分块主颜色法提取图像的颜色特征，使图像各分块的主要颜色得到了很好的表达，因而检索准确度在原有的算法基础上有了较大的提高，取得了较理想的检索效果。

图3是检索示例图像和各种检索算法的一次检索结果。

(a)示例图

像

(b)累加直方图的检索结果

(d)本文方法的检索结果

图3 示例图及其检索结果

4 结束语

本文提出一种新的基于分块主颜色的图像检索算法。在对图像进行新的重叠分块的基础上，提取各分块的主颜色，用一种新的权值计算法赋予各分块不同的权值，并在相似性度量中引入简化的二次式距离法。实验表明，这种方法在利用了图像颜色信息的同时，又添加了图像在颜色空间中的分

布情况，并给出相应的图像内容相似度计算方法，不仅提高对图像相似度判断的准确率以及检索的查准率和查全率，而且使检索结果更符合用户的需求。

参考文献

[1] Yoo Hun-Woo, Jung She-Hwan. Extraction of Major Object Feature

Using VQ Clustering for Content-based Image Retrieval[J]. Pattern Recognition, 2002, 35(2): 1115-1126.

[2] Lin Hwei-Jen, Kao Yang-Ta. A Study of Shape-based Image

Retrieval[J]. IEEE Computer, 2004, 22(2): 645-662.

[3] Yu Honpug-Heather. Visual Image Retrieval on Compressed Domain

with Q_Distance Image Signal Process[J]. International Journal of Computer Vision, 2000, 31(1): 134-149.

[4] Berens J, Finlayson G D. Image Indexing Using Compressed Color

Histogram[J]. IEEE Trans. on Vision, Image and Signal Processing, 2000, 147(4): 349-355.

[5] Montiel E. Texture Classification via Conditional Histograms[J].

Pattern Recognition Letters, 2005, 26(11): 1740-1751.

[6] 林丽惠. 图像检索中的颜色表示方法分析[J]. 福建电脑, 2009,

25(3): 15-16.

[7] 薛少娟, 左万利, 赫枫龄. 基于颜色分块全局直方图的图像检索

方法及系统实现[J]. 吉林大学学报: 理学版, 2006, 44(4): 606- 610.

[8] 田小忱, 杨东, 杜春华. 综合颜色和Contourlet 直方图的图像

检索方法[J]. 计算机工程, 2010, 36(1): 224-247.

[9] 茹芳, 冀小平. 基于内容的图像检索技术研究[J]. 科技情报开

发与经济, 2008, 18(30): 153-154.

编辑陈文

—188

—