注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

斗天堂

douzsh还活着

 
 
 

日志

 
 

一种基于颜色特征的图片资料检索方法  

2007-09-07 10:24:44|  分类: CBIR |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

王 蕙1 沈玉利2
(1. 湛江海洋大学图书馆,湛江 524088;2.湛江海洋大学信息学院,湛江 524088)
    [摘 要]基于内容的图像检索方法是目前有效查询大量图片资料的关键技术。首先论述了利用面向对象的多媒体数据处理技术,构建一个基于内容的图像检索系统的方 法;重点讨论了图像颜色特征提取的改进算法,系统通过该算法以及和其他图像检索方法的配合使用,实现了图书馆数字图片资料的快速检索。
    [关键词]图像检索 颜色特征 多媒体数据库 数据模型
    [分类号]G350
1 基于内容的图像检索系统设计
1.1 系统总体框架
    我们设计的图像检索系统的总体框架包括:特征提取、特征匹配、图像检索引擎、显示和用户反馈、查询等模块,如图1所示。系统的总体设计包括系统框架设计、数据库设计等几个方面。
    其中查询模块主要是用户提交的用户信息;特征提取模块是针对用户选择相应的提取特征算法对图像进行特征提取;特征匹配模块指用户利用提取后的特征和图像数 据库中的特征进行比较,把低于给定门限的图像显示给用户;用户反馈模块收集得到的信息,根据自己的期望,对搜索到的图像进行粗略的判断,然后修改查询信息 并提交给查询模块。这样这五个模块构成了一个闭环反馈系统,直到查询的结果令用户满意为止。
图表请查阅印刷版《图书馆学刊》
图1 图像检索系统的总体架构
1.2 数据库设计
    为了提高图像检索的效率并且考虑到将来的数据库扩展,系统选择了对存储过程有强大支持能力的SQL Server 2000作为图像数据库的DBMS平台,并且结合要实现的功能对存储过程进行了较为详细的规划。SQL Server中的存储过程是存储在服务器中的Transact-SQL语句和可选控制流语句的预编译集合,以一个名称存储并作为一个单元处理。类似于程序 设计语言中的过程,存储过程可包含程序流、逻辑以及对数据库的查询,它们可以接受参数、输出参数、返回单个或多个结果集以及返回状态值。
2 系统编程实现
2.1 系统编程模型
    基于内容的图像检索系统的系统编程结构如图2所示。通过控件完成图像的添加、修改、删除和查询功能,数据库通过访问ADODB编程对象调用。

图2 系统编程结构
2.2 特征提取模块
    本系统采用面向对象的编程处理方法,对于一幅图像可以分为四个部分:图像源数据、基本属性、特征和人工注释。其中图像的内容特征是本系统的关键,本系统实 现了上述相关颜色和纹理算法,这些算法都是以对象加入的,便于今后删除和修改,提高了系统的可扩展性。图3是图像数据加载的流程。

图3 图像加载过程
3 颜色特征的提取
    颜色是所有图像中最直接和最简单的特征。实验证明人眼对于图像阴暗非常敏感。同时,颜色也是图像内容特性中一个很重要的特征。由于颜色具有鲁棒性和高效性,因此,颜色特征成为基于内容的图像检索过程中常被使用的一种特征。
    一些物体表现出不同的颜色特征:比如说天空是蓝色的,海水也是蓝色的,但是人的皮肤就是一种比较特殊的颜色。图像库中不同的物体可能不能通过颜色特性被区 分开来,因为不同的物体可能具有相同的颜色特性。需要进一步研究的就是,图像的颜色不变性,即颜色提取的特征不因颜色的亮度而变化,以及如何把颜色和其他 特征相结合。
    不同的颜色特征已经广泛地应用到CBIR(content based on image retrieval,基于内容的图像检索系统中)。
3.1 颜色空间
    在RGB中,三种基本颜色是红、绿、蓝。许多其他颜色就是组合这些基本的颜色而成的。另外,RGB空间具有简单的几何特征。每一种基本颜色轴都是正交的,因此RGB是立体空间。而且RGB空间中的三个颜色轴可以限制在[0,1]之间。
    另外一种颜色空间就是双重的RGB空间,包含以下抽取的基本颜色:青色(cyan)、洋红(magenta)以及黄色(yellow),简写成(CMY)。CMY中的颜色和RGB空间中的颜色是互补的。
CMY=111-RGB   (1)
在 许多应用中,RGB和CMY都存在问题,因为它们并不是视觉一致性的。也就是说,两种颜色空间的距离相似性并不表示它们在视觉效果上的相似性。而且,利用 RGB和CMY空间,对于颜色变形(color distortions)的弥补是非常困难的。颜色可以用其他许多模型来表示,每一种都有三种不同的属性。
    一个比较好的颜色空间就是YIQ空间。它非常类似人脑处理信息的过程。在YIQ空间中,Y分量代表了亮度(luminance),I和Q分别代表了红青色 分量(red-cyan)和绿红色分量(green-ma-genta)。因此,我们可以在亮度分量Y以及颜色分量I、Q基础上进行图像处理。不同的光线 和阴影仅仅对Y产生影响。另外,YIQ颜色空间从颜色描述中去除了信息的冗余性,因此常被JEPG用来作图像压缩算法。
    YIQ空间比其他方法优越的地方还在于它是RGB值的一种线性组合。从RGB空间到YIQ空间的变换可以表示成一个简单的矩阵方程。
YIQ=0.299 0.587 0.1140.596-0.275-0.3210.212-0.523 0.311RGB    (2)
    另外,用来分离亮度和色度的颜色坐标系就是HSI(hue、sat-uration、intensity)空间。从RGB空间到HSI空间的转换可以利用下面的非线性公式(Gonzales and woods)。
    另外一个颜色空间就是HSV(hue、saturation、value)空间。它也是从RGB空间用下面的等式经过非线性变换而来的。
    假设(r、g、b)是RGB空间中的象素,(h、s、v)是HSV空间相对应的象素。那么:
v=max(r,g,b)
v=v′/255
s=       (3)
假设K  =;
g=;
=
h′ =5+……if.r=max(r,g,b)and.g=min(r,g,b)1-……if.r=max(r,g,b)and.g≠min(r,g,b)1 +……if.g=max(r,g,b)and.b=min(r,g,b)3-……if.g=max(r,g,b)and.g≠min(r,g,b)3 +……if.b=max(r,g,b)and.r=min(r,g,b)5-……otherwise.  (4)
h=60×h′;
3.2 基于HSV空间颜色特征提取的算法
由于在HSV空间中,人眼视觉的效果比较能够反映图像之间主要颜色的差异性。因此,本文主要选取了HSV空间来研究。
3.2.1 基于一维直方图的特征提取
首先利用从RGB空间到HSV空间转换的公式(2.1),把图像的颜色空间转换为HSV空间。假如给定(r、g、b)的值,其中r、g、b∈[0,1∧255],则转换后的HSV空间中的各分量的范围:h∈[0∧360]、s∈[0∧1]、v∈[0∧1].
但 是考虑各个分量的取值范围很大,而人眼不可能有那么高的分辨率,因此有必要对HSV空间中的各分量进行适当的量化后计算直方图,也可减少计算量,提高效 率。我们将H,S,V3个分量按照人的颜色感知进行非等间隔的量化,从对颜色模型的大量分析,我们把色调H空间分成8份,饱和度S和亮度V空间分别分成3 份,并根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为H,S,V。
S=0…if…s∈[0,0.2]1…if…s∈[0.2,0.7]2…if…s∈[0.7,1]      (5)
V=0…if…v∈[0,0.2]1…if…v∈[0.2,0.7]2…if…v∈[0.7,1]     (6)
H= 0…if…h∈[316,20]1…if…h∈[21,40]2…if…h∈[41,75]3…if…h∈[76,155]4…if…h∈[156, 190]5…if…h∈[191,270]6…if…h∈[271,295]7…if…h∈[296,315]     (7)
按照以上的量化级,把3个颜色分量合成为一维特征矢量:
I=QsQvH+QvS+V      (8)
其中,Qs和Qv分别是分量S和V的量化级数,取Qs=3,Qv=3.因此(2.5)式可表示为:
I=9H+3S+V        (9)
这样,H,S,V3个分量在一维矢量上分布开来,根据(2.6)式,I的取值范围为[0,1,……,71],计算I获得72柄(bin)的一维直方图。
假 设示例图像为Q,其直方图特征矢量为Hq(q0,q1,……,qL),图像数据库中的图像为S,其直方图特征矢量为Hs(s0,s1,……,sL),其 中,0≤qi≤1,0≤si≤1,为归一化的比例值,L为一维直方图矢量的维数。那么利用直方图交叉算法进行图像相似性度量,两个直方图的交集定义:
Similarity(Q,S)=min(qi,si)     (10)
如果两幅图像的颜色分布相同,那么相似性测度为1,否则为0到1之间的一个数。直方图交叉算法实际上是计算两幅图像的公共部分,可以比较明显地区分出不相似的图像。
3.2.2 对本算法的进一步改进
考 虑到涉及到图像直方图的主要分量并不多(相对于人眼而言),有必要对图像的直方图进行改进。实验证明:qi的值分布不一样,因此有必要选取主要体现图像特 征的几个颜色分量。因此本算法在公式(9)之后,比较图像的相似性之前,要统计一下qi的分布,选出qi值较大的几个,然后把qi的值和i值一起存起来, 作为图像的特征。然后,在比较图像的相似性的时候,看qi的值的大小和i值的匹配是否一致。这样做的好处:减少了存储空间,提高检索效率。
3.2.3 本算法的优越处
把三维颜色空间降维到一维颜色空间中,大大简化了计算的复杂度,另外又通过量化的手段,使得计算量进一步降低,是一种比较简单而且适用的方法。
3.3 基于三维直方图的颜色特征提取
上面的方法是采用了降维以后,虽然降低了计算量,但是没有考虑到颜色空间的位置信息,丢失了许多重要的信息。
HSV空间模型是一个圆柱体模型,并且是一个连续的颜色空间,任意两种颜色间的距离被定义为它们在HSV空间中所在位置的两点间的距离,即若有两种颜色colori=(hi、si、vi),colorj=(hj、sj、vj),则它们之间的距离为:
d(ci,cj)=[(vi-vj)2+(sicosjh-sjcosjh)2+(sisinih-sjsinjh)2]  
                     (11)
因此,两种颜色间的相似度定义为:
s(ci,cj)=1-d(ci,cj)     (12)
这 里我们采用了一种不同于前面的量化方案:即把整个HSV空间进行均匀量化,将色调量化成361份(0,1,2,∧360),饱和度和亮度分别量化成11份 (0~10),因此编号得到量化点集合为C={c1,c2,∧∧,cn,n=43681}。但是考虑到颜色太多,因此我们采用主颜色表的思路对颜色进行聚 类。

3.3.1 主颜色表
一幅图像中的颜色种类众多,如果颜色直方图匹配时对图像中所有的颜色都进行考虑,其计算量将非常大。经验分析表明,实际上图像中的目标对象,其占主要的颜色一般只是少数的几种或几十种。因此,首先对图像颜色进行聚类,然后选取几个主要的颜色进行匹配。
3.3.2 颜色聚类
在HSV 空间中选取一些点和为颜色聚类的轴心点集合C={C1,C2,∧Cm},以这些点所在空间位置代表的颜色作为颜色聚类时该类的核心颜色。由于聚类时候将根 据这些点把整个HSV颜色空间划分为m类,因此它们的选取非常重要。聚类的效果如何直接关系到检索的效果,既要充分体现整个颜色空间的颜色分布状况,又要 使得轴心点数量足够少,以同时满足检索的精度和速度要求。
即对于集合内C的任意一个量化点ci,i∈[1,2,∧n],比存在一个Ck∈C,使得d(ci,Ck)=min{d(ci,Ck)|?坌i∈[1,2,∧n],?坌k∈[1,2,∧m]},则认为Ci与Ck属于同类。聚类的思想如图4。


图4 HSV空间
假如Ci为空间中的任意一点,C1和C2是轴心点,如果Ci与C2的距离较近,那么Ci被归类为C2。
3.3.3 算法实现以及改进
step 1:轴心点的划分,色调H分为19份,饱和度分为4份(0,0.3,0.7,1),亮度分为5份(0,0.25,0.5,0.75,1),因此这个空间分为380个轴心点。
step 2:分别计算量化点集合中所有量化点到轴心点的距离,按照距离进行聚类。
step 3:统计各自轴心点出现的频数,按照数目大小进行排列,同时统计出hisivi的下标的值。
step 4:选取几个频数较大的几种主要颜色,作为图像的特征值,即图像的颜色参考表。
step 5:图像匹配,利用颜色直方图相交法,同时考虑到下标的值。
3.3.4 本算法的优越处
本 算法在三维空间中统计了颜色的直方图,然后充分考虑了人眼能感知的几种主要颜色,减少了图像的计算量。同时,由于仍然在三维空间中,没有降维,因此,同时 考虑了图像颜色之间的位置信息。另外,由于采用自动分类的算法,这里的颜色参考表是动态的,克服了颜色参考表是静态的缺点。
4 实验结果
经过对图像数据库中所有图像的实验,我们统计了检索效率和平均搜索时间,并与文献3的方法进行了比较,表1给出了两种方法的搜索效率,表2给出了它们的平均搜索时间。
表1 两种方法搜索效率的比较


表2 两种方法平均搜索时间的比较(单位为:秒)


从两个表中的结果可以看出,本文提出的方法具有很快的检索速度和较高的检索效率。
5 小结
本文首先论述了构建一个基于内容的图像检索系统的方法。之后从图像识别方法出发,提出了一种基于颜色特征的图片的检索方法,采用了改进的颜色特征的方法通过对800多幅图片的实验,结果证明了这种方法具有快速和准确的特点。
本文的方法也可以适用于一般的基于内容的图像检索系统中。构建的系统同时对纹理和形状等特征提取方法及各种方法的配合检索进行了验证,证明了系统的构建方法及方法的可行性。进一步综合利用这些特征提取方法,对相似度度量机制深入研究,是我们今后要做的工作。

参考文献
1 黄祥林,沈兰荪.基于内容的图像检索技术研究.电子学报,2002(7)
2 刘相滨,邹北骥.一种基于主颜色表的图像检索算法.湖南大学学报(自然科学版),2001(1)
3 Mohan S. Kankanhalli,Babu M.Mehter and Jian Kang Wu.Cluster-Based Color Matching for Image Retrieval.Pattern Recognition,1996(4)
4 韩水华等.复杂相似性图像检索系统体系结构.华中科技大学学报,2001(3)
5 Anil K.Jain,Aditya Vailaya.Shape-Based Retrieval: A Case Study with Trademark Image Databases.Pattern Recognition,1998(9)

王 蕙 女,1968年生,馆员,硕士。研究方向:信息检索与管理。已发表论文10余篇。
沈玉利 男,1955年生,博士,副教授。研究方向:模式识别、图像处理、数据仓库与数据挖掘等。已发表论文20余篇。

(收稿日期:2004-10-13;责编:李德戈。)
  评论这张
 
阅读(333)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017