注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

斗天堂

douzsh还活着

 
 
 

日志

 
 

基于多种主色调的图像检索算法研究与实现  

2007-09-07 14:20:20|  分类: CBIR |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

曹莉华 柳 伟 李国辉

摘 要 在基于内容的图像检索中,颜色是最容易说明的特征,主色调可以反映图像的总体概貌,文中提出了一种基于多种主色调的图像检索算法,能够将用户指定的多种主色调通过适当的扩展用于匹配,以获得更好的检索效果.

关键词 图像检索,基于内容,主色调,扩展主色调

中图法分类号 TP311.13;TP391

RESEARCH AND IMPLEMENTATION OF AN IMAGE RETRIEVAL ALGORITHM BASED ON MULTIPLE DOMINANT COLORS

CAO Li-Hua,LIU Wei, and LI Guo-Hui

(Multimedia Research Center,National University of Defense Technology,Changsha 410073)

Abstract In content-based image retrieval,color is the feature that can be easily taken,and dominant color reflects the general situation of an image.An algorithm of image retrieval based on multiple dominant colors is put forward in the paper.With this method,users can specify several dominant colors of an image that they want to query,and retrieve by extending these dominant colors to get better retrieval effect.

Key words image retrieval,content-based,dominant color,extending dominant colors

1 引  言

  图像检索是多媒体数据库中最需要也是最普遍的要求,以往对图像数据的管理是从图像中抽取属性信息,并在关系数据库中把它们当作格式化数据,对图像的检索仅局限于对图像属性的字符串匹配上,这种基于属性的方法要求用户能精确定义查询内容,这在实际中是很困难的.事实上,“一幅图像胜过千言万语”,区区几个字符是很难表达图像的深刻内涵的.因此,对图像的检索更多地希望在内容级上进行,图像物理特征为基于内容的图像检索提供了很好的检索基础.颜色是彩色图像的最显著的特征,用户能够很容易地记住任何物体的颜色特征,因此基于颜色的查询是基于内容的图像检索中最基本的方法,这种查询可针对任何类型的彩色图像.基于颜色的查询主要有两种方式:一是直接示例查询法,即用户给出示例图像,系统通过提取示例图像的颜色特征与图像库中图像的颜色特征进行相似度比较,以得到颜色相似的图像.二是基于图像的颜色主色调进行查询,由于用户可以很容易地给出图像的一个或几个主色调(一般可通过调色板选择),将这些主色调作为查询的主要特征进行相似性匹配,以查找图像库中具有类似主色调的图像.
  主色调能够代表一幅图像的基本概貌,如蓝色主色调往往是和大海或蓝天的图像相关的.如果用户想要查找大海的照片,则可以指定蓝色作为主色调.但主色调仅仅反映了图像的大致情况,由于人的肉眼的分辨率有限,一种主色调用于颜色检索误差是较大的.实验表明,对选定主色调的适当扩展在基于主色调检索中是非常有效的.另外,大多数图像可能包含两种以上主色调,如一幅大海和沙滩画面的图像,可能蓝色和黄色在画面中都很抢眼,则两种颜色都可以作为主色调.
  主色调的选择往往决定于用户肉眼的判断,但由于肉眼对颜色的认知在一定范围内具有模糊性,在选择时又带有一定的随机性,因此,所选择的主色调往往带有个人的主观因素,而这个带有主观随机性的值在彩色或真彩色的所有颜色分布中仅占一个值,而在与此颜色相近的颜色分布上并没有值,这种相近颜色又可能正是用户由于肉眼认识的模糊性和选择过程中的随机性而错过的真正需要的颜色.例如,用户通过调色板选择了一种红色(R=255,G=0,B=0),那么这个红色只在R=255,G=0,B=0处有值,而实际上,人类肉眼看似红色的颜色可分布在RGB一个很广的范围内,但由于用户选择颜色时的随机决定性和模糊性,使得用户真正想要检索的红色的颜色值可能没有被选中,这样在检索匹配中由于一些算法的原因容易错过用户实际需要的但近似于用户所选择的那种颜色.为此,我们提出一种主色调扩展方法,将用户选定的主色调适当扩展到一定范围,使得近似于所选择色的颜色也能参与匹配.同时,为了将肉眼认知的颜色和理论上的颜色值更好地相关,我们采用一种适合基于内容检索的HSV颜色模型.

2 颜色模型选择和检索匹配算法

  图像的颜色有多种表示方式.其中HSV颜色模型是一种适合肉眼分辨的模型,它把彩色信号表示为3种属性:色调、饱和度和亮度HSV(hue, saturation, value),这种颜色模型用Munsell[1]三维空间坐标系统表示.因坐标之间的心理感知独立性,因此,可以独立感知各颜色分量的变化;且这种颜色模型具有线性伸缩性,可感知的颜色差是与颜色分量的相应样值上的欧几里德距离成比例的.在基于内容检索中应用这种模型更适合用户的肉眼判断.
  HSV模型的色调H是由颜色名称来辨别的,如红、橙、绿,它用角度-180°~180°或0°~360°度量;亮度V是颜色的明暗程度,通常用百分比度量,从黑0%到白 100%;色度或饱和度S指颜色的深浅,例如同样是红色,也会因浓度不同而分为深红和浅红,它也用百分比来度量,从0%到完全饱和的100%.
  从图像中一般都得到RGB值,RGB值到HSV空间的转换[2]如下.
  给定RGB颜色空间的值(r,g,b),r,g,b∈[0,1,…,255],则转换到HSV空间的h,s,v值计算如下:
  设v′=max(r,g,b),定义r′,g′,b′为:
      97-1.gif (4338 bytes)

          97-2.gif (9205 bytes)
这里,r,g,b∈[0…255],h∈]0…360],s∈[0…1],v∈[0…1].
  我们用HSV空间的颜色直方图来描述图像的整体颜色特征.一幅图像的颜色一般非常多,尤其是真彩色图像,因此直方图矢量的维数会非常多.如果对HSV空间进行适当的量化后再计算直方图,则计算量要少得多.我们将H,S,V 3个分量按照人的颜色感知进行非等间隔的量化,从对颜色模型的大量分析,我们把色调H空间分成8份,饱和度S和亮度V空间分别分成3份,并根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为HSV.
       98-1.gif (9357 bytes)(1)
  按照以上的量化级,把3个颜色分量合成为一维特征矢量:
                  l=HQsQv+SOv+V(2)
其中,QsQv分别是分量SV的量化级数,取Qs=3,Qv=3.因此(2)式可表示为:
                   l=9H+3S+V(3)
这样,HSV3个分量在一维矢量上分布开来.根据(3)式,l的取值范围为[0,1,…,71],计算l获得72柄(bin)的一维直方图.
  假设示例图像为Q,其直方图特征矢量为Hq(q0,q1,…,qL),图像数据库中的图像为S,其直方图特征矢量为Hs(s0,s1,…,sL),其中,0≤qi≤1,0≤si≤1,为归一化的比例值,L为一维直方图矢量的维数.那么利用直方图交叉算法[3]进行图像相似性度量,两个直方图的交集如(3)式所定义:
               Sim(Q,S)=98-2.gif (1147 bytes)min(qi,si)(4)
  如果两幅图像的颜色分布相同,那么相似性测度为1,否则为0到1之间的一个数.直方图交叉算法实际上是计算两幅图像的公共部分,可以比较明显地区分出不相似的图像.

3 主色调扩展法

  用上述检索算法进行基于主色调的检索,从人类对颜色的感知来说,这种算法具有很好的颜色匹配效果.但在有些特殊情况下,会产生错过某种主色调的情况.我们看一种特殊情况,假设用户通过调色板选择了一种颜色,可以得到它的h,s,v值,经过量化以后,其色调值为H1,而与该颜色很相近且也是用户需要的颜色为h+1,s,v,则量化以后其色调值可能为H1+1,即这两种几乎相同的颜色被量化在不同的范围内,那么,用上述方法匹配时,很容易漏检色调与H1+1相似的图像.因此,需要对主色调进行扩展,以弥补由于用户选择的随机性引起的误差.
3.1 扩展主色调的基本方法
  任何不均匀分布在实际中可能性最大的情况是正态分布,肉眼对颜色的认知也有类似情况,在某个范围内的颜色用肉眼来分辨是有模糊性的,因此肉眼认定的一个颜色可能与实际想要查找的颜色有一定的偏差,为了检索中不错过真正的颜色,我们用正态分布拟合法来获取指定颜色的扩展值.
  假设用户指定了某个颜色作为查询的主色调,那么,在这个颜色的一个正态分布的范围内的颜色都可能与用户实际需要的颜色相关,如果用户对指定颜色的把握性越大,则选定颜色的范围越小,即正态分布的方差越小,如用户有100%的把握表明他所选取的颜色正是希望查询的颜色,则方差趋于0; 用户对指定颜色的把握性越小,正态分布的方差越大.
  假设用户的指定颜色为l0, 若没有经过拟合,则检索中只取颜色为l0处的直方图特征,则在l0处其直方图值可归一化为1,而其他颜色值处的直方图值都为0,但由于用户肉眼的模糊性,其实际需要颜色可由用户自己给出的模糊度通过正态分布函数拟合成某一范围内的值,如用户指出的模糊度为σ,则经正态分布拟合以后的直方图特征f(l)如下:
               99--1.gif (2844 bytes)(5)
  可以证明,l在l0-99-2.gif (1025 bytes)σ至l0+99-2.gif (1025 bytes)σ范围内基本上能包含所有分布,因此,我们在这个范围内按用户的把握性或模糊度来确定用于检索的颜色值.对于离散情况,我们取(l0-99-2.gif (1025 bytes)σ,l0+99-2.gif (1025 bytes)σ)范围内的离散值,即取f(i)作为检索颜色的直方图值:
      99-3.gif (2770 bytes), max{0,int(l0,99-2.gif (1025 bytes)σ)}≤i≤int(l0+99-2.gif (1025 bytes)σ)(6)
这样,总共选定了int(l0+99-2.gif (1025 bytes)σ)+1-int(l0-99-2.gif (1025 bytes)σ)种颜色作为直方图值用于匹配计算中,假设(l0-99-2.gif (1025 bytes)σ)是大于零的.在l0处的直方图值为f(l0),其他点的值则根据用户指定的模糊度σ由上式计算出.
3.2 基于多种主色调的颜色直方图扩展
  很多图像包含两种以上的主色调,几种主色调在图像中的重要程度和所占的比例可能不一样,如何组合成一个有效的值供检索中匹配用呢?我们提出用基于不同模糊度和比例的方法来实现.
  用户可以指定每种主色调在图像中所占的百分比,依据多种主色调扩展和百分比进行匹配是基于多种主色调检索的一个有效方法.
  假设用户指定的颜色为l1,l2,l3,每种颜色的把握性(模糊度)分别为σ123,每种颜色在图像中所占的百分比分别为α123,(α123=1),首先将颜色l1,l2,l3进行扩展,得到类似(6)式的基于模糊度扩展的颜色直方图:f(li1), f(lj2), f(lk3),其中,int(l1-3σ1)≤i≤int(l1+3σ1),int(l2-3σ2)≤j≤int(l2+3σ2),int(l3-3σ3)≤k≤int(l3+3σ3), 再根据用户指定的百分比,将模糊扩展直方图再次扩展为匹配直方图:α1 f(li1),α2 f(lj2),α3 f(lk3)如图1所示.

99-4.gif (8523 bytes)

图1 多种主色调的直方图扩展示例

  将这个扩展的直方图用于(4)式所示的相似性计算,进行基于多主色调的匹配,可以很好地将具有两种以上主色调的图像检索出来.

4 实验结果

  我们对一个包含600幅各种色彩的花卉图像作实验,按上述方法基于两种主色调(黄色和绿色)进行检索,没有用扩展方法的结果如图2所示(原图为彩色图像),在返回的前面20幅图像中,其中476081(第4幅)、 476082(第11幅)、476087(第14幅)等是红花绿背景的图像.但由于在本文的量化公式(1)中,红色的色度H可量化在[316,20](正红)和[21,40](桔红或桔黄)两个范围内,而在试验中选取的黄色主色调H=40,其他H>40以后的黄色值没有用于匹配.因此,具有红色主色调的图像也以较大的相似度被返回在结果的较前面的位置.在调整模糊度(即方差)以后,使得更多的黄色调(即H>40)也用于匹配,因此具有红色主色调的图像在检索结果中明显往后移,如图3所示.其中476081号图像移到返回结果的第15幅,而其他红色主色调的图像则在20幅以后了.

100-1.gif (9471 bytes)         100-2.gif (9809 bytes)

        图2 不调整模糊度的查询结果   图3 调整模糊度的查询结果

  基于主色调的检索对彩色图像的检索是比较有效的.但对有些特殊情况,尤其是处在量化边界范围的颜色容易产生误差.对主色调进行扩展以后,能够将相近颜色也用于匹配,检索结果得到一定好转.但事实上,一幅图像即使存在几种明显的主色调,也不可能只在这几个特定的颜色值上.因此,在主色调的选择上还可以采用指定颜色范围的方法,用户划定一块某个范围内的颜色作为主色调,针对这个范围的颜色求取直方图特征进行相似性匹配,实验证明,这样可不需要进行扩展,也能获得较好的效果.

  原稿收到日期:1998-01-22;修改稿收到日期:1998-09-03.本课题得到湖南省自然科学基金资助(项目编号[1995]252.6).曹莉华,女,1966年10月生,博士后,主要研究方向:多媒体数据库、CAD & CG以及基于虚拟现实的CAD设计等.柳伟,男,1973年11月生,硕士研究生,主要研究多媒体数据库和基于内容的图像检索技术.李国辉,男,1963年1月生,副教授,现主要从事多媒体信息系统、多媒体通信网络和多媒体会议系统的研究、开发和教学工作.

作者单位:国防科技大学多媒体研究中心 长沙 410073

参考文献

 [1] Miyahara M, Yasuhida Y. Mathematical transform of (R,G,B) color data to Munsell(H,V,C) color data.In:Visual Communications and Image Processing '88, SPIE Vol 1001.Cambridge,1988.650~657
 [2] Ardizzone E,Cascia M. Automatic video database indexing and retrieval. Multimedia Tools and Applications,1997, 4(1):29~56
 [3] Swain M, Ballard D. Color indexing. International Journal of Computer Vision,1991,7(1):11~32

  评论这张
 
阅读(442)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017