基于内容的图像检索技术研究

中国新技术新产品

2010NO .8

and Products

高新技术

基于内容的图像检索技术研究

姚弘

（南通职业大学电子工程系，江苏南通226007）

摘

要：基于内容的图像检索技术在数字图书馆、医疗图像、网络信息安全、遥感等领域有着广泛的应用，是目前图像检索技术中比较前

沿的研究热点。文章研究了基于内容图像检索系统的基本组成以及基于颜色、纹理、形状、语义等图像检索技术的主要方法。分析和比较

了现有的各种图像检索技术的优劣。关键词：图像检索；颜色；纹理；形状1引言

随着信息技术特别是多媒体技术和网络技术的普及与发展及应用，数字图像的数量正以惊人的速度增长。一方面，网络成了多媒体信息发布和获取的重要来源；另一方面，许多领域(数

医疗图像等领域) 每天都在不断产生字图书馆、

和使用大量的图像和视频等多媒体资源。因此, 如何将数字图像处理、计算机视觉技术与传统数据库技术相结合, 建立基于对图像内容自动或半自动描述的新一代图像视频数据库就成为迫切的需求。基于内容的图像检索(CBIR)是解决这一问题的关键技术之一。

CBIR 不同于传统的检索手段，它是利用图像的颜色、纹理、形状、对象的空间关系等基本特征进行检索, 并把这些量化特征与图像存储在一起。其特点是：直接从媒体内容中提取信息线索；基于内容的检索是一种近似匹配；特征提取

和索引建立常需要用人机交互的方法，学习人

的主观相似度感受。它主要使用的是基于相似度量的示例查询方法。

2基于内容的图像检索技术

基于内容的描述是基于内容的图像检索的图像内容既包括了颜色、纹理、形状、空间前提。

结构等低层次视觉特征，又包括了导出特征或逻辑特征的检索和场景描述，包含对目标意义的复杂推理等的高层语义特征。

检索进行查询的层次基本可分为三层：（1）基于原始数据的查询。这是最低层次的查找，每一幅图像为象素点的简单有序的集合体，查询时相似性的度量标准是点对点的比较。这个层次的比较是非常具体的，只有在使用相对精确匹配时才有用。

（2）基于特征的查询。这是较高层次的查询，在基于特征的层次上描述图像。图像特征包

括原始属性：颜色、纹理、形状等，也包括脱离了

原始性的抽象属性：灰度直方图，颜色直方图，空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征，同一个区域内的特征矢量具

在n 维特征空间的查询，实质上有相同的属性。

就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法，被事先

使用给出的模板，图像按抽取并保存。查询时，

照库内保存的方法抽取目标特征矢量。

（3）基于语义的查询。这是最高层次的查可以看作是基于对象的查询。查询图像中包询。

括的具体的物体，发生的场景，图像所描述的感性色彩等都属于这个层次的查询。

目前实现图像检索的手段有很多，包括基于分数维的图像检索、基于多颜色空间的图像检索方法、基于内容的图像检索、基于区域的图

孔孔深8米～15.0米全为块石水泥结合体，取芯

孔穿过的最大块厚达1.5米，而且检2#、检3#压水检查孔紧靠1#和2#取芯孔（直线厚度约为1.0米），压水全压力达0.6Mpa , 压水时取芯孔是不封闭的，没有从取芯孔内串冒出水现象，压水检查渗水率又在设计标准内，说明控制性水泥灌浆帷幕解决大块石堆积体的防渗问题，效果是很好的。

（3）1#取芯孔相邻两灌浆孔1-8#和1-9#都穿过厚1.0米以上的细砂层，而1#取芯孔却

（距幕中心线为没有取到细砂层，而3#取芯孔

0.8米，距1#取芯孔为0.5米的上游侧）又碰到了细砂层，说明控制性水泥灌浆对细砂层经冲洗置换加高压力挤压，使原存在的细砂层都发生变化，不但使细砂层的防渗效果被大幅度的提高，而且使原细砂层位置的防渗也满足了设计要求。

控制性水泥灌浆帷幕上部与土工膜防渗体相联接，设计要求搭接施工时将孔口管1.5米范围的软弱覆盖层全挖掉，然后浇砼相连接，开挖施工验证，控制性水泥灌浆帷幕范围已变成了

凿除开挖很困难，有些地方有一定强度的墙体。

是用小药量爆破解决的。众所周知，常规帷幕灌浆在覆盖层内，安装1.5米的孔口管是很难解决地表串、冒浆这一难题的，而越往深层，则帷幕

灌浆的效果就越好，可以肯定，深层的灌浆效果

将比表层看到的会更好。

下游围堰帷幕结构为两排孔，第一排孔完成后再进行第二排孔施工的，两排孔的施工难度截然不同：（1）第一排孔施工时，塌孔和钻孔不返水现象很突出，钻孔返水的灌浆段不多，塌孔严重，有些灌浆孔反复灌的次数多达20段次以上，而第二排孔施工时出现不返水的孔段不多，一般都按最长段长（4米）控制灌注，钻孔塌孔现象几乎不存在。（2）第一排孔一般孔段起灌时无压力，灌浆升压慢，耗用化学控制液多，而第二排孔施工时，都有起始压力，而且升压快，结束压力高，化学控制液用量还不到第一排孔

（3）钻孔通过细砂层时，第总用量的五分之一。

一排孔一般都要反复灌几次才能穿过去，而第二排孔则不出现塌孔，也没有涌砂出孔口，因此，第二排孔的施工进度得到提高。

2#取芯孔和3#取芯孔终孔后做了注水试验，详见注水试验情况如表：

开挖施工，从下游围堰渗漏到基坑的水量都不

大，没有出现涌水现象。当然，下游围堰坡脚也有较小的漏水点，但洪家渡基坑经开挖验证，坝

溶洞基岩层本身漏水就比较严重，而且溶蚀层、

比较发育，产生的漏水点水量渗漏通道无法考

防渗帷幕的施工目的已完全达到。证。总之，7结束语

不良地层的钻孔经常发生塌孔埋钻、掉块卡钻等孔内事故，应采用多种方法，以保证孔壁的稳定性；钻孔和灌浆相辅相承，灌浆时应针对

水会比、外加剂、不同的地层情况，对灌浆压力、

掺和料等灵活应用，以提高施工效率，节约原材料，降低施工成本。

参考文献

[1]雷励. 浅谈帷幕灌浆技术. 西部探矿工程. 2006-08-15.

作者简介：张雪刚（1970-），男（土家）

，

贵州

6.3基坑抽水情况检查

下游围堰闭气后，保证了基坑正常抽水及

思南人，工程师，长期从事水利水电施工技术与管理工作。现水电九局二分局副局长，安全总监。

潘存良（1968-），男，贵州天柱人，工程师，长期从事水利水电基础处理施工技术及管理工作。现水电九局基础分局副总工程师。

-20-

中国新技术新产品

高新技术

像匹配算法的关键技术研究、基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟，检索的效果也越来越好，但仍未上升到图像语义的图像检索阶段。

2.1基于颜色特征

作为图像的基本特征：颜色，人们针对它已

加权颜经设计了很多种算法，包括颜色直方图、

色直方图、颜色聚合度、模板匹配、模糊颜色连通直方图、颜色恒常性颜色检索等等，所有这些包括其中一些非常经典的算法的都没有很好的解决图像特征提取与匹配。因为他们往往都是依靠统计学对图像处理，而统计学一般都会舍弃统计中出现较小概率的事件从而达到较高效率的匹配，因此这样做在匹配结果上无论如何都不会使人满意。而且统计学往往只统计颜色信息往往就忽略了空间分布导致了损失了大量有用的图像信息。

图像的颜色特征可以是各种颜色的比例分布以及颜色的空间分布等，目前，大部分的检索系统都采用颜色比例分布作为颜色基本特征，这方面算法的研究，也多以此为基点，这就是图像领域中的直方图法。具体做法是，在确定颜色空间的基础上，统计每种颜色分量的像素数占图像总像素数的比例，得到图像各种颜色分量的比例分布—直方图，最后把直方图作为图像的颜色特征进行图像检索。

颜色直方图包含三种具体表达方式：一般累加直方图和二维直方图。直方图、1）一般直方图：记S （x ）j 为图像P 中某一特征值为Xj 的像素的个数，n=ΣS （x ）j 为P 中的

2010NO .8

China New 中国新技术新产品

总象素数。对其作归一化处理，即h(xj )=S(xj )/N=S(xj )/ΣS （x j ) 。图像P 的该S 特征的直方图为H(P)

=[h(x1),h(x2), …，h(xn )]。式中，n 为某一特征取值的个数。事实上，直方图就是某一特征的概率分布。

2）累加直方图：假设图像P 某一特征的一般直方图为H(P)=[h(x1),h(x2), …，h(xn )]，令λ(xj )=Σh

j -1i

(xj ) ，该特征的累加直方图为λ(P)=[λ(x1), λ(x2), …，λ(xn )]。

3）二维直方图：设图像X={xmn }大小为M ×N ，由X 采用3×3或5×5点阵屏画得到的图像为，它的大小也为Y＝｛y mn ｝，由x 和y 构成一个二元组。称二元组(x,y)={(xmn ,y mn )}M ×N 为图像的“广义图，广义图像的直方图就是二维直方图。像”

二维直方图中含有原图像颜色的空间分布信息，对于两幅颜色组成接近而空间分布不同的图像，它们在二维直方图空间的距离相对传统直方图空间就会被拉大，从而能够好的区别开来。

图像的匹配方法目前有很多，如何用数值来有效的表示图像在颜色上的相似度，这便是图像的相似性度量问题。在模式识别技术中，特征的相似性度量一般采用距离法，即用特征向量的空间距离来表示。在直方图检索中，通过对直方图之间的距离的设定，当它们的距离小于给定的阈值时，即认为符合检索结果。常用的距离度量有绝对距离、欧式距离、马氏距离、二次距离等。

2.2基于形状特征

形状是刻画物体的本质特征之一, 在二维图像空间中, 形状通常被认为是一条封闭的轮廓曲线所包围的区域, 所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描

述。目前的基于形状检索方法大多围绕着从形状的外轮廓特征和形状的区域特征建立图像索引。总的来说, 形状表示法可以分为2类：基于边界的和基于区域的。前者仅使用形状外边界, 而后者则用了整个形状的区域信息。

在基于形状的图像检索中有3个问题需要

形状通常与图像中的特定目标对象解决。首先，

要有关, 因此形状比颜色和纹理的语义性更强，

获得目标的形状参数, 先要进行图像分割, 所以

描形状特性会受到图像分割效果的影响。其次，

述目标的形状是一个非常复杂的问题, 人对形状的感觉是视网膜感受和现实世界的知识相结合的结果。事实上，目前还没有找到与人的主观感

从不同的视角获得觉相一致的形状模型。第三，

的形状可能会有很大差别，为了准确进行形状匹配, 需要解决平移、缩放、旋转中的不变性问题。形状的表示方法有两类：基于边界的表示和基于区域的表示。这两种表示方法的典型代表分别是傅里叶描述子和不变矩。傅里叶描述子的基本思想是用对图像进行傅里叶变换得到的边界作为形状描述。其中一个优点就是把二维问题简化为一维问题。傅里叶变换的高频分量对应细节而低频分量对应总体形状。所以可以只用一些对应低频分量的傅里叶系数来近似描述边界形状。文献[4]比较了基于区域的方法、基于边界的方法和两种方法的综合使用，实验结果表明，两种方法综合使用效果更好。

2.3基于纹理特征

在许多类图像中，纹理是一种十分重要的

大部分航空和卫星遥感图像、医学特征。例如，

显微图像以及石油地球物理勘探所得到的人工地震剖面图像等，都可以看成是由不同类型纹理所组成的。因此研究对纹理的描述、纹理图像的分割、分类等，不仅是图像处理领域的重要理论研究课题，同时也有着广泛的应用前景。对纹理图像的描述常借助纹理的统计特性或结构特性进行，对基于空域的性质也常可转换到频域进行活动，所以常用的纹理描述方法是：统计法、频域法、结构法。统计法从图像有关属性的统计分析出发；结构法则力图找出纹理基元，再从结构组成上探索纹理的组成规律。一般来说，统计分析方法能够取得较好的效果，所以一直占据着主导地位。

早期的研究方法主要有马尔可夫随机场理论GMRF(GaussianMarkov random field) 和吉布斯分布(Gibbsdistribution) 理论。这些方法主要考虑了一定范围内图像点的关系。随着小波的出现及其在图像处理中的应用，基于多尺度多分辨率的算法逐渐成为主流。

Michael Unser 采用如下算法：①对纹理图像进行小波变换；②计算各予频带内小波系数的平方和的均值作为特征向量；③通过计算Bayes 距离，碍出样本与各融知纹理的相似度，从丽进行分类。

2.4基于语义特征

与基于低层物理特征查询不同，语义特征查询是基于文字的查询，包含了自然语言处理和传统图像检索技术。这种检索方法的目标是最大限度地减小图像简单视觉特征与丰富的语义之间的语义鸿沟(semanticgap) 。缩小语义鸿沟的办法有2种：由高层语义导出低层特征和由低层特征向高层语义的转换。图像语义具有

复杂性、抽象性，一般包括3个语义层模糊性、

次：特征语义、目标和空间关系语义、高层语义。特征语义就是图像的颜色、形状、纹理等低级视觉特征, 与视觉感知直接相连；目标语义和空间

关系语义需要识别和提取图像中的目标类别、

目标之间的空间位置等关系，涉及到模式识别和逻辑推理的相关技术；高层语义主要涉及图像的场景语义(如海滨、街道、室内等) 、行为语义(如表演、超越、进攻等) 和情感语义(如平静、和振奋等) 。一般而言, 高层的图像语义往往建谐、

立在较低层次的语义获得的基础上, 并且层次越高, 语义越复杂，涉及的领域知识越多。基于语义的图像检索一般指的是基于目标和高级语义的图像检索方法。

3基于内容的图像检索的效果评价

在基于内容的检索中, 由于检索算法比较多, 需要对各种算法的检索结果进行评判, 以比较其优劣。从研究情况来看, 对于系统的响应时间和吞吐率的评价论述的较少, 对检索效果评价更多地放在对检索结果的正确与否, 主要使用查找率评价检索效果。

查全率=检索出的图像中相关图像数目1）

查准率=检索出的图像中相关图像数目2）

查全率和查准率越高, 说明该检索算法的效果越好。查全率反映系统检索相关图像的能力, 而查准率则反映系统拒绝无关图像的能力。

4总结

综上所述，可以看出基于内容的图像检索仍然是一个开放性的研究课题，其研究将涉及

人工智能、模式识别、图像处理、信息认知科学、

检索等多个领域。对于基于内容的图像检索中存在的重要问题，在图像处理和模式识别方面今后较长的时间内仍需要继续完善图像特征的

表达、相似性度量。目前国际上MPEG 标提取、

准化组织正在制定的MPEG -7标准, 其目标就是实现集高层语义特征和低层视觉特征的基于内容的多特征综合检索，今后研究的热点之一将是高层的基于语义内容的图像检索。寻找快速智能的检索算法和如何设计用户的反馈方式并充分反馈信息也是今后一个重要的研究方向。

参考文献

[1]刘忠伟, 章毓晋. 综合利用颜色和纹理特征的图像检索[J].通信学报,1999,20(5):36240.

[2]AshishKapoor,Rosalind W.Picard. Real-Time, Fully Automatic Upper Facial Feature Tracking [C].Proceedingsfrom 5th International Confer －ence on Automatic Face and Gesture Recogni －tion,2002

[3]MerloE. Reverse Engineering[J].IEEE,1993, 41(3):171-173,176-178.

[4]MilnerR. Communication and Concurrency[J].IEEE Soft2ware ,1989,37(4):268-280.

[5]王琨, 齐会来, 杨波, 张子华. 基于纹理的图像检索算法. 空军工程大学学报（自然科学版）,2008,9(3):54-57.

Ohm J R ，Vasudevan V V ，et [6]ManjunathB S ，

a1．Color and Texture Descriptors [J]．IEEE Tram on Circuits and Systems for Video Technology ，2001，11(6)：703-715．

[7]BarberM ．MPEG 一7Visual Shape Descrip －tors [J]．IEEE Tram On Circuits and Systems for Video Technology ，2001，11(6)：716-719．

[8]徐庆, 杨维维, 陈生潭. 基于内容的图像检索技术. 计算机技术与发展,2008,18(1):126-131.

中国新技术新产品

-21-

基于内容的图像检索技术研究

相关文章