毕业设计（论文）-Web图像检索系统的设计.doc

资源描述

《毕业设计（论文）-Web图像检索系统的设计.doc》由会员分享，可在线阅读，更多相关《毕业设计（论文）-Web图像检索系统的设计.doc（49页珍藏版）》请在三一文库上搜索。

1、摘要计算机处理能力的日益增强，因特网技术的广泛普及和网络带宽不断提高，大量的图像信息不断产生，如何从这些海量图像数据中搜索人们感兴趣并有效利用这些图像，成为迫切需要解决的问题。本设计首先以“Web图像检索”为背景介绍了在Internet中检索图像的基本概念和常用的两种重要技术：基于文本的图像检索和基于内容的图像检索，并简要阐述了它们的基本概念、原理，说明了目前这一领域的发展现状。其次重点介绍了图像的内容特征：颜色特征、纹理特征和形状特征，和以图像内容特征为基础的Web图检索原理，对常用的对应图像检索算法分别介绍和对比，并分析了其优劣性。最后以基于内容的图像检索为重点，利用VC+编程工具对Web

2、图像检索系统进行了模拟和验证。关键字：Web图象检索，特征提取，颜色直方图，相似度 AbstractThe capacity of computer processing is in increasing , Internet technology is in popular with more and more people and network bandwidth broadens, Besides, a mass of image data information is being produced constantly ，so how to find sone image what

3、people are interested in and to use these effectively from the Web，become a urgent problem.Firstly, this project introduced the basic concept of Web image retrieval and two common but important technologys :based on text image retrieval and content-based image retrieval. and briefly describes their

4、basic concept, principle and the current situation of the development of this field. Secondly ,it introduced the contents characteristic: color image features, the texture featuress and shape features, and theory of Web image retrieval that is based on these content features，meanwhile ,several impor

5、tant image retrieval algorithms used are introduced and compared, and analysed their advantages and disadvantages. Finally ,to content-based image retrieval, Design a “Web image retrieval” system to simulate and test by using VC+ 6.0 programming tool.Keywords: Web image retrieval, feature extraction

6、, color histogram ,similarity目录摘要1Abstract2目录3第一章前言51.1 Web图像检索概述51.2 图像检索方法的研究综述51.2.1基于文本的检索51.2.2基于内容的图像检索技术61.2.3图像检索技术研究的三个方向71.2.4图像检索系统的性能指标和评价准则7第二章 Web图像检索原理92.1 基于文本的图像检索92.2 基于内容的图像检索102.2.1 体系结构102.2.2 查询模块102.2.3特征提取模块112.2.4 常用的图像特征112.2.5匹配模块122.2.5相似性度量函数13第三章基于内容的图像颜色特征提取153.1常

7、用的颜色模型153.1.1 RGB模型153.1.2 HSV模型163.1.3 L*a*b模型163.1.1CMY模型163.2颜色特征的提取173.2.1颜色直方图173.2.2颜色矩183.2.3颜色聚合向量183.3图像特征的相似性匹配193.3.1直方图相交法193.3.2欧氏距离方法203.3.3模糊方法20第四章基于内容的图像纹理特征提取224.1灰度共生矩阵224.2灰度共生矩阵的简化计算234.3基于灰度共生矩阵的特征提取244.4综合颜色、纹理特征的检索24第五章图像检索系统设计与实现265.1系统开发环境介绍265.2系统需求分析285.3可行性分析285.4系统总体设

8、计295.4.1系统功能结构图295.4.2系统模块设计与开发295.5系统测试385.6结果分析45总结47参考文献48致谢49第一章前言1.1 Web图像检索概述从20世纪70年代开始，有关图像检索的研究就已开始，当时主要是基于文本的图像检索技术（Text-based Image Retrieval，简称TBIR），利用文本描述的方式描述图像的特征，如绘画作品的作者、年代、流派、尺寸等。到90年代以后，出现了对图像的内容语义，如图像的颜色、纹理、布局等进行分析和检索的图像检索技术，即基于内容的图像检索（Content-based Image Retrieval，简称CBIR）技术。C

9、BIR属于基于内容检索（Content-based Retrieval，简称CBR）的一种，CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术。在检索原理上，无论是基于文本的图像检索还是基于内容的图像检索，主要包括三方面：一方面对用户需求的分析和转化，形成可以检索索引数据库的提问；另一方面，收集和加工图像资源，提取特征，分析并进行标引，建立图像的索引数据库；最后一方面是根据相似度算法，计算用户提问与索引数据库中记录的相似度大小，提取出满足阈值的记录作为结果，按照相似度降序的方式输出。为了进一步提高检索的准确性，许多系统结合相关反馈技术来收集用户对检索结果的反馈信息，这在CBIR中

10、显得更为突出，因为CBIR实现的是逐步求精的图像检索过程，在同一次检索过程中需要不断地与用户进行交互。1.2 图像检索方法的研究综述目前，检索的方法基本分为两大类:基于文本的图像检索和基于内容的图像检索。1.2.1基于文本的检索基于文本的图像检索沿用了传统文本检索技术，回避对图像可视化元素的分析，而是从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像，一般以关键词形式的提问查询图像，或者是根据等级目录的形式浏览查找特定类目下的图像，如Getty AAT使用近133，000个术语来描述艺术、艺术史、建筑以及其它文化方面的对象，并推出30多个等级目录，从7方面描述图像的概念、物理属性、类型和

11、刊号等。又如Gograph将图像分为动态图像、照片、图标、背景、艺术剪辑图、插图、壁纸、界面、成套图像8个一级类，下设数量不等的子类。在图像数字化之前，档案管理者、图书管理员都是采用这种方式组织和管理图像。图像所在页面的主题、图像的文件名称、与图像密切环绕的文字内容、图像的链接地址等都被用作图像分析的依据，根据这些文本分析结果推断其中图像的特征。现阶段，真正进入普通意义上的实用阶段的图像检索方法，基本上还都是采用了基于文本的检索方法。这种方法，实际上就是靠人工为图像进行标注，用对图像的一些描述信息来作为检索时的关键字，如作者、标题、大致内容、创作时间等。广泛流行的商用搜索引擎，如G00GLE

12、、百度。这种检索的策略，实际上是抛开了图像信息本身，其实质还是传统的文本信息检索。而且，显而易见的是，由于不同的人对同一幅图像可能有不同的理解，从而不可避免的造成了二义性。并且由于现实情况的复杂性，要建立能够完整表达图像信息的关键字是十分困难的，几乎不可能办得到。同时，随着图像的不断增多，人工标注的工作量也会急剧攀升。所以，使用这种方法，虽然在一定程度上缓解了人们的迫切需要，但往往不能取得令人满意的效果，应用范围受到极大的限制。所以说，基于文本的图像检索方法，只能是权宜之策，而不是最终的解决之道。1.2.2基于内容的图像检索技术基于内容的图像检索（Content Based Image Ret

13、rieval，CBIR）是基于内容检索技术（Content Based Retrieval，CBR)）的一种是近些年发展起来的侧重于挖掘图像本身特征的一种检索策略。图像的内容即图像的特征，而基于内容的检索就是通过两幅图像的特征匹配，即图像特征的相似性度量来实现的。要进行图像特征匹配首先要进行特征提取。图像的特征分为低层物理特征(如颜色、纹理、形状、轮廓等)和高层语意特征(是人对图像的概念级的反映，如对图像的个人感受等)。高层特征在目前的条件下，一般通过人工注释的方法来实现，也就是前面说的基于文本的图像检索方法，这种方法要实现自动化有较大的困难，且主观性太强，不利于标准化的实现。而低层次的颜色、

14、纹理、形状等特征则相对较容易提取，也可较客观地反映图像之间的差别。基于内容的查询方法和基于文本的查询方法相比，有这样几个特点：(l)采用从图像中提取出来的颜色、纹理、形状等真实特征来作为检索的依据，而不是人为的文字评价；(2)对这些特征进行相似性度量，即采用近似查询的方法；(3)多采用示例查询的方法QBE(QuerybyExamPle)，即给出示例图像，再从图库中查找与之相似的结果图像来。如果将图像检索和图像理解相比的话，两者在基础技术上比较相似，但还是存在着许多重要的不同之处的。比如，CBIR并不需要计算机识别出具体的目标是什么，计算机可以在完全不了解具体内容的意义的情况，而找出若干幅类似的

15、图像来，另外，图像检索是模糊的相似性判断，检索结果应尽可能包含图像库中的所有相关图像，并且允许在结果中存在不相关的图像，而不同于图像识别那样必须找出明确的、完全相似的内容。采用CBIR方法开发的第一个功能较为齐全的系统，要属IBM公司Almadell研究中心开发的QBIC3(QuerybyImageContent)系统，它可以利用颜色、纹理、形状和草图等多种方法进行检索，用户只需给出示例图像或草图，就可方便地在图像库中找到相似的图像来。1.2.3图像检索技术研究的三个方向基于文本和基于内容是图像检索发展的两个分支，不过从目前图像检索研究的趋势而言，尤其结合网络环境下图像的特征嵌入在具有文本内容

16、的Web文档中，出现了三个不同的研究着眼点。 (1)立足于文本，对图像进行检索：试图将传统的文本检索技术移植于对多媒体信息的检索上，因为基于文本的检索技术发展已经成熟。但是因为受控词汇本身的局限，易歧义，更新慢，所以不太容易应对网络上日新月异的各类图像。 (2)立足于图像内容，对图像进行分析和检索：相比而言，尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法，但是要突破对低层次特征的分析，实现更高语义上的检索，实现难度大，进展慢。不过，基于内容的图像检索建立在多媒体信息的内容语义上，能够更为客观地反映媒体本质的特征。 (3)结合文本和内容，进行融合性研究：发挥各自的优势促

17、进图像的高效、简单检索方式的实现，尤其是网络环境下，结合图像所在Web文档的特征分析，推断图像的特征，同时结合对图像的内容分析，共同标引达到对图像的分析和检索。以说，三个方向都是相互影响和促进的，任何一个方向的进展都会促进图像检索技术向前更进一步。1.2.4图像检索系统的性能指标和评价准则图像检索有两种类型：图像匹配和相似度检索。设图像库有N福图像。对于匹配问题，理想情况下是正确图像是检索结果V(X0)中第一个。通常用下面的式子评价匹配结果：匹配比率=对相似度问题，通常的方法是人工一个相似图像子集S，假定S中图像的相似性比S和非S图像的相似度高。取XS，Precision-Recall曲线

18、能全面反映检索效果，下面称为P-R曲线，其中：recall=， precision=，由于相似图像集合S是人工选出的，这个评价标准不可辟免带有主观因素。不同人对相似度感受不同，因此在一定程度上不可取。此外，采用排序方法评价系统性能也是一种常用的方法。固定返回图像集合的数目n，设R为相关图像数目，p为相关图像的排序序号，T为实际的相关图像数目，评价参数为：AVPR=，LAVPR=，MT= ，其中AVPR是相关图像的平均排序，LAVPR是理想的相关图像的平均排序，MT为丢失的相关图像率。一般地，AVPR 和LAVPR越小，检索算法越好，MT越好，性能越好。第二章 Web图像检索原理2.1 基于文

19、本的图像检索基于文本的图像检索方法诞生于二十世纪70年代，是图像检索方法的常用技术之一，它利用人工进行图像语义识别，并用相应的文本关键词对图像语义进行注解以实现图像的检索。由于语言文字是人们进行语义表达最直观和熟知的手段，也是检索技术中广泛采用的检索方法，故通过其实现的图像检索使得检索形式较为简便、且由于采用人工注解图像语义，有效跨越了。语义鸿沟”，从一定意义上说是基于语义的图像检索方法。在图像规模较小的初期应用中，这种方法有效地满足了图像的检索需求，然而，随着图像检索应用的不断深入，利用人工提取图像语义标识以实现检索的方法存在着一些明显的缺陷：1、人工提取图像语义标识需要耗费大量的人力资源，

20、尤其面对呈指数级增长态势的图像资源，完全依赖人工工作存在着明显的效率问题；2、人工实现图像语义标识的提取过程存在着主观片面性，图像的语义丰富，充分理解图像语义依赖于不同的知识结构及理解能力，不同人对其理解存在着主观差异性。因此，面对不断增长的图像资源检索需求，如何高效、客观地实现图像语义的识别是影响基于文本的图像检索方法发展的瓶颈技术。基于文本的图像检索结构如下所示：图像库文本检索人工标注图像关键字图像文本数据结果输出图2.1 基于文本的图像检索系统构成2.2 基于内容的图像检索2.2.1 体系结构本设计以VC+为开发环境实现了一个基于内容的图像检索原型系统如图2-2所示，主要用于验证各种特征

21、提取算法的可行性和有效性。首先对用户提交的示例图像进行特征提取，然后与图像特征库中的特征值进行匹配，最后将检索结果返回给用户。系统的关键模块包括查询模块、特征提取模块、匹配模块，实际应用中每个模块都有许多具体技术可以采用，下面主要讨论各模块的功能及相关实现技术。用户界面图像输入模块特征提取模块查询接口模块图像显示模块检索匹配模块图像特征库图2.2 基于内容的图像检索系统结构2.2.2 查询模块查询模块用于提供前端界面的有关查询接口，用户通过查询界面访问图像库从而找到满足要求的图像，检索结果也是通过这个接口返回给用户。通常提供用户查询的方法有:(1)利用示例图像：即用户给定一幅与期望图像类似的图

22、像作为查询图像。(2)利用绘制草图：即用户借助绘图工具绘制出待查询图像。(3)利用主色调的检索：用户可以设置图像颜色百分比和颜色分布信息，从而找到具有相似颜色及比率的图像。2.2.3特征提取模块基于内容的图像检索首先要解决的问题就是图像内容的分析和表示。图像内容的分析和表示指的是通过对图像像素的颜色属性以及像素间的相住关系进行分析，从而得到一系列数字或者描述特征，这些特征可以在一定程度卜描述图像本身的内容。然后，利用这此特征可以对图像建立索引，从而达到图像检索的目的。因此，图像内容的表示问题本质上是一个图像特征的提取问题。从广义上来讲，图像的特征包括图像的底层特征和高层语义特征。底层特征用来描

23、述图像共有的特征，主要包括颜色、纹理、形状等;后者则用来描述图像自身的内容信息，比较抽象。本设计主要基于图像底层特征的特征提取。系统中的特征提取模块负责图像处理工作，具体实现CBIR系统中支持的各种特征提取算法，从而能从图像中提取相应的特征信息。本节简要地介绍几种图像特征。2.2.4 常用的图像特征1、颜色特征：颜色信息是在图像检索中使用最广泛的底层特征，它和图像中的物体和场景有找紧密的联系。与其他底层特征相比，颜色特征对于图像缩放、旋转、遮挡及其他形变有更强的鲁棒性。最早采用颜色特征进行图像检索的是由Swain和Ballard提出的基于颜色直方图的检索方法。图像颜色特征的表达涉及如下几个方面

24、的问题:一是选择一个合适的颜色空间;二是将颜色特征量化为向量形式;三是定义种相似度(距离)标准用来度量不同图像之间在颜色上的相似性。由于颜色特征和其他特征相比具有一定的稳定性，不随物体的平移、旋转、观察距离的变化而变化，对于图像缩放、旋转、遮挡及其他形变有着更强的变化。2、纹理特征：纹理也是图像的一个重要属性。航空、遥感照片、织物设计图案、复杂的自然风景以及动植物都有纹理。纹理特征有两个要素构成：(1)纹理基元；(2)基元的排列。纹理基元是一种或多种图像基元的组合，有一定的现状和大小。纹理由纹理基元排列而成，。基元排列的疏密程度、周期性、方向性的不同，能使图像的外观产生极大地改变。纹理可以认为

25、是灰度(颜色)在空间以一定的形式变化而产生的图案，是真实图像区域固有的特征之一。类似于颜色，纹理也常取决于飞人们的感知，一般说来可以认为纹理是由许多相似接近的、互相编织的元素构成，所以直观来说纹理描述可提供图像区域的平滑、稀疏、规则性等特性。3、形状特征：形状特征对于人类说是识别物体的主要信息，是一种重要的图像内容表达手段。按表达的形式分，可分为基于边界的和基于区域的两种类型。边界特征包括：线型形状，多边形逼近，有限元模型和傅里叶描绘子。区域特征主要有矩不变量等。形状特征是比颜色和纹理更高层一些的特征，对形状的表达比对颜色或纹理的表达从本质上要复杂的多，图像的形状信息不随图像颜色等特征的变化而

26、变化，是物体稳定的特征。特别对于图形，形状是它唯一重要的特征。形状特征的各种表示方法中一个重要标准是它必须具有仿射不变性，即相对于旋转平移和尺度变换具有不变性。通常来说，形状特征有两种表示方法，一种是基于边界轮廓特征(contour-based)的，包括:傅立叶形状描述户、小波轮廓描述子、边界直方图、链编码、曲率尺度空间等，其中最典型的方法为傅立叶形状描述子。一种是基于区域特征(region-based)的，如不变矩。前者只用到物体的外边界，而后者则关系到整个对象所在的区域。4、语义特征：图像的视觉特征在一定程度上能代表图像包含的信息，但事实上，人们判断图像的相似性并非仅仅建立在视觉特征的相似

27、性上更多的状况下，用户主要根据返回图像的含义，而不是颜色、纹理、形状等特征，来判别图像满足自己需要的程度这些图像的含义就是图像的高层语义特征，它包含了人对图像内容的理解基于语义的图像检索的目的，就是要使计算机检索图像的能力达到人的理解水平在一般的图像内容层次模型中，语义位于最高层；第2层和第3层之间的差别被许多学者称为“语义鸿沟”，语义鸿沟的存在是目前CBIR系统还难以被普通用户接受的原因在某些狭窄的专业领域。比如指纹识别和医学图像检索中，将图像低层特征和高层语义建立某种联系是可能的，但是在广泛领域内，低层视觉特征与高层语义之间并没有很直接的联系。采用颜色、纹理、形状等底层特征对图像进行的描述

28、往往与人对图像的描述存在较大的差异，直接利用这些特征作为检索依据常得不到令人满意的结果。解决这类问题的办法是采用高层的特征即“语义特征”进行检索。由于它是从人类视觉理解出发，着眼于提取图像中符合人类视觉的概念。基于语义的检索技术难度很大，是图像检索领域的研究方向。在语义级图像检索技术中，关键是实现语义的提取。这就要解决两个问题：语义特征具有“模糊性”，因此要提取图像的语义特征就必须解决特征的“模糊化”问题；语义特征与人的视觉理解紧密相关，所以在检索中要融入人的视觉感知，在“理解”图像的基础上检索图像。虽然采用语义内容进行查询是最符合人的使用要求的方式，也是理想的检索方式，但是就当前的计算机和图

29、像理解的发展水平来看，这种完全智能化的检索方法前正处于研究阶段，与实际应用还有较大的距离。2.2.5匹配模块查询模块将用户的查询请求通过特征提取模块转换为查询特征向量，然后调用匹配模块计算特征库中的侮一个特征与待查图像特征的相似度，并按相似程度由大到小排列返回给用户所需要的图像。基于内容的图像检索系统所使用的匹配不是精确匹配而是一种基一于相似的检索，它关心的是排序，选择合适的相似性度量函数很重要。目前研究图像内容的相似性度量是指图像特征间的相似性，是图像检索研究的重要组成部分。相似性度量方法的好坏影响到图像检索的性能;而相似性度量的计算复杂性影响到图像检索的用户响应时间。一般假设图像特征矢量

30、是距离空间中的元素(其中的元素称为点)，通过计算两点之间的接近程度来衡量图像特征之间的相似度。 2.2.5相似性度量函数对于图像特征向量X， Y，若满足相似性度量中的正定性、对称性和一三角不等性度量公理，它们之间的相似程度可以采用下面的距离度量或统计学方法来进行图像相似性判断。定义D(I， J)为示例图像I和图像数据库中图像J之问的距离表示图像I的N维特征向量中第i个特征向量。(1)Minkowski距离如果图像特征向量互相独立而且同等重要，那么可以采用Minkowski距离L。来度量图像之间的相似性:D(I,J)=(-fi(J)| p)这里当P分别等于1，2，时，D(I，J)称为L1，L2

31、，L3，L 。(2)欧几里德距离欧几里德趾离是一个应用非常普遍的距离度量。它的计算简单，并且与参考系统的旋转不变量相关。它可以看作是当p=2时的Murkowski距离吞，即L2=3)直方图交距离(Histogram intersection)直方图交距离(Histogram intersection) G可以认为是L，距离的一种特殊形式，Swain等用直方图交距离来计算图像颜色之间的相似性。图像I和图像J的直方图间的交距离定义为:S(I,J)=第三章基于内容的图像颜色特征提取在图像的形状、颜色、纹理等特征中，颜色特征是最显著、最可靠、最稳定的视觉特征，是人识别图像的主要感知特征。相对几何特征

32、而言，颜色对图像中子对象的大小和方向的变化都不敏感，具有相当强的鲁棒性。同时，在许多情况下，颜色又是描述一幅图像最简便而有效的特征。人们对于幅图像的印象，往往从图像中颜色的空间分布开始。所有这些都促使颜色成为基一于内容的图像检索所采取的主要手段，如何准确充分的提取一幅图像的颜色信息，井以适当的方式表示，将改接影响整个系统的效率和精度。3.1常用的颜色模型所谓颜色模型就是指某个三维颜色空间的一个一可见光一子集，它包含某个颜色域的所有颜色。颜色模型的用途是在某个颜色域内方便地指定颜色，对于每一个颜色域都是可见光的子集，所以任何一个颜色模型都无法包含所有可见光。3.1.1 RGB模型所谓RGB模型，

33、是指采用CIE规定的、以700nm(红)、546.1nm(绿)、435.8(蓝)三个光色为三基元，及颜色的三个属性所构成的模型。该模型将自然界的颜色通过选用这三基色按照不同比例混合而形成的模型，该模型可以用如下立方体来示意：图3.1 RGB颜色模型示意图值得注意的是，RGB模型所覆盖的颜色域取决于显示设备荧光点的颜色特性，是与硬件相关的，与人的视觉感知有一定的距离，人们无法感知给定一个RGB值其所对应的颜色，这时使用面向视觉感知的颜色模型比较方便。3.1.2 HSV模型HSV空间是一种符合人类视觉感知特征的颜色空间，特别适合于人类肉眼对颜色的识别，因此被广泛应用于计算机视觉领域。它把彩色信号表

34、示为三种属性:色调H(Hue)、饱和度S(Saturation)和亮度V(value)，其中亮度又称LightneSS或Intensity，所以HSV空间还有HLS和HIS这两种叫法。HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长，更一般地说，色调是由颜色名称来辨别的，如红、橙、黄、绿等，它用角度-180180或O360来度量。亮度V是颜色的明暗程度，通常用百分比度量，0%为最暗的黑色，而100%为最亮的白色。饱和度S指颜色的深浅程度，即在纯色中包含的白色光的成份。例如同样是红色，也会因颜色浓度不同而分为深红色、粉红色和浅红色。饱和度S也用百分比来度量，从浓度最小的0%到浓度完

35、全饱和的100%。色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。 3.1.3 L*a*b模型L*a*b颜色模型是在1931年国际照明委员会(CIE)制定的颜色度量国际标准的基础上建立的。1976年，这种模型被重新修订并命名为CIE L*a*b。L*a*b颜色设计为与设备无关，不管使用什么设备创建或输出图像，这种颜色模型产生的颜色都保持一致。L*a*b颜色由亮度或光亮度分量(L)和两个色度分量组成:即a分量(从绿到红)和b分量(从蓝到黄)。3.1.1CMY模型以红、绿、蓝的补色青(eyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型，常用

36、于从白光中滤去某种颜色，又被称为减性原色系统。CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。差别仅在于前者的原点为白，而后者的原点为黑。前者是定义在白色中减去某种颜色来定义一种颜色，而后者是通过从黑色中加入颜色来定义一种颜色。CMY模型以打印在纸张上油墨的光线吸收特性为基础，当白光照射到半透明油墨上时，部分光谱被吸收，部分被反射回眼睛。理论上，青(Cyna)、品红(Magenta)、和黄(Yelolw)色素能够合成吸收所有的颜色并产生黑色。因为所有打印油墨都会包含一些杂质，这三种油墨实际上产生一种土灰色，必须与黑色(K)油墨混合才能产生真正的黑色。将这些油墨

37、混合产生颜色称为四色印刷。减色(CMY)和加色(RGB)是互补色，每对减色产生一种加色，反之亦然。3.2颜色特征的提取选取合适的颜色空间后，将采用有效的算法提取颜色特征，典型的表达方法有颜色直方图法(Color Histogram)，颜色矩(Color Moments)，颜色聚合向量CCV (Color Coherence Vector)，颜色相关图(Color Correlograms)等。3.2.1颜色直方图基于颜色直方图的特征表示其核心思想是在一定的颜色空间中对图像中各种颜色出现的频数进行统计。彩色图像的直方图描述的是不同颜色在整幅图像中所占的比例，而并不关心每种颜色所处的空间位置。所以

38、颜色直方图特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。由于颜色直方图具有尺度不变性和旋转不变性，因此被广泛采用。颜色直方图是由横坐标为颜色级别，纵坐标为颜色出现的频率所绘成的图形。它是颜色信息的函数，表示图像中具有相同颜色级别的像素的个数。全局直方图是一种经常被采用的颜色特征，已在很多图像检索系统中得到应用。设C(x，y)为RGB空间一幅彩色图像，其颜色直方图的定义为：1, if C(x,y)=k0 , 其他Hc(k)=h(C(x，y) k= 0，1，kh(C(x，y)=其中，M、N为图像C(x，y)垂直和水平方向上的像素数目，并简称为图像的高和宽;而k为变换空间的颜色

39、数。除此之外，还有如下几种直方图法：1、基于分块颜色直方图法，采用的分块方法是把图像分成单独的NN块，并且图像分块太大则失去分块的意义，不能充分包含颜色的分布信息，分块太小则会增加检索过程的计算量。经试验比较分析，对二维空间进行33划分是较有效的划分方案。2、累加直方图法：当图像中的特征并不能取遍所有可取值时，统计直方图中会出现一些零值。这些零值的出现会对计算直方图的相交带来很大影响，从而使得算出的匹配值并不能正确的反映两图间的颜色差别。累加直方图是以颜色作为横坐标，从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。3 、局部累加直方图：在HSI空间里，H=0基本对应红色，H=p

40、i/3基本对应黄色，H=2pi/3基本对应绿色。这样在H轴上黄色与红色间，黄色与绿色间距相等。但从人的视觉感知来讲，黄色与红色间，黄色与绿色间本无所谓哪两个更相似。这表明色度信号的分布从视觉意义上讲，并不满足累加直方图应用的前提。所以，对色彩比较复杂的自然景物图像，一般累加直方图算法在检索中就会将不同色度的信号混淆起来。另外，一幅图像的颜色一般非常多，尤其是真彩色图像，因此直方图矢量的维数会非常高。如果能采用局部累加后降维，则计算量要少得多。统设计中，我们采用Pi/3为区间的长度，将H轴共分成6个不重叠的局部区间60k， 60(k+1)，k=0，1，5，通过分别计算每个局部区间的累加直方图进行

41、检索。上述方法都保留了颜色在图像中出现的概率信息，但也丢失了很多颜色的空间信息，因此不同的图像有可能具有相同颜色特征表示。从划分局部区域的角度来说可分为：基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的颜色分割方法。局部区域中的颜色信息可以表示为平均颜色、主颜色、颜色直方图和二进制颜色集等来表示。颜色直方图还具有以下性质: 性质一:直方图中的数值都是统计而来的，描述了该图像关于颜色的数量特征，可以反映图像颜色的统计分布和基本色调。性质二:直方图丢失了图像的空间位置特征。因此，不同的图像可能有相同的颜色分布，从而就具有相同的直方图。性质三:直方图具有可叠加性。

42、如果将图像划分为若干子区域，所有子区域的直方图之和等于全局直方图。3.2.2颜色矩Stricker:和Orengo提出了颜色矩的方法33，认为颜色分布信息主要集中在图像颜色的低阶矩中，因此仅采用一阶(均值)，二阶(方差)和三阶(斜度)等颜色矩可以很有效地表示图像中的颜色分布。与颜色直方图相比，该方法的另一个好处在于无需对特征进行向量化。颜色矩己经成功地应用于许多基于内容的图像检索系统(如QBIC)中。图像的颜色矩一共只需九个分量:三个颜色分量，每个分量上三个低阶矩，与它的颜色特征相比是非常简洁的。但是颜色矩特征的分辨能力较低，一般起到过滤缩小范围的作用，通常和其它特征结合使用。3.2.3颜色聚

43、合向量Pass等提出以图像的颜色聚合矢量CCV(color coherence vector)作为图像的颜色特征，它是图像直方图的一种演变，其核心思想是当图像中颜色相似的像素所占据的连续区域的面积大于一定的阀值时，该区域中的像素为聚合像素，否则为非聚合像素，这样统计图像所包含的每种颜色的聚合像素和非聚合像素的比率称为该图像的颜色聚合矢量，在图像检索过程中匹配目标图像的聚合矢量和检索图像的聚合矢量，聚合矢量中的聚合信息在某种程度上保留了图像颜色的空间信息。令定义为第i个聚合像素，为第j个非聚合像素，那么颜色聚合矢量(CCV)定义为:CCV=(1 ，1)， (2， 2)，(N ， N)可以看出，(

44、1 ，1)， (2， 2)，(N ， N)为图像的颜色直方图，由于加入了空间信息，采用颜色聚合向量CCV比采用颜色直方图检索的效果要好特别是对于大块的均匀区域或者图像中部分为纹理的图像检索效果更好。但是同时增大了计算量。3.3图像特征的相似性匹配在基于文本的检索方法中采用的是文本的精确匹配，而基于内容的图像检索则是通过计算查询图像和图像库中候选图像之间在视觉特征上的相似度匹配进行。因此，定义一个合适的视觉特征相似度度量方法对检索的效果有很大的影响。视觉特征大概可以表示成向量的形式，常用的相似度方法也是向量空间模型，即将视觉特征看作是向量空间中的点，通过计算两个点直接的接近程度来衡量图像特征间的

45、相似度。常见的方法有：直方图相交法、直方图欧氏距离、直方图余弦距离、二值集hammimg距离、直方图二次距离度量、二值集二次距离、直方图Mahalanobis距离。以下只简要介绍系统中常用的直方图的交、直方图欧氏距离两种距离度量方法。3.3.1直方图相交法度量直方图距离的一种经典方法就是直方图相交法。直方图的相交是指两个直方图在每个bin（维度）中共有的像素数量。具体做法是，根据颜色索引检索出查询图像的颜色直方图，将其与图像库中的每一图像的直方图取交集，根据交集的值来选出最佳匹配图像。在直方图相交法中，令HQ(K)和HR(K)分别为查询图像Q和图像库R的特征统计直方图，则二者之间的匹配值为：直

46、方图交集方法能对两幅图像进行详细的比较，然而对于许多合成的图像，如商标等，它们有大量的一致颜色，三维直方图只有几个域的值很高，而其它许多域的颜色信息变化有限。因而，对于这样的图像进行过细的比较是不必要的。又由于在扫描图像时容易产生一些噪音，所以这种过细的比较容易产生错误的结果。3.3.2欧氏距离方法我们可以利用欧基里德距离公式（Euclidean Distance）来计算距离。对于两个 N维直方图x，y，两者的欧氏距离可以表示如下：此距离公式虽然简单，但是与特定的颜色分布无关，因此我们可以引入相关权值A，这里A是一个维矩阵，此时距离公式可以表述如下：为了简化计算，将直方图x，y规范化使其满

47、足：矩阵，权表示颜色i与颜色j之间的相似度。若取z=x-y，则有，取定了距离公式后，我们需要确定A的取值，且要保证此矩阵A能够使，我们用表示颜色i与颜色j在RGB颜色空间的距离。取。有因为.3.3.3模糊方法模糊理论是在美国加州大学伯克利分校电气工程系的L.zadeh教授于1965年创立的模糊集合理论的数学基础上发展起来的，主要包括模糊集合理论、逻辑、模糊推理和模糊控制等方面的内容。他认为所有的自然语言均是模糊的，比如红的和老的等概念没有明确的内涵和外延，因而是不明确的和模糊的。可是，特定的环境中，人们用这些概念来描述某个具体对象时却又能心领神会，很少引起误解和歧义。模糊控制的基本思想：把人类专家对特定

展开阅读全文