一种基于隶属函数的相似度计算方法及其应用.doc

资源描述

《一种基于隶属函数的相似度计算方法及其应用.doc》由会员分享，可在线阅读，更多相关《一种基于隶属函数的相似度计算方法及其应用.doc（12页珍藏版）》请在三一文库上搜索。

1、一种基于隶属函数的相似度计算方法及其应用doi:10.3969/j.issn.1001-3695.2010.03.022 Similarity measurement method based on membership function and its application LI Jun-jun, QI Jin, HU Jie, PENG Ying-hong (School of Mechanical Engineering, Shanghai Jiaotong University, Shanghai 200240, China) Abstract:It is very complex

2、and imprecise that using distance functions to calculate similarity under fuzzy conditions. This paper introduced a novel similarity measurement method based on the analysis of membership functions. According to different types of demand in case retrieval, constructed respectively similarity measure

3、ment models for fuzzy numerical demand and fuzzy linguistic demand. In the weights assignment, this paper used the deviation information of similarity values to calculate objective weights, and then combined the objective weights and subjective weights to form synthesis weights. Finally, applied thi

4、s method in the conceptual design of motor engines. It demonstrates that this method can perform rapid and effective case retrieval in response to different demand. Key words:membership function; similarity; weight; case retrieval 基于实例推理(case-based reasoning,CBR)是一种相似类比推理,其核心思想是通过访问和调整实例库中过去同类问题的求解,

5、推理出当前问题的解决策略1。其内容主要包括高效的实例组织和检索方法、以前成功的问题解对当前问题的指导作用2。实例检索是CBR方法的中心环节,而相似度计算是实例检索的核心技术,其计算方法的好坏直接决定了实例检索的质量和可靠性。因此,在构建和管理基于实例推理系统(CBRs)时,相似度计算起到了非常关键的作用3。许多CBRs根据实例的属性特征,采用相似度函数来计算实例之间的相似度4。目前,大部分实例检索研究均是采用基于距离函数的属性相似度计算方法,根据距离函数的不同,还可分为欧式距离函数和曼哈顿距离函数。例如,周凯波等人35在两精确属性值间相似度计算模型的基础上,提出了区间与精确值之间的相似度计算

6、方法以及区间与区间之间的相似度计算方法。但是这种方法只单纯从数值上考虑表述现实世界中对象的属性特征的特点,对所有属性数值不加区分地采用直线距离来计算相似度,并不能真实地反映数据之间的差异。Tahera等人6,7针对模糊条件下系统输入输出变量中的定性信息,提出采用模糊数字表示方法来计算相似度,将精确型数值通过高斯函数转换成模糊型数值后,以距离函数来计算实例的属性相似度。然而由于只是简单地把所有数字转换成模糊数字,随着检索实例和检索内容的增多,必然造成模糊相似度计算量的大量增加,影响检索效率。另外,由于距离函数无法表征实例属性本身的特点,导致采用基于距离函数的相似度算法计算的结果并不完全满足相似度

7、的实质,从而降低了实例检索的精度。为了解决模糊实例检索中的不精确性和不确定性问题,提高相似度计算效率,本文提出了基于隶属函数的相似度计算方法,分别针对模糊数字型和模糊语义型需求构建计算模型;同时,综合考虑主观权重和客观权重的影响,以全局相似度的概念来表示实例的相似度。 1 相似度计算总体框架隶属函数是经典子集特征函数概念的推广,它是刻画模糊子集本质特征的映射。给定一个非空集合Z,Z上的一个模糊子集S是由一个隶属函数s(z)来定义的。隶属函数s(z)的值域为0,1,它反映Z中的每个元素z对于模糊子集S的隶属程度。当z是S中的一个值时,s(z)=1;当z在S之外时,s(z)=0;当z是S可接受

8、的一个值时,s(z)的值在01。假设z是历史实例某个属性的一个确定值,S是模糊需求子集,则s(z)表示属性值z满足模糊需求si(siS)的程度,即z与si的相似度。基于上面这种思想,本文构建了几种隶属函数来表达不同类型的模糊需求,并且通过计算s(z)来得到设计实例与以前实例的相似度。? 相似度计算方法的总体框架如图1所示。首先根据模糊需求选择相应的计算模型,计算出设计实例与历史实例的属性相似度矩阵;然后根据各属性的相似度离差信息计算出属性的客观权重,结合专家输入的主观权重,利用乘法合成得到实例各属性的组合权重,并根据相似度矩阵和组合权重计算出每个实例的全局相似度;最后通过设定合适的相似度水平来

9、得到最相似的实例集。 2 相似度计算关键技术 2.1 隶属函数选择隶属函数的正确选取在相似度计算中起着非常重要的作用。针对模糊条件下输入输出变量的不精确性特征,计算相似度的隶属函数主要有梯形函数、三角形函数和高斯函数8。本文选取一个典型的高斯函数计算实例属性的相似度9: (z)=e?-(z-m)222(1) 其中:(z)是z的相似度;m是平均值;是高斯函数宽度。考虑到三角形函数为梯形函数的一个特例,只需将这个高斯函数与三角函数进行比较。给实例的某属性设定一个相似度水平,如图2所示。当取较高的相似度水平-水平时,|v1-v2|v3-v4|,即采用高斯函数能检索到较多有用的实例;当取较低的相似

10、度水平-水平时,|v5-v6| 同时,高斯函数在概率论上为正态分布函数,而现实世界中实例以及实例属性的分布很多情况下就是正态分布的。因此,笔者认为采用高斯函数来进行相似度计算,从而对实例进行检索,能够返回更加有效的结果。 2.2 面向模糊数字型需求的计算很多情况下,工程师用一个估测值v来描述某种特殊的需求,这种需求包括目标值v及其相应的关系,这两个参数都由工程师给定。一般而言,有六种可能的关系:等于、大于、大于等于、小于、小于等于、在之间(在v1、v2之间)。本文采用高斯函数并将其扩展来表达这六种关系,如图3所示。高斯函数式(1)的实例数据几乎全部处于区间m-3,m+3内,因此本文采用常用

11、的6作为特征函数的定义域。图3(a)(d)的表达式分别为式(2)(5)。 1(z)=e-(v-z)2221 vminzv e-(z-v)2222 vv,1=(v-vmin)/3(3) 3(z)=1 zv? e-(z-v)2222 vvmax,1=(vmax-avr)/3(8) 其中:L(z)、M(z)、H(z)分别表示语义低、中、高时的函数方程,那么模糊语义需求ti与真值z之间的语义评估即为s(ti,z)=T(z)。 2.4 权重计算属性权重的实质是属性在决策过程相对重要程度的一种主观评价和客观反映的综合度量,按性质主要分为:a)主观权重,反映决策者对各属性的偏好或者属性本身的重要程度,确定

12、的方法有专家直接赋权法和二元对比法等,用W(1)=w(1)1,w(1)2,w(1)i,w(1)m表示。b)客观权重,反映属性所含的信息量对决策结果的贡献,此类权重与其属性值对方案的区分能力成正比,对各方案区分能力强的属性应赋予相对大的权重,而不论属性本身的重要程度如何,用W(2)=w(2)1,w(2)2,w(2)i,w(2)m表示。设vx为设计实例,V=v1,v2,vi,vn是以前的实例集,vx和vi的第j个属性相似度记为sij,则实例vx与实例集V中所有实例的属性相似度构成相似度矩阵: S=S11S12S1mS21S22S2m?螃? ?螵?Sn1Sn2Snm 那么基于相似度离差信息的客观权

13、重计算表达式为5 w(2)j=ni=1nk=i+1(sij-skj)2 mj=1ni=1nk=i+1(sij-skj)22(9) 其中:ni=1nk=i+1(sij-skj)2表示各实例第j个属性的相似度离差平方和。根据属性权重的实质,权重应该是上面两类权重的组合,即W=f(W(1),W(2),本文采用乘法合成计算组合权重: wi=w(1)iw(2)i/mj=1w(1)jw(2)j; i=1,2,m(10)? 从式(10)可以看出,组合权重综合考虑了决策者偏好和实例属性信息自身的特点。 2.5 全局相似度全局相似度由面向模糊数字需求计算的相似度和面向模糊语义需求计算的相似度组成。假设模糊数

14、字需求集为U,模糊语义需求集为T,则第i个实例的全局相似度表达式为 si(g,z)=mj=1wjsijmj=1wj= nj=1wjs(ui,z)mj=1wj+ mj=n+1wjs(ti,z)mj=1wj(11) gG,G=UT 其中:g为模糊设计需求;z为实例集中的实例。 3 应用实例将上述相似度和权重计算方法应用于基于实例推理的汽车发动机概念设计中。表1为上海某汽车公司发动机概念设计中已有的部分实例,其中发动机编号是惟一的。表1 发动机概念设计实例实例?蚝欧?机?嗪?/ID汽缸容?/cc压缩比缸径冲程最大功?/kW最大功率?速/rpm 最大扭?/Nm最大扭矩?速/rpm缸体材?/BM

15、1A317629.68185.58356001563400铝 2A7199512849010057501803250铝 3A12199512849011564002004250铝 4B1013429.378.7696360001105200铁 5A15199710.58196.911062001904200铝 6A1623549.7879912558002204200铝 7A19133910.873807060001234600铝 8A23179910.58187.310363001744300铝 9A2524909.58966.711256002094400铝 10A32479910.588

16、.39327063004903400铝 11B15136010.575775653001203400铁 12C23299610.7858819066003002500镁铝合金为提高计算效率,当获取了模糊设计需求后,首先必须通过一定的约束规则来筛选发动机编号,规则部分语句如下: if the BM = 铝 then series of ID =A; if the BM = 铁 then series of ID =B; if the BM = 镁铝合金 then series of ID =C; 表2为模糊设计需求及其相应的相似度计算模型。设计需求中缸体材料为铝,因此根据约束条件选择A系列的发

17、动机。根据设计需求及其相应的计算模型,计算出实例的属性相似度矩阵如表3所示。表2 设计需求与计算模型需求?澳推?缸容量/cc压缩比缸径冲程最大功率/kW最大功率?速/rpm最大扭矩/Nm 最大扭矩?速/rpm缸体?牧? 设计?枨?2000?笥乙话?81大于?扔?90110120小于等?6000越大越好大于4500铝计算?湍：?数?中枨螵暗扔凇蹦：?语?逍枨螵爸小蹦：?数?中枨螵暗扔凇蹦：?数?中枨螵按笥诘扔凇蹦：?数字?枨笤讵?v1、v2之间模糊数字?枨螵靶诘扔凇蹦：?语义?枨螵案摺蹦：?数?中枨螵按笥凇? 规则?际? 表3 设计实例与历史实例的属性相似度实例?蚝牌?缸容量si1压缩比

18、si2缸径si3冲程si4最大功率si5最大功率?速si6最大扭矩si7最大扭矩?速si8全局?嗨贫?si 10.49380.02481.00000.84550.12871.00000.00130.30700.4785 20.99970.01110.53111.00000.75481.00000.00320.01110.5594 30.99970.01110.53111.00001.00000.01110.00650.83530.4976 50.99990.98261.00001.00001.00000.32470.00460.77170.7259 60.93050.05130.07961.0

19、0000.99501.00000.01270.77170.6274 70.00430.88760.01110.43650.01111.00000.00031.00000.4699 80.60450.98261.00000.94140.87130.07960.00250.89120.6305 90.87120.01110.01110.01111.00001.00000.00890.97160.4858 100.01110.98260.02361.00000.01110.07961.00000.30700.4692 给定主观权重向量为W(1)=0.15,0.15,0.1,0.3,0.15,0.2,

20、0.3,0.2,按照式(9)和(10)计算客观权重和组合权重分别为:W(2)=0.3286,0.4783,0.3963,0.2384,0.3990,0,4305,0.2149,0.2421,W=0.1004,0.1461,0.0807,0.1457,0.1219,0.1753,0.1313,0.0986。可以看出,虽然汽缸容量、压缩比和最大功率的主观权重相等,即w(1)1=w(1)2=w(1)5,但考虑相似度离差信息以后,其权重就有了差异。最后根据式(11)计算出各个实例的全局相似度如表3所示,相似度从高到低的实例分别是5、8、6、2、3、9、1、7、10。相似度计算结果表明,此方法能有效地

21、对实例进行检索。在CBR的设计系统中,设定一定的相似度水平,取相似度大于该水平的实例或直接取相似度较大的几个实例,对检索出的实例按一定的修改策略进行调整,最终得到新设计问题的求解方案。 4 结束语为了提高实例检索的效率和精度,保证CBRs的有效性,本文提出采用基于隶属函数的相似度算法来进行模糊实例检索的方法。该方法数学模型简单实用,不仅考虑了实例属性数据本身的分布特点,而且在计算过程中综合考虑了主观因素和客观因素的影响,较好地克服了模糊实例检索中传统的基于距离函数相似度算法的复杂性和不精确性缺点,更加真实地反映了现实世界中实例之间的相似程度。此方法应用于汽车发动机的概念设计之中,有效地缩短了汽车设计制造的周期,提高了企业对市场的快速响应能力。

展开阅读全文