第15讲NP完全理论与近似算法.ppt

资源描述

《第15讲NP完全理论与近似算法.ppt》由会员分享，可在线阅读，更多相关《第15讲NP完全理论与近似算法.ppt（44页珍藏版）》请在三一文库上搜索。

1、1,第15讲 NP完全性理论与近似算法,2,学习要点理解RAM，RASP和图灵机计算模型理解非确定性图灵机的概念理解P类与NP类语言的概念理解NP完全问题的概念理解近似算法的性能比及多项式时间近似格式的概念通过范例学习NP完全问题的近似算法（1）顶点覆盖问题；（2）旅行售货员问题；（3）集合覆盖问题；（4）子集和问题。,3,15.1 计算模型,在进行问题的计算复杂性分析之前，首先必须建立求解问题所用的计算模型，包括定义该计算模型中所用的基本运算。建立计算模型的目的是为了使问题的计算复杂性分析有一个共同的客观尺度。 3个基本计算模型：随机存取机RAM(Random Acc

2、ess Machine)；随机存取存储程序机RASP(Random Access Stored Program Machine) 图灵机(Turing Machine)。这3个计算模型在计算能力上是等价的，但在计算速度上是不同的。,4,15.1.1 随机存取机RAM,1、RAM的结构,5,15.1.1 随机存取机RAM,2、RAM程序,一个RAM程序定义了从输入带到输出带的一个映射。可以对这种映射关系作2种不同的解释。,解释一：把RAM程序看成是计算一个函数若一个RAM程序P总是从输入带前n个方格中读入n个整数 x1，x2，xn，并且在输出带的第一个方格上输出一个整数y 后停机，那么就

3、说程序P计算了函数f(x1，x2，xn)=y,解释二：把RAM程序当作一个语言接受器。将字符串S=a1a2an放在输入带上。在输入带的第一个方格中放入符号a1，第二个方格中放入符号a2，第n个方格中放入符号an。然后在第n+1个方格中放入0，作为输入串的结束标志符。如果一个RAM程序P读了字符串S及结束标志符0后，在输出带的第一格输出一个1并停机，就说程序P接受字符串S。,6,15.1.1 随机存取机RAM,3、 RAM程序的耗费标准,标准一：均匀耗费标准在均匀耗费标准下，每条RAM指令需要一个单位时间；每个寄存器占用一个单位空间。以后除特别注明，RAM程序的复杂性将按照均匀耗

4、费标准衡量。,标准二：对数耗费标准对数耗费标准是基于这样的假定，即执行一条指令的耗费与以二进制表示的指令的操作数长度成比例。在RAM计算模型下，假定一个寄存器可存放一个任意大小的整数。因此若设l(i)是整数i所占的二进制位数，则,7,15.1.2 随机存取存储程序机RASP,1、RASP的结构,RASP的整体结构类似于RAM，所不同的是RASP的程序是存储在寄存器中的。每条RASP指令占据2个连续的寄存器。第一个寄存器存放操作码的编码，第二个寄存器存放地址。RASP指令用整数进行编码。,2、RASP程序的复杂性,不管是在均匀耗费标准下，还是在对数耗费标准下，RAM 程序和RASP

5、程序的复杂性只差一个常数因子。在一个计算模型下 T(n)时间内完成的输入-输出映射可在另一个计算模型下模拟，并在kT(n)时间内完成。其中k是一个常数因子。空间复杂性的情况也是类似的。,8,15.1.3 图灵机,9,15.1.3 图灵机,根据有限状态控制器的当前状态及每个读写头读到的带符号，图灵机的一个计算步可实现下面3个操作之一或全部。 (1)改变有限状态控制器中的状态。 (2)清除当前读写头下的方格中原有带符号并写上新的带符号。 (3)独立地将任何一个或所有读写头，向左移动一个方格(L)或向右移动一个方格(R)或停在当前单元不动(S)。,k带图灵机可形式化地描述为一个7元组(Q，T，I

6、，b，q0，qf)，其中: (1)Q是有限个状态的集合。 (2)T是有限个带符号的集合。 (3)I是输入符号的集合，IT。(4)b是唯一的空白符，bT-I。 (5)q0是初始状态。 (6)qf是终止(或接受)状态。 (7)是移动函数。它是从QTk的某一子集映射到Q (TL，R，S)k的函数。,10,15.1.3 图灵机,图灵机M的时间复杂性T(n)是它处理所有长度为n的输入所需的最大计算步数。如果对某个长度为n的输入，图灵机不停机，T(n)对这个n值无定义。,图灵机的空间复杂性S(n)是它处理所有长度为n的输入时，在k条带上所使用过的方格数的总和。如果某个读写头无限地向右移动而不停机，S(n)

7、也无定义。,与RAM模型类似，图灵机既可作为语言接受器，也可作为计算函数的装置。,11,15.2 P类与NP类问题,一般地说，将可由多项式时间算法求解的问题看作是易处理的问题，而将需要超多项式时间才能求解的问题看作是难处理的问题。有许多问题，从表面上看似乎并不比排序或图的搜索等问题更困难，然而至今人们还没有找到解决这些问题的多项式时间算法，也没有人能够证明这些问题需要超多项式时间下界。在图灵机计算模型下，这类问题的计算复杂性至今未知。为了研究这类问题的计算复杂性，人们提出了另一个能力更强的计算模型，即非确定性图灵机计算模型，简记为NDTM(Nondeterministic Turing

8、Machine)。在非确定性图灵机计算模型下，许多问题可以在多项式时间内求解。,12,15.2.1 非确定性图灵机,非确定性图灵机（ NDTM ）：一个k带的非确定性图灵机M是一个7元组：(Q，T，I，b，q0，qf)。与确定性图灵机不同的是非确定性图灵机允许移动函数具有不确定性，即对于QTk中的每一个值(q;x1,x2,xk)，当它属于的定义域时，Q(TL，R，S)k中有唯一的一个子集(q;x1,x2,xk)与之对应。可以在(q;x1,x2,xk)中随意选定一个值作为它的函数值。,在图灵机计算模型中，移动函数是单值的，即对于QTk中的每一个值，当它属于的定义域时，Q(TL，R，S)k中只有

9、唯一的值与之对应，称这种图灵机为确定性图灵机，简记为DTM(Deterministic Turing Machine)。,13,15.2.2 P类与NP类语言,P类和NP类语言的定义： P=L|L是一个能在多项式时间内被一台DTM所接受的语言 NP=L|L是一个能在多项式时间内被一台NDTM所接受的语言,由于一台确定性图灵机可看作是非确定性图灵机的特例，所以可在多项式时间内被确定性图灵机接受的语言也可在多项式时间内被非确定性图灵机接受。故P NP。,14,15.2.2 P类与NP类语言,NP类语言举例无向图的团问题。该问题的输入是一个有n个顶点的无向图G=(V，E)和一个整数k。要求判定图G

10、是否包含一个k顶点的完全子图(团)，即判定是否存在VV，|V|=k，且对于所有的u，vV，有(u，v)E。若用邻接矩阵表示图G，用二进制串表示整数k，则团问题的一个实例可以用长度为的二进位串表示。因此，团问题可表示为语言： CLIQUE=w#v|w，v0，1*，以w为邻接矩阵的图G有一个k顶点的团，其中v是k的二进制表示。,15,15.2.2 P类与NP类语言,接受该语言CLIQUE的非确定性算法：用非确定性选择指令选出包含k个顶点的候选顶点子集V，然后确定性地检查该子集是否是团问题的一个解。算法分为3个阶段：,算法的第一阶段将输入串w#v分解，并计算出n= ，以及用v表示的整数k。若输入

11、不具有形式w#v或|w|不是一个平方数就拒绝该输入。显而易见，第一阶段可在时间内完成。,在算法的第二阶段中，非确定性地选择V的一个k元子集VV。,算法的第三阶段是确定性地检查V的团性质。若V是一个团则接受输入，否则拒绝输入。这显然可以在时间内完成。因此，整个算法的时间复杂性为。,非确定性算法在多项式时间内接受语言CLIQUE，故CLIQUENP。,16,15.2.3 多项式时间验证,VP=L|L*，为一有限字符集，存在一个多项式p和一个多项式时间验证算法A(X，Y)使得对任意X*，XL当且仅当存在Y*，|Y|p(|X|)且A(X，Y)=1。,多项式时间可验证语言类VP可定义为：,定理15

12、-1：VP=NP。,例如(哈密顿回路问题)：一个无向图G含有哈密顿回路吗? 无向图G的哈密顿回路是通过G的每个顶点恰好一次的简单回路。可用语言HAM-CYCLE 定义该问题如下： HAM-CYCLE=G|G含有哈密顿回路,17,15.3 NP完全问题,PNP。直观上看，P类问题是确定性计算模型下的易解问题类，而NP类问题是非确定性计算模型下的易验证问题类。大多数的计算机科学家认为NP类中包含了不属于P类的语言，即PNP。 NP完全问题有一种令人惊奇的性质，即如果一个NP完全问题能在多项式时间内得到解决，那么NP中的每一个问题都可以在多项式时间内求解，即P=NP。目前还没有一个NP完全问题

13、有多项式时间算法。,18,15.3.1 多项式时间变换,定义：语言L是NP完全的当且仅当 (1)LNP； (2)对于所有LNP有L p L。如果有一个语言L满足上述性质(2)，但不一定满足性质(1)，则称该语言是NP难的。所有NP完全语言构成的语言类称为NP完全语言类，记为NPC。,设，是2个语言。所谓语言能在多项式时间内变换为语言 (简记为 p )是指存在映身f: ，且f满足： (1)有一个计算f的多项式时间确定性图灵机； (2)对于所有x ，x ，当且仅当f(x) 。,19,15.3.1 多项式时间变换,定理15-2：设L是NP完全的，则 (1)LP当且仅当PNP； (2)若Lp

14、，且 NP，则是NP完全的。,定理的(2)可用来证明问题的NP完全性。但前提是：要有第一个NP完全问题L。,20,15. 3.2 一些典型的NP完全问题,部分NP完全问题树,21,迄今为止，所有的NP完全问题都还没有多项式时间算法。对于这类问题，通常可采取以下几种解题策略。 (1)只对问题的特殊实例求解 (2)用动态规划法或分支限界法求解 (3)用概率算法求解 (4)只求近似解 (5)用启发式方法求解本节主要讨论解NP完全问题的近似算法,15.4 NP完全问题的近似算法,22,学习要点:,理解近似算法的性能比的概念理解多项式时间近似格式的概念通过范例学习NP完全问题的近似算法,23,

15、概述,近似算法设计思想放弃求解最优解，用近似最优解代替最优解，以此换取：算法设计上的简化时间复杂性的降低近似算法是可行的：问题的输入数据是近似的；问题的解允许有一定程度的误差；近似算法可在很短的时间内得到问题的近似解。,24,衡量近似算法性能的标准：时间复杂性：必须是多项式阶的基本目标解的近似程度：重要目标若一个最优化问题的最优值为c*，求解该问题的一个近似算法求得的近似最优值为c，则将该近似算法的近似比定义为 = 在通常情况下，该性能比是问题输入规模n的一个函数(n)，即 (n), 1；且越大，近似解越差！,最小化问题 cc*,最大化问题，c*c,15.4.1 近似算法的

16、性能,25,近似算法的相对误差定义为： = 表示一个近似最优解与最优解相差的程度。若问题的输入规模为n，存在一个函数(n)，使得： (n) (n)称为近似算法的相对误差界。且有： (n)(n)-1,15.4.1 近似算法的性能,26,15.4.2 顶点覆盖问题的近似算法,问题描述：无向图G=(V,E)的顶点覆盖是它的顶点集V的一个子集VV，使得若(u,v)是G的一条边，则vV或uV。顶点覆盖V的大小是它所包含的顶点个数|V|。近似算法思想：初始时边集E=E，顶点集V=，每次从边集E中任取一条边(u, v)，把顶点u和v加入到顶点集V中，再把与u和v顶点相邻接的所有边从边集E中删除，直到边

17、集E为空。,27,15.4.2 顶点覆盖问题的近似算法,VertexSet approxVertexCover ( Graph g ) cset=； e1=g.e； while (e1 != ) 从e1中任取一条边(u,v)； cset=csetu,v；从e1中删去与u和v相关联的所有边； return c ,Cset用来存储顶点覆盖中的各顶点。初始为空，不断从边集e1中选取一边(u,v)，将边的端点加入cset中，并将e1中已被u和v覆盖的边删去，直至cset已覆盖所有边。即e1为空。,算法的时间复杂性：O(n+e),28,求解过程：,图(a)(e)说明了算法的运行过程及结果。(e)表示算

18、法产生的近似最优顶点覆盖cset，它由顶点b,c,d,e,f,g所组成。(f)是图G的一个最小顶点覆盖，它只含有3个顶点：b,d和e。,算法approxVertexCover的性能比为2。,A=(b, c), (e, f), (d, g),A=(b, c),A=(b, c), (e, f),初始：E=E=(a, b), (b, c), (c, d), (c, e), (d, e), (d, f), (d, g), (e, f),V=b, c,V=b, c, e, f,V=b, c, e, f, d, g,29,15.4.3 旅行售货员问题近似算法,问题描述：给定一个完全无向图G=(V,E)，其

19、每一边(u,v)E有一非负整数费用c(u,v)。要找出G的最小费用哈密顿回路。,比如，费用函数c往往具有三角不等式性质，即对任意的3个顶点u,v,wV，有：c(u,w)c(u,v)+c(v,w)。当图G中的顶点就是平面上的点，任意2顶点间的费用就是这2点间的欧氏距离时，费用函数c就具有三角不等式性质。,旅行售货员问题的一些特殊性质：,30,1 满足三角不等式的旅行售货员问题,对于给定的无向图G，可以利用找图G的最小生成树的算法设计找近似最优的旅行售货员回路的算法: 首先生成图G的最小生成树T；然后，对T进行深度优先遍历，得到的遍历序列就是近似最优的旅行售货员回路。,31,1 满足三角不等

20、式的旅行售货员问题,void approxTSP (Graph G) (1)选择G的任一顶点r； (2)用Prim算法找出带权图G的一棵以r为根的最小生成树T； (3)前序遍历树T得到的顶点表L； (4)将r加到表L的末尾，按表L中顶点次序组成回路H，作为计算结果返回； ,当费用函数满足三角不等式时，算法找出的旅行售货员回路的费用不会超过最优旅行售货员回路费用的2倍。,算法的时间复杂性：O(n2),32,(b)表示找到的最小生成树T；(c)表示对T作前序遍历的次序；(d)表示L产生的哈密顿回路H； (e)是G的一个最小费用旅行售货员回路。,示例求解过程：,线路： abcbhb adefege

21、da,L=(a, b, c, h, d, e, f, g),H=(abchde fga),H*=(abchf geda),33,2 一般的旅行售货员问题,在费用函数不一定满足三角不等式的一般情况下，不存在具有常数性能比的解TSP问题的多项式时间近似算法，除非P=NP。换句话说，若PNP，则对任意常数1，不存在性能比为的解旅行售货员问题的多项式时间近似算法。,34,15.4.4 集合覆盖问题的近似算法,问题描述：给定一个完全无向图G=(V,E)，其每一边(u,v)E有一非负整数费用c(u,v)。要找出G的最小费用哈密顿回路。,集合覆盖问题的一个实例X,F由一个有限集X及X的一个子集族F组成。子

22、集族F覆盖了有限集X。也就是说X中每一元素至少属于F中的一个子集，即X= 。对于F中的一个子集CF，若C中的X的子集覆盖了X，即X= ，则称C覆盖了X。集合覆盖问题就是要找出F中覆盖X的最小子集C*，使得 |C*|=min|C|CF且C覆盖X,35,15.4.4 集合覆盖问题的近似算法,集合覆盖问题举例：,用12个黑点表示集合X。F=S1,S2,S3,S4,S5,S6,，如图所示。容易看出，对于这个例子，最小集合覆盖为：C=S3,S4,S5,。,36,15.4.4 集合覆盖问题的近似算法,集合覆盖问题近似算法贪心算法,算法的循环体最多执行min|X|，|F|次。而循环体内的计算显然可在O(|X

23、|F|)时间内完成。因此，算法的计算时间为O(|X|F|min|X|，|F|)。由此即知，该算法是一个多项式时间算法。,Set greedySetCover (X,F) U=X； C=； while (U !=) 选择F中使|SU|最大的子集S； U=U-S； C=CS； return C； ,37,15.4.5 子集和问题的近似算法,问题描述：设子集和问题的一个实例为S,t。其中，S=x1，x2，xn是一个正整数的集合，t是一个正整数。子集和问题判定是否存在S的一个子集S1，使得。,38,1 子集和问题的指数时间算法,int exactSubsetSum (S,t) int n=|S|；

24、L0=0； for (int i=1；i=n；i+) Li=mergeLists(Li-1,Li-1+Si)；删去Li中超过t的元素； return max(Ln)； ,算法以集合S=x1，x2，xn和目标值t作为输入。算法中用到将2个有序表L1和L2合并成为一个新的有序表的算法mergeLists(L1,L2)。,39,2 子集和问题的完全多项式时间近似格式,基于算法exactSubsetSum，通过对表Li作适当的修整建立一个子集和问题的完全多项式时间近似格式。,在对表Li进行修整时，用到一个修整参数，01。用参数修整一个表L是指从L中删去尽可能多的元素，使得每一个从L中删去的元素y，

25、都有一个修整后的表L1中的元素z满足(1-)yzy。可以将z看作是被删去元素y在修整后的新表L1中的代表。,举例：若=0.1，且 L=10,11,12,15,20,21,22,23,24,215，则用对L进行修整后得到L1=10，12，15，20，23，215。其中被删去的数11由10来代表，21和22由20来代表，24由23来代表。,40,2 子集和问题的完全多项式时间近似格式,对有序表L修整算法,List trim(L,) int m=|L|； L1=L1； int last=L1； for (int i=2；i=m；i+) if (last(1-)*Li) 将Li加入表L1的尾部； l

26、ast=Li； return L1； ,子集和问题近似格式,int approxSubsetSum(S,t,) n=|S|； L0=0； for (int i=1；i=n；i+) Li=Merge-Lists(Li-1, Li-1+Si)； Li=Trim(Li,/n)；删去Li中超过t的元素； return max(Ln)； ,41,设：S=，t=308，i=1, 2, ., n。由算法确定的修整参数是/4=0.05。初始时，L0=。计算Li的3阶段结果： L1= L1= L1= L2= L2= L2= L3= L3= L3= L4= L4= L4= 算法最后返回z=302最为近似解答。容易看出该例的最优解为104+102+101=307，误差2%。,示例求解：,42,本章小结,近似算法放弃求最优解，用近似解代替最优解，以换取算法设计上的简化和时间复杂性的降低。近似算法通常采用两个标准来衡量性能：算法的时间复杂性解的近似程度近似比相对误差相对误差界(n),43,作业,35.1-4 35.2-3,44,

展开阅读全文