第二次课动态规划.ppt_三一文库31doc.com

资源描述

《第二次课动态规划.ppt》由会员分享，可在线阅读，更多相关《第二次课动态规划.ppt（84页珍藏版）》请在三一文库上搜索。

1、第二章动态规划及其应用,本周POJ上做题：动态规划,1037 A decorative fence、 1050 To the Max、 1088 滑雪、 1125 Stockbroker Grapevine、 1141 Brackets Sequence、 1159 Palindrome、 1160 Post Office、 1163 The Triangle、 1458 Common Subsequence、 1579 Function Run Fun、 1887 Testing the CATCHER、 1953 World Cup Noise、 2386 Lake Counting,动

2、态规划是1951年由美国数学家贝尔曼（Richard Bellman)提出，它是解决一类多阶段决策问题的优化方法，也是考察问题的一种途径。动态规划方法是现代企业管理中的一种重要决策方法。如果一个问题可将其过程划分为若干个相互联系的阶段问题，且它的每一阶段都需进行决策，则这类问题均可用动态规划方法进行求解。根据多阶段决策过程的时序和决策过程的演变，动态规划方法有以下四种类型：离散确定型、离散随机型、连续确定型和连续随机型。,几类算法的经典名言,动态规划：不做重复的事；贪心法：只选最好的；分支定界法：没戏的就杀掉；回溯法：碰壁就回头。,作人生规划要善于利用动态规划；找女朋友要善于利用好

3、贪心算法；人生重大决策要活学活用回溯法；,算法总体思想,动态规划算法与分治法类似，其基本思想也是将待求解问题分解成若干个子问题,为什么动态规划比递归算法有效？,但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。在用分治法求解时，有些子问题被重复计算了许多次，因此利用递归算法得到的算法往往是指数复杂度的算法。如果能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，就可以避免大量重复计算，从而得到多项式时间算法。,POJ 2753 Fibonacci数列例子：,确定Fibonacci sequence fn项的值: 考虑Fibonacci sequence的

4、递归定义: 我们将得到如下的递归算法:,在POJ上递交之后，返回的结果是：Time Limited。而不是可爱的AC,子问题的重叠性,将上述递归算法展开: 可以看出 f(n-1) 被调用 1次, f(n-2)被调用 2次, 等等. 这将导致大量的调用最终解为：,树形递归,计算过程中存在冗余计算，为了除去冗余计算，可以从已知条件开始计算，并记录计算过程中的中间结果。,动态规划,例：POJ 2753 Fibonacci数列 int fn+1; f1=f2=1; int I; for(i=3;i=n;i+) fi = fi-1+fi-2; cout fn endl; 用空间换时间,动态规划算法的基

5、本要素,一、最优子结构,一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其为最优子结构性质。,同一个问题可以有多种方式刻划它的最优子结构，有些表示方法的求解速度更快（空间占用小，问题的维度低）,例如：最短路径问题。a b c,在分析问题的最优子结构性质时，所用的方法具有普遍性：首先假设由问题的最优解导出的子问题的解不是最优的，然后再设法说明在这个假设下可构造出比原问题最优解更好的解，从而导致矛盾。,动态规划算法的基本要素,二、重叠子问题,递归算法求解问题时，每

6、次产生的子问题并不总是新问题，有些子问题被反复计算多次。这种性质称为子问题的重叠性质。,动态规划算法，对每一个子问题只解一次，而后将其解保存在一个表格中，当再次需要解此子问题时，只是简单地用常数时间查看一下结果。,通常不同的子问题个数随问题的大小呈多项式增长。因此用动态规划算法只需要多项式时间，从而获得较高的解题效率。,一、例子（最短路问题）,假如上图是一个线路网络，两点之间连线上的数字表示两点间的距离（或费用），我们的问题是要将货物从A地运往E地，中间通过B、C、D三个区域，在区域内有多条路径可走，现求一条由A到E的线路，使总距离最短（或总费用最小）。,将该问题划分为4个阶段的决策问题第一

7、阶段为从A到Bj（j=1，2，3），有三种决策方案可供选择；第二阶段为从Bj到Cj（j=1,2,3），也有三种方案可供选择；第三阶段为从Cj到Dj(j=1,2)，有两种方案可供选择；第四阶段为从Dj到E，只有一种方案选择。,如果用完全枚举法，则可供选择的路线有3321=18（条），将其一一比较才可找出最短路线： AB1C2D3E 其长度为12。,显然，这种方法是不经济的，特别是当阶段数很多，各阶段可供的选择也很多时，这种解法甚至在计算机上完成也是不现实的。由于我们考虑的是从全局上解决求A到E的最短路问题，而不是就某一阶段解决最短路线，因此可考虑从最后一阶段开始计算，由后向前逐步推至A点：

8、,第四阶段，由D1到E只有一条路线，其长度f4（D1）=3，同理f4（D2）=4。第三阶段，由Cj到Di分别均有两种选择，即,，决策点为D1,决策点为D1,，决策点为D2,第二阶段，由Bj到Cj分别均有三种选择，即：,决策点为C2,决策点为C1或C2,决策点为C2,第一阶段，由A到B，有三种选择，即：,决策点为B3,f1（A）=15说明从A到E的最短距离为12，最短路线的确定可按计算顺序反推而得。即 AB3C2D2E 上述最短路线问题的计算过程，也可借助于图形直观的表示出来：,图中各点上方框的数，表示该点到E的最短距离。图中红箭线表示从A到E的最短路线。,从引例的求解过程可以得到以下启示：

9、,对一个问题是否用上述方法求解，其关键在于能否将问题转化为相互联系的决策过程相同的多个阶段决策问题。,所谓多阶段决策问题是：把一个问题看作是一个前后关联具有链状结构的多阶段过程，也称为序贯决策过程。如下图所示：,在处理各阶段决策的选取上，不仅只依赖于当前面临的状态，而且还要注意对以后的发展。即是从全局考虑解决局部（阶段）的问题。各阶段选取的决策，一般与“时序”有关，决策依赖于当前的状态，又随即引起状态的转移，整个决策序列就是在变化的状态中产生出来，故有“动态”含义。因此，把这种方法称为动态规划方法。决策过程是与阶段发展过程逆向而行。,拦截导弹（poj1887 ）,某国为了防御敌国的导弹袭

10、击，发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷：虽然它的第一发炮弹能够到达任意的高度，但是以后每一发炮弹都不能高于前一发的高度。某天，雷达捕捉到敌国的导弹来袭。由于该系统还在试用阶段，所以只有一套系统，因此有可能不能拦截所有的导弹。,输入输入数据为导弹依次飞来的高度，所有高度值均为不大于30000的正整数。输出输出只有一行是这套系统最多能拦截的导弹数。,输入样例 389 207 155 300 299 170 158 65 输入样例 6,题目分析,因为只有一套导弹拦截系统，并且这套系统除了第一发炮弹能到达任意高度外，以后的每一发炮弹都不能高于前一发炮弹的高度；所以，被拦截的导

11、弹应该按飞来的高度组成一个非递增序列。题目要求我们计算这套系统最多能拦截的导弹数，并依次输出被拦截导弹的高度，实际上就是要求我们在导弹依次飞来的高度序列中寻找一个最长非递增子序列。,设X=x1,x2,xn为依次飞来的导弹序列，Y=y1,y2,yk为问题的最优解（即X的最长非递增子序列），s为问题的状态（表示导弹拦截系统当前发送炮弹能够到达的最大高度，初值为s=第一发炮弹能够到达任意的高度）。,如果y1=x1，即飞来的第一枚导弹被成功拦截。那么，根据题意“每一发炮弹都不能高于前一发的高度”，问题的状态将由s=变成sx1（x1为第一枚导弹的高度）；,在当前状态下，序列Y1=y2,yk也应该是序列

12、X1=x2,xn的最长非递增子序列（大家用反证法很容易证明）。也就是说，在当前状态sx1下，问题的最优解Y所包含的子问题（序列X1）的解（序列Y1）也是最优的。这就是拦截导弹问题的最优子结构性质。,设D(i)为第i枚导弹被拦截之后，这套系统最多还能拦截的导弹数（包含被拦截的第i枚）。我们可以设想，当系统拦截了第k枚导弹xk，而xk又是序列X=x1,x2,xn中的最小值，即第k枚导弹为所有飞来的导弹中高度最低的，则有D(k)=1；当系统拦截了最后一枚导弹xn，那么，系统最多也只能拦截这一枚导弹了，即D(n)=1；其它情况下，也应该有D(i)1。,根据以上分析，可归纳出问题的动态规划递归方程为

13、：,假设系统最多能拦截的导弹数为dmax（即问题的最优值），则 dmax （i为被系统拦截的第一枚导弹的顺序号）,所以，要计算问题的最优值dmax，需要分别计算出D（1）、D（2）、D（n）的值，然后将它们进行比较，找出其中的最大值。,根据上面分析出来的递归方程，我们完全可以设计一个递归函数，采用自顶向下的方法计算D（i）的值。然后，对i从1到n分别调用这个递归函数，就可以计算出D（1）、D（2）、D（n）。,但这样将会有大量的子问题被重复计算。比如在调用递归函数计算D（1）的时候，可能需要先计算D（5）的值；之后在分别调用递归函数计算D（2）、D（3）、D（4）的时候，都有可能需要先计算D（

14、5）的值。如此一来，在整个问题的求解过程中，D（5）可能会被重复计算很多次，从而造成了冗余，降低了程序的效率。,其实，通过以上分析，我们已经知道：D（n）=1。如果将n作为阶段对问题进行划分，根据问题的动态规划递归方程，我们可以采用自底向上的方法依次计算出D（n-1）、D（n-2）、D（1）的值。这样，每个D（i）的值只计算一次，并在计算的同时把计算结果保存下来，从而避免了有些子问题被重复计算的情况发生，提高了程序的效率。,int main（） int h2000,d2000,count,c,max,i,j;/h表示高度值，d表示最优值，c是能拦截得最多导弹数 count=0; while（s

15、canf（“%d“,h+count+）!=EOF）; /输入高度 dcount-1=1; c=1; for（i=count-2;icount;j+） if（(hi=hj) ,思考题,上述问题修改成：要求拦截所有导弹，则需要多少套上述系统？,实例POJ2122：Flight Planning,Your job is to write a program that plans airplane flights. Each flight consists of a series of one or more legs. Your program must choose the best altitu

16、de for each leg to minimize the amount of fuel consumption during the trip.,The airplane has a fixed airspeed, given by the constant VCRUISE, and a most-efficient cruising altitude, AOPT. When flying at altitude AOPT, fuel consumption in gallons per hour is given by GPHOPT. When flying at an altitud

17、e that is different from AOPT, fuel consumption increases by GPHEXTRA for each 1000 feet above or below AOPT.,The flight starts and finishes at an altitude of 0. Each 1000 foot climb burns an extra amount of fuel given by CLIMBCOST (there is no reduction in fuel consumption when you descend). Make t

18、he approximation that all climbing and descending is done in zero time at the beginning of each flight leg.,Thus each leg is flown at a constant airspeed and altitude. For this problem, the airplane characteristics are given by the following constants:,VCRUISE 400 knots (a knot is one nautical mile(

19、1.852km) per hour) AOPT 30,000 feet GPHOPT 2000 gallons per hour GPHEXTRA 10 gallons per hour for each 1000 feet CLIMBCOST 50 gallons per 1000 feet of climb,Before each flight, you are given the length of each leg and the tailwind expected for each leg. A positive tailwind increases the airplanes sp

20、eed over the ground, and a negative tailwind decreases its speed over the ground. For example, if airspeed is 400 knots and the tailwind is -50 knots, speed over the ground is 350 knots.,By policy, altitude for each leg must be some integer multiple of 1000 feet, between 20,000 and 40,000 feet, incl

21、usive. Your program must compute the best altitude for each leg to minimize overall fuel consumption for the trip, and must compute the fuel required for the trip.,Input The first line contains an integer N, representing the number of flights you are required to plan. Each flight consists of the fol

22、lowing input lines: The first input line in a flight contains an integer K (0 K 10), representing the number of legs in the flight. The next K input lines each contain the following three integers: (1) The length of the leg, in nautical miles (2) The expected tailwind at 20,000 feet, in knots (3) Th

23、e expected tailwind at 40,000 feet, in knots,The expected tailwind at altitudes between 20,000 and 40,000 feet is computed by linear interpolation. For example, the expected tailwind at 30,000 feet is halfway between the expected tailwind at 20,000 feet and the expected tailwind at 40,000 feet.,Outp

24、ut Your program must produce one output line for each flight. The output line must contain the flight number (counting from the beginning of the problem), the chosen altitude for each leg (in thousands of feet), and the fuel required for the trip (in gallons, to the nearest gallon).,图例：,转换为多段图问题,Fli

25、ght Plan可以转换为多段图问题，每一条边代表某段由前一段飞行高度飞到本段的某一飞行高度的燃油消耗量,Analysis,一、计算飞机在地域i的耗油量假设飞机在地域i-1（2ik+1）的海拔高度为l，飞到地域i的海拔高度为m，计算飞机在地域i的耗油量gi,l,m必须考虑如下几个因素：（注意：为了方便计算，飞行高度和风速以1000feet为单位） 1.上升过程增加的耗油量a 由于飞机每上升一个单位，需要增加climbcost的耗油量，因此,Analysis,2.每小时的实际耗油量b 飞机在海拔高度aopt飞行时每小时耗油gphopt.当飞机在m高度飞行时，与aopt的垂直距离为个单位。每垂

26、直偏离aopt高度一个单位，需要增加耗油量gphextra.因此,3.在地域i的实际飞行时间c c = 地域i的长度 / 地域i的实际飞行速度由于地域i的风速垂直反向线性变化，m单位处的风速为在20单位处的风速与40单位处的风速的平均数，因此地域i的等高风速为,而飞机的实际速度为VCRUISE与地域i等高风速的矢量和，因此 c = 地域i的长度 / (地域i的等高风速VCRUISE) 显而易见，,二规划飞行方案设为在确定地域i的飞行高度为j的情况下，飞机由地域l飞至地域i所耗费的最小总耗油量；为记忆表。飞机由地域i-l的高度到达地域i的j高度，可使总耗油量最小，即,问题是怎么才能计算

27、呢？首先我们必须明确，按最优性要求确定了飞机在地域i-1的飞行为高度为 ; 由于为一个定值，因此的值必须最小。不然的话，将它替换到表达式中，则可使表达式值变得更小，出现矛盾，这就说明问题的最优解包含了子问题的最优解，即该问题具备了最优子结构。,下面我们来分析一下最优表达式的构造：飞机由地域1起飞，因此data1,j=g1,0,j (20j40). 然后顺序计算， data2,20 data2,40,data3,20, ,data3,40,.datak,20, ,datak,40.,在计算datai,j时，我们无法预计飞机在地域i-1应以怎样的高度飞行方可使表达式的值最小。因此只能一

28、一假设飞机在地域i-1的高度为20,21,40,即分别求出从上述21个表达式中选出值最小的一个，即：将满足上式的飞行高度L存入记忆表data2i,j,由此可见，在求datai,j的过程中不断查阅子问题的解datai-1,20.datai-1,40。显然这个最优化问题包含了重叠子问题，采用动态程序设计方法是最合适不过的了，按照上述分析，我们可以直接写出动态规划的方程： 1ik 20j40 20l40,求解data表和data2表的算法十分简单： for j:=20 to 40 do data1,j g1,0,j; /*构造记忆表*/ for i:=2 to k do for j:=20 t

29、o 40 do for i:=20 to 40 do begin 计算datai,j=mindatai-1,l,gi,l,j; 将满足上式的l记入记忆表data2i,j; end:for,三.输出飞行计划有了记忆表data2我们便可以从地域k出发倒推飞机在各地域的飞行高度data3: for j:=20 to 40 do data3k 计算满足mindatak,j的j; for i:=k downto 2 do data3i-ldata2i,data3i; 最后输出飞行计划： for i=1 to k do 输出飞机在地域i的飞行高度data3i; 输出最小的总耗油量datak,data3k

30、; 每输入一条航线信息，我们便使用上述方法规划该航线的飞行方案，直至n条航线规划完毕,Uxuhul的表决,Uxuhul印第安人是世界上最古老的文明之一。在中美洲丛林中，大约从公元前3200年的黄金时代，Uxuhul文化繁荣了近千年。每年代表各阶层的高级牧师都会聚集在首都，投票表决重要事情。每次严格限定表决三个议案，每个议案只有是/否的回答。三个议案在议论表决中同时决定，遵循下列形式：,所有牧师聚集在一大房间，房间中央有一张桌子。在桌子上放了三片石块，一面黑，一面白。每个石块代表一个议案，黑表示“否”，白表示“是”。最初所有的石块都是黑色的面朝上，表示所有的议案都是否定的结果。根据年龄，从年轻的

31、到年长者，每位牧师通过翻动一块石块来表决，也就是改变某个议案的结果。不允许不表决。最年长的牧师做出选择后，石块朝上的颜色决定了三个议案的最终结果。,Uxuhul的政治相当复杂，大量代表不同利益的游说（和行贿），影响三个议案的八种结果。宗教规则强制每位牧师在投票表决前公开他们对三个议案的八种结果的表决倾向。由于彼此间都知道表决倾向，每位牧师都争取对自己最有利的结果，而且Uxuhul人具有高超的逻辑推理能力，对游戏规则又很了解，每个牧师都能找到最理想的方法！,最后，复杂刻板行政系统导致Uxuhul文明的崩溃。只留下他们的城市和庙宇，历史学家和考古学家试图通过研究每年议案的表决结果来弄清他们的历史。

32、不管怎么说，只有牧师们的表决倾向留下来了，没有实际的表决结果。那么你的任务就是揭示出表决结果。,输入,输入从一个整数n开始,1=n=100，代表表决的次数。后面跟着n个问题。每次表决由一个整数m开始，1=m=100，表示牧师的数目。后面m行，按照顺序代表每位投票者的表决倾向。对于每种结果（NNN,NNY, NYN, NYY, YNN, YNY, YYN, YYY, N表示否，Y表示是）,给一个18之间的数，越小的数字表示选择可能性越大。对8种结果的表决倾向按照前面列举的顺序的给出。,输出,对于每个问题，输出三个议案的表决结果。N表示否，Y表示是。,输入样例,2 4 8 7 6 5 4 3 2

33、1 8 6 3 1 2 4 5 7 8 3 6 5 1 2 7 4 1 2 3 4 5 6 7 8 1 1 2 3 4 5 6 7 8,输出样例,NYY NNY,解题思路,这个题似乎可以采用贪心来做。每一个牧师都从可能的结果中选择对自己最有利的结果，最后的结果似乎就是人人都满意的结果？仔细分析就发现这种思路不正确。假如有两个人来选择，选择倾向是： 2 1 7 4 5 8 3 6 3 8 6 4 5 1 2 7,如果按照贪心的思想去做，第一个人应该选择NNY,但第二个人肯定会选择成YNY，结果是第一个人最不满意的。如果第一个人选择NYN，表面上是他不满意的选择（排在第七位的结果），但第二个人会

34、选择YYN（这是他在这种情况下的最好选择，排在第二位）,而对于第一个人来说，YYN也是一个不错的结果。,所以，贪心的思路不行。在解决这个题之前，让我们先看看海盗的传说：,有5个海盗，多年的海上生活使他们积攒了100颗宝石。他们决定将宝石分掉之后就分手，洗手不干了。他们商量许久，最后决定：首先抽签，每个人抽得一个号码（1号到5号），然后1号海盗提出一个分配方案，所有海盗举手表决，如果过半数的海盗同意该分配方案，则按此方案分配，否则将1号海盗扔到大海。再由2号海盗提出他的分配方案，重复以上过程，直到找到分配方案止。海盗都是很聪明的，而且彼此知道别人的聪明，每个海盗都希望得到最多的宝石。如果你是1

35、号海盗，你会提出怎样的分配方案，使你获得最多的宝石且保住性命？,因为海盗很聪明，所以你能想到的别的也能想到。我们从简单情况出发：首先看4号海盗分配方案，只可能是0 100（少1颗5号可不会投票支持）所以3号海盗分配方案，99 1 0（首先5号一颗都不用给，因为只有100颗才能合他的胃口，4号一颗足矣，总比没有强）,2号海盗分配方案，97 0 2 1（首先3号一颗都不用给，因为只有100颗才能合他的胃口，4号两颗，5号一颗，要比3号分得多）所以1号海盗最佳分配方案，97 0 1 0 2（原因同上，1，3，5号海盗投票支持）,和海盗问题一样，要倒过来思考，我们以杨例中的第一组数据来说明牧师

36、是怎么思考的 4 8 7 6 5 4 3 2 1 8 6 3 1 2 4 5 7 8 3 6 5 1 2 7 4 1 2 3 4 5 6 7 8,首先最后投票的很简单，从可能出现的结果里找个最喜欢的。倒数第二怎么投？假设他面对的是NYY，他可以变为NNY，NYN，YYY，这其中他最喜欢的是NNY，但他就会选择NNY吗？不会！因为选择NNY，最后（通过最后牧师表决）的结果就是NNN，是他最不喜欢的，他的选择是YYY，因为最后的结果将是NYY，是可以得到的最好结果。从后往前，记录当前祭司面对每种情况（NNN, NNY, NYN, NYY, YNN, YNY, YYN, YYY）下选择能得到

37、的最好结果。,倒数第二个：8 3 6 5 1 2 7 4 倒数第一个：1 2 3 4 5 6 7 8,NNN,NNY, NYN, NYY, YNN, YNY, YYN, YYY,得到的状态序列将是 NNY NNN NNN NNY NNN NNY NYN NYY NNN NNY NNY NYY NNY NYY NYY NNY NNY NYY NYY NNY NYY NNY NNY NYY NYY NNY NNY NYY NNY NYY NYY NNY 这是一个系列的决策过程，所以可以采用动态规划的方法。,因为一号祭司首先面对NNN,所以最好也是最后结果将是NYY 具体算法就是用一个数组r记录每位

38、牧师面对八种情况，它能取得的最好结果。从后面往前计算，对每一种情况，可以选择的变化是三个，从这三个变化中找到最好的结果。重复这样的过程，一直到第一个人面对NNN能取得的最好结果就是全体牧师表决的结果。,char outcome84=“NNN“,“NNY“,“NYN“,“NYY“,“YNN“,“YNY“,“YYN“,“YYY“;/表决结果 int a1008; /存储表决倾向 int main（） int r8,t8,x3; /r,t纪录最佳的表决结果，采用滚动数组， scanf（“%d“, ,总结及回顾：,本次课主要讲解了如下内容：动态规划的要素；多段图问题；动态规划的求解步骤；导弹拦截问题； Flight Planning。首先证明该问题满足最有性；得到递推公式和边界条件；自底向上求解；自顶向下恢复最有决策。,课后作业,编程练习题：课后编写本次课程中的Flight Planning 的程序。作业2：Uxuhul的表决 poj3022,

展开阅读全文