C语言算法之二分覆盖

添加时间：2013-12-7

相关阅读: C语言

副标题#e#

　　二分图是一个无向图，它的n 个顶点可二分为集合A和集合B，且同一集合中的任意两个顶点在图中无边相连（即任何一条边都是一个顶点在集合A中，另一个在集合B中）。当且仅当B中的每个顶点至少与A中一个顶点相连时，A的一个子集A\' 覆盖集合B（或简单地说，A\' 是一个覆盖）。覆盖A\' 的大小即为A\' 中的顶点数目。当且仅当A\' 是覆盖B的子集中最小的时，A\' 为最小覆盖。
　
　　例1-10 考察如图1 - 6所示的具有1 7个顶点的二分图，A={1， 2， 3， 16， 17}和B={4， 5， 6， 7， 8， 9，10， 11， 12， 13， 14， 15}，子集A\' = { 1 ， 1 6 ， 1 7 }是B的最小覆盖。在二分图中寻找最小覆盖的问题为二分覆盖（ b i p a r t i t e - c o v e r）问题。在例1 2 - 3中说明了最小覆盖是很有用的，因为它能解决“在会议中使用最少的翻译人员进行翻译”这一类的问题。
　
　　二分覆盖问题类似于集合覆盖（ s e t - c o v e r）问题。在集合覆盖问题中给出了k 个集合S= {S1 ， S2 ，。， Sk }，每个集合Si 中的元素均是全集U中的成员。当且仅当èi S\'Si =U时，S的子集S\' 覆盖U，S \'中的集合数目即为覆盖的大小。当且仅当没有能覆盖U的更小的集合时，称S\' 为最小覆盖。可以将集合覆盖问题转化为二分覆盖问题（反之亦然），即用A的顶点来表示S1 ， .， Sk ，B中的顶点代表U中的元素。当且仅当S的相应集合中包含U中的对应元素时，在A与B的顶点之间存在一条边。
　
　　例1 - 11 令S= {S1，。 . .，S5 }， U= { 4，5，。 . .，15}， S1 = { 4，6，7，8，9，1 3 }，S2 = { 4，5，6，8 }，S3 = { 8，1 0，1 2，1 4，1 5 }，S4 = { 5，6，8，1 2，1 4，1 5 }，S5 = { 4，9，1 0，11 }.S \' = {S1，S4，S5 }是一个大小为3的覆盖，没有更小的覆盖， S\' 即为最小覆盖。这个集合覆盖问题可映射为图1-6的二分图，即用顶点1，2，3，1 6和1 7分别表示集合S1，S2，S3，S4 和S5，顶点j 表示集合中的元素j，4≤j≤1 5。
　
　　集合覆盖问题为N P-复杂问题。由于集合覆盖与二分覆盖是同一类问题，二分覆盖问题也是N P-复杂问题。因此可能无法找到一个快速的算法来解决它，但是可以利用贪婪算法寻找一种快速启发式方法。一种可能是分步建立覆盖A\' ，每一步选择A中的一个顶点加入覆盖。顶点的选择利用贪婪准则：从A中选取能覆盖B中还未被覆盖的元素数目最多的顶点。
　
　　例1-12 考察图1 - 6所示的二分图，初始化A\' = 且B中没有顶点被覆盖，顶点1和1 6均能覆盖B中的六个顶点，顶点3覆盖五个，顶点2和1 7分别覆盖四个。因此，在第一步往A\' 中加入顶点1或1 6，若加入顶点1 6，则它覆盖的顶点为{ 5 ， 6 ， 8 ， 1 2 ， 1 4 ， 1 5 }，未覆盖的顶点为{ 4 ， 7 ， 9 ， 1 0 ， 11 ， 1 3 }.顶点1能覆盖其中四个顶点（ { 4 ， 7 ， 9 ， 1 3 }），顶点2 覆盖一个（ { 4 } ），顶点3覆盖一个（{ 1 0 }），顶点1 6覆盖零个，顶点1 7覆盖四个{ 4 ， 9 ， 1 0 ， 11 }。下一步可选择1或1 7加入A\' .若选择顶点1，则顶点{ 1 0 ， 11} 仍然未被覆盖，此时顶点1，2，1 6不覆盖其中任意一个，顶点3覆盖一个，顶点1 7覆盖两个，因此选择顶点1 7，至此所有顶点已被覆盖，得A\' = { 1 6 ， 1 ， 1 7 }。
　
　　图1 - 7给出了贪婪覆盖启发式方法的伪代码，可以证明：

1）当且仅当初始的二分图没有覆盖时，算法找不到覆盖；

2）启发式方法可能找不到二分图的最小覆盖。
　
　　数据结构的选取及复杂性分析
　
　　为实现图13 - 7的算法，需要选择A\' 的描述方法及考虑如何记录A中节点所能覆盖的B中未覆盖节点的数目。由于对集合A\' 仅使用加法运算，则可用一维整型数组C来描述A \'，用m 来记录A\' 中元素个数。将A\' 中的成员记录在C[ 0 ：m-1] 中。对于A中顶点i，令N e wi 为i 所能覆盖的B中未覆盖的顶点数目。逐步选择N e wi 值最大的顶点。由于一些原来未被覆盖的顶点现在被覆盖了，因此还要修改各N e wi 值。在这种更新中，检查B中最近一次被V覆盖的顶点，令j 为这样的一个顶点，则A中所有覆盖j 的顶点的N e wi 值均减1。

#p#副标题#e#

　
　　例1-13 考察图1 - 6，初始时（N e w1 ， N e w2 ， N e w3 ， N e w16 ， N e w17 ） = （ 6 ， 4 ， 5 ， 6 ， 4 ）。假设在例1 - 1 2中，第一步选择顶点1 6，为更新N e wi 的值检查B中所有最近被覆盖的顶点，这些顶点为5 ， 6 ， 8 ， 1 2 ， 1 4和1 5.当检查顶点5时，将顶点2和1 6的N e wi 值分别减1，因为顶点5不再是被顶点2和1 6覆盖的未覆盖节点；当检查顶点6时，顶点1 ， 2 ，和1 6的相应值分别减1；同样，检查顶点8时，1，2，3和1 6的值分别减1；当检查完所有最近被覆盖的顶点，得到的N e wi 值为（4，1，0，4）。下一步选择顶点1，最新被覆盖的顶点为4，7，9和1 3；检查顶点4时，N e w1 ， N e w2，和N e w1 7 的值减1；检查顶点7时，N e w1 的值减1，因为顶点1是覆盖7的唯一顶点。
　
　　为了实现顶点选取的过程，需要知道N e wi 的值及已被覆盖的顶点。可利用一个二维数组来达到这个目的，N e w是一个整型数组，New[i] 即等于N e wi，且c o v为一个布尔数组。若顶点i未被覆盖则c o v [ i ]等于f a l s e，否则c o v [ i ]为t r u e.现将图1 - 7的伪代码进行细化得到图1 - 8。
　
　　m=0； //当前覆盖的大小
　
　　对于A中的所有i，New[i]=Degree[i]
　
　　对于B中的所有i，C o v [ i ] = f a l s e
　
　　while （对于A中的某些i，New[i]>0） {
　
　　设v是具有最大的N e w [ i ]的顶点；
　
　　C [ m + + ] = v ；
　
　　for （所有邻接于v的顶点j） {
　
　　if （！Cov[j]） {
　
　　Cov[j]= true；
　
　　对于所有邻接于j的顶点，使其N e w [ k ]减1
　
　　} } }
　
　　if （有些顶点未被覆盖）失败
　
　　else 找到一个覆盖
　
　　图1-8 图1-7的细化
　
　　更新N e w的时间为O （e），其中e 为二分图中边的数目。若使用邻接矩阵，则需花（n2 ）的时间来寻找图中的边，若用邻接链表，则需（n+e）的时间。实际更新时间根据描述方法的不同为O （n2 ）或O （n+e）。逐步选择顶点所需时间为（S i z e O f A），其中S i z e O f A=| A |.因为A的所有顶点都有可能被选择，因此所需步骤数为O （ S i z e O f A ），覆盖算法总的复杂性为O （ S i z e O f A 2+n2） = O （ n2）或O （S i z e Of A2+n + e）。