P类NP问题和P问题NP类问题的定义和区别?

要了解什么是P问题NP问题首先要引入算法和时间复杂度的概念。

算法一般指的是一套用于解决问题的流程算法要保障结果的正确性和运行效率。

对于时间复杂度一般指的是运算步骤次数和数据量之间的关系。比如说对于一个算法如果数据量为n,那么如果它的运算步骤次数为2*N^2+2次我们取最高影响的那┅项为N^2。这项是整个算法增长速度最快一项于是我们把算法复杂度计成O(N^2)。

P问题指的是一些能够被多项式时间复杂度的算法准确解出嘚问题而NP问题是目前为止,尚未发现多项式时间复杂度内算法能够解决的问题NP问题目前最快也是指数级别的算法时间复杂度。

在当前我们有时会用近似算法快速解决NP问题。对于近似算法(有时用贪心法有时用放宽条件的线性规划),我们会得到接近最优解的可行解比如求一个最大值,我如果用的是0.9倍近似算法意味着我的算法产生的结果最小也是最优解的0.9倍。这样可以保障得到的结果足够好

如果P=NP被证明了,也就是说NP问题都能被多项式时间复杂度解决了那这将是人类历史的巨大变革。

在目前准确解决NP问题的技巧中你可以使用決策树算法,算法核心以及动态规划结合图的树分解等技巧然而,这些算法技巧还不足以把NP问题放在多项式时间复杂度下面解决

你对這个回答的评价是?

为了迎接我的期末考试认真的看了一下关于NP完全性理论这一章,奈何课本上说的我怎么都看不懂所以找了个博客认真研究了一下,同样贴出来分享给大家大牛就是夶牛,把问题说的很明白看完后受益匪浅。其中有一部分有我进行了一些增删修改如果想看原版,最后附有超链接大家可移步。

  还是先用几句话简单说明一下时间复杂度时间复杂度并不是表示一个程序解决问题需要花多少时间,而是当问题规模扩大后程序需偠的时间长度增长得有多快。也就是说对于高速处理数据的计算机来说,处理某一个特定数据的效率不能衡量一个程序的好坏而应该看当这个数据的规模变大到数百倍后,程序运行时间是否还是一样或者也跟着慢了数百倍,或者变慢了数万倍不管数据有多大,程序處理花的时间始终是那么多的我们就说这个程序很好,具有O(1)的时间复杂度也称常数级复杂度;数据规模变得有多大,花的时间也跟着變得有多长这个程序的时间复杂度就是O(n),比如找n个数中的最大值;而像冒泡排序、插入排序等数据扩大2倍,时间变慢4倍的属于O(n^2)的复雜度。还有一些穷举类的算法所需时间长度成几何阶数上涨,这就是O(a^n)的指数级复杂度甚至O(n!)的阶乘级复杂度。不会存在O(2*n^2)的复杂度因为湔面的那个“2”是系数,根本不会影响到整个程序的时间增长同样地,O (n^3+n^2)的复杂度也就是O(n^3)的复杂度因此,我们会说一个O(0.01*n^3)的程序的效率仳O(100*n^2)的效率低,尽管在n很小的时候前者优于后者,但后者时间随数据规模增长得慢最终O(n^3)的复杂度将远远超过O(n^2)。我们也说O(n^100)的复杂度小于O(1.01^n)嘚复杂度。

    容易看出前面的几类复杂度被分为两种级别,其中后者的复杂度无论如何都远远大于前者:一种是O(1),O(log(n)),O(n^a)等我们把它叫做多项式級的复杂度,因为它的规模n出现在底数的位置;另一种是O(a^n)和O(n!)型复杂度它是非多项式级的,其复杂度计算机往往不能承受当我们在解决┅个问题时,我们选择的算法通常都需要是多项式级的复杂度非多项式级的复杂度需要的时间太多,往往会超时除非是数据规模非常尛。

    自然地人们会想到一个问题:会不会所有的问题都可以找到复杂度为多项式级的算法呢?很遗憾答案是否定的。有些问题甚至根夲不可能找到一个正确的算法来这称之为“不可解问题”(Undecidable Decision Problem)。(停机问题)就是一个著名的不可解问题再比如,输出从1到n这n个数的全排列不管你用什么方法,你的复杂度都是阶乘级因为你总得用阶乘级的时间打印出结果来。还有Hamilton回路问题是这样的:给你一个图,问伱能否找到一条经过每个顶点一次且恰好一次(不遗漏也不重复)最后又走回来的路(满足这个条件的路径叫做Hamilton回路)这个问题现在还沒有找到多项式级的算法。事实上这个问题就是我们后面要说的NPC问题。

    下面引入P类问题的概念:如果一个问题可以找到一个能在多项式嘚时间里解决它的算法那么这个问题就属于P问题。P是英文单词多项式的第一个字母哪些问题是P类问题呢?ACM的题目大多都是P类问题

  接下来引入NP问题的概念。这个就有点难理解了或者说容易理解错误。在这里强调NP问题不是非P类问题。NP问题是指可以在多项式的时间裏验证一个解的问题NP问题的另一个定义是,可以在多项式的时间里猜出一个解的问题比方说,我RP很好在程序中需要枚举时,我可以┅猜一个准现在某人拿到了一个求最短路径的问题,问从起点到终点是否有一条小于100个单位长度的路线它根据数据画好了图,但怎么吔算不出来于是来问我:你看怎么选条路走得最少?我说我RP很好,肯定能随便给你指条很短的路出来然后我就胡乱画了几条线,说僦这条吧那人按我指的这条把权值加起来一看,嘿神了,路径长度98比100小。于是答案出来了存在比100小的路径。别人会问他这题怎么莋出来的他就可以说,因为我找到了一个比100 小的解在这个题中,找一个解很困难但验证一个解很容易。验证一个解只需要O(n)的时间复雜度也就是说我可以花O(n)的时间把我猜的路径的长度加出来。那么只要我RP好,猜得准我一定能在多项式的时间里解决这个问题。我猜箌的方案总是最优的不满足题意的方案也不会来骗我去选它。这就是NP问题当然有不是NP问题的问题,即你猜到了解但是没用因为你不能在多项式的时间里去验证它。下面我要举的例子是一个经典的例子它指出了一个目前还没有办法在多项式的时间里验证一个解的问题。很显然前面所说的Hamilton回路是NP问题,因为验证一条路是否恰好经过了每一个顶点非常容易但我要把问题换成这样:试问一个图中是否不存在Hamilton回路。这样问题就没法在多项式的时间里进行验证了因为除非你试过所有的路,否则你不敢断定它“没有Hamilton回路”    之所以要定义NP问題,是因为通常只有NP问题才可能找到多项式的算法我们不会指望一个连多项式地验证一个解都不行的问题存在一个解决它的多项式级的算法。相信读者很快明白信息学中的号称最困难的问题——“NP问题”,实际上是在探讨NP问题与P类问题的关系

  很显然,所有的P类问題都是NP问题也就是说,能多项式地解决一个问题必然能多项式地验证一个问题的解——既然正解都出来了,验证任意给定的解也只需偠比较一下就可以了关键是,人们想知道是否所有的NP问题都是P类问题。我们可以再用集合的观点来说明如果把所有P类问题归为一个集合P中,把所有 NP问题划进另一个集合NP中那么,显然有P属于NP现在,所有对NP问题的研究都集中在一个问题上即究竟是否有P=NP?通常所谓的“NP问题”其实就一句话:证明或推翻P=NP。
    NP问题一直都是信息学的巅峰巅峰,意即很引人注目但难以解决在信息学研究中,这是一个耗費了很多时间和精力也没有解决的终极问题好比物理学中的大统一和数学中的歌德巴赫猜想等。

    目前为止这个问题还“啃不动”但是,一个总的趋势、一个大方向是有的人们普遍认为,P=NP不成立也就是说,多数人相信存在至少一个不可能有多项式级复杂度的算法的NP問题。人们如此坚信P≠NP是有原因的就是在研究NP问题的过程中找出了一类非常特殊的NP问题叫做NP-完全问题,也即所谓的 NPC问题C是英文单词“唍全”的第一个字母。正是NPC问题的存在使人们相信P≠NP。下文将花大量篇幅介绍NPC问题你从中可以体会到NPC问题使P=NP变得多么不可思议。

    简单哋说一个问题A可以约化为问题B的含义即是,可以用问题B的解法解决问题A或者说,问题A可以“变成”问题B《算法导论》上举了这么一個例子。比如说现在有两个问题:求解一个一元一次方程和求解一个一元二次方程。那么我们说前者可以约化为后者,意即知道如何解一个一元二次方程那么一定能解出一元一次方程我们可以写出两个程序分别对应两个问题,那么我们能找到一个“规则”按照这个規则把解一元一次方程程序的输入数据变一下,用在解一元二次方程的程序上两个程序总能得到一样的结果。这个规则即是:两个方程嘚对应项系数不变一元二次方程的二次项系数为0。按照这个规则把前一个问题转换成后一个问题两个问题就等价了。同样地我们可鉯说,Hamilton回路可以约化为TSP问题(Travelling Problem旅行商问题):在Hamilton回路问题中,两点相连即这两点距离为0两点不直接相连则令其距离为1,于是问题转化为在TSP問题中是否存在一条长为0的路径。Hamilton回路存在当且仅当TSP问题中存在长为0的回路    “问题A可约化为问题B”有一个重要的直观意义:B的时间复雜度高于或者等于A的时间复杂度。也就是说问题A不比问题B难。这很容易理解既然问题A能用问题B来解决,倘若B的时间复杂度比A的时间复雜度还低了那A的算法就可以改进为B的算法,两者的时间复杂度还是相同正如解一元二次方程比解一元一次方程难,因为解决前者的方法可以用来解决后者    很显然,约化具有一项重要的性质:约化具有传递性如果问题A可约化为问题B,问题B可约化为问题C则问题A一定可約化为问题C。这个道理非常简单就不必阐述了。    现在再来说一下约化的标准概念就不难理解了:如果能找到这样一个变化法则对任意┅个程序A的输入,都能按这个法则变换成程序B的输入使两程序的输出相同,那么我们说问题A可约化为问题B。    当然我们所说的“可约囮”是指的可“多项式地”约化(Polynomial-time Reducible),即变换输入的方法是能在多项式的时间里完成的约化的过程只有用多项式的时间完成才有意义。

  恏了从约化的定义中我们看到,一个问题约化为另一个问题时间复杂度增加了,问题的应用范围也增大了通过对某些问题的不断约囮,我们能够不断寻找复杂度更高但应用范围更广的算法来代替复杂度虽然低,但只能用于很小的一类问题的算法再回想前面讲的P和NP問题,联想起约化的传递性自然地,我们会想问如果不断地约化上去,不断找到能“通吃”若干小NP问题的一个稍复杂的大NP问题那么朂后是否有可能找到一个时间复杂度最高,并且能“通吃”所有的 NP问题的这样一个超级NP问题答案居然是肯定的。也就是说存在这样一個NP问题,所有的NP问题都可以约化成它换句话说,只要解决了这个问题那么所有的NP问题都解决了。这种问题的存在难以置信并且更加鈈可思议的是,这种问题不只一个它有很多个,它是一类问题这一类问题就是传说中的NPC 问题,也就是NP-完全问题NPC问题的出现使整个NP问題的研究得到了飞跃式的发展。我们有理由相信NPC问题是最复杂的问题。

    NPC问题的定义非常简单同时满足下面两个条件的问题就是NPC问题。艏先它得是一个NP问题;然后,所有的NP问题都可以约化到它证明一个问题是 NPC问题也很简单。先证明它至少是一个NP问题再证明其中一个巳知的NPC问题能约化到它(由约化的传递性,则NPC问题定义的第二条也得以满足;至于第一个NPC问题是怎么来的下文将介绍),这样就可以说咜是NPC问题了
    既然所有的NP问题都能约化成NPC问题,那么只要任意一个NPC问题找到了一个多项式的算法那么所有的NP问题都能用这个算法解决了,NP也就等于P 了因此,给NPC找一个多项式算法太不可思议了因此,前文才说“正是NPC问题的存在,使人们相信P≠NP”我们可以就此直观地悝解,NPC问题目前没有多项式的有效算法只能用指数级甚至阶乘级复杂度的搜索。

NPC问题的范围广)NP-Hard问题同样难以找到多项式的算法,但咜不列入我们的研究范围因为它不一定是NP问题。即使NPC问题发现了多项式级的算法NP-Hard问题有可能仍然无法得到多项式级的算法。事实上甴于NP-Hard放宽了限定条件,它将有可能比所有的NPC问题的时间复杂度更高从而更难以解决

    不要以为NPC问题是一纸空谈。NPC问题是存在的确实有这麼一个非常具体的问题属于NPC问题。下文即将介绍它

    下文即将介绍逻辑电路问题。这是第一个NPC问题其它的NPC问题都是由这个问题约化而来嘚。因此逻辑电路问题是NPC类问题的“鼻祖”。    逻辑电路问题是指的这样一个问题:给定一个逻辑电路问是否存在一种输入使输出为True。    什么叫做逻辑电路呢一个逻辑电路由若干个输入,一个输出若干“逻辑门”和密密麻麻的线组成。看下面一例不需要解释你马上就奣白了。 

    上面这个逻辑电路中无论输入是什么,输出都是False我们就说,这个逻辑电路不存在使输出为True的一组输入    回到上文,给定一个邏辑电路问是否存在一种输入使输出为True,这即逻辑电路问题    逻辑电路问题属于NPC问题。这是有严格证明的它显然属于NP问题,并且可以矗接证明所有的NP问题都可以约化到它(不要以为NP问题有无穷多个将给证明造成不可逾越的困难)证明过程相当复杂,其大概意思是说任意一个NP问题的输入和输出都可以转换成逻辑电路的输入和输出(想想计算机内部也不过是一些 0和1的运算)因此对于一个NP问题来说,问题轉化为了求出满足结果为True的一个输入(即一个可行解)

    有了第一个NPC问题后,一大堆NPC问题就出现了因为再证明一个新的NPC问题只需要将一個已知的NPC问题约化到它就行了。后来Hamilton 回路成了NPC问题,TSP问题也成了NPC问题现在被证明是NPC问题的有很多,任何一个找到了多项式算法的话所囿的NP问题都可以完美解决了因此说,正是因为NPC问题的存在P=NP变得难以置信。P=NP问题还有许多有趣的东西有待大家自己进一步的挖掘。攀登这个信息学的巅峰是我们这一代的终极目标现在我们需要做的,至少是不要把概念弄混淆了

那传说中的P、NP以及NPC问题

     在讲这几個问题之前有几个东西是必须要说的,包括时间复杂度、空间复杂度、图灵机什么的那么我们就慢慢来一一说来。

       图灵机:图灵机其實就是一个计算模型是由图灵提出来的。图灵机号称可以模拟实际计算机的所有计算行为计算能力还超过现有的计算机。但是还是有圖灵机无法做到的事情就好像计算机并不能处理所有的事情一样。

       3)有一套控制规则根据当前机器所处的状态以及当前读写头所指的格子符号来确定下一步的动作,另机器进入一个新的状态

      在图灵机的计算过程中,当前状态、当前带内容和读写头当前位置组合一起称為图灵机的格局包括起始格局、接受格局、拒绝格局。

      图灵机读取纸袋上的内容结合读写头的当前状态,根据一组控制规则决定下一步的动作可以认为这是一台理想的,能够处理所有的“人类计算”

       我们可以想象,一个问题如果在理论上是可解的但是计算它所需偠的时间和空间的资源是我们无法承受的,那么这个问题对我们来说就是没有用的当然这里说明一个问题是否理论上可解,用到图灵机什么的一箩筐东西这里就不说明这些问题。

 时间复杂度: 对于一个算法的时间复杂度一般采用大O表示这里大O我就具体说明了,就是说奣一个算法的时间复杂度的函数O(t(n))运行时间是多项式时间的算法随着问题规模的不断上升,时间变化不大但是如果一个算法的时间是指数形式的话,就不可理喻了典型的指数时间算法源于通过搜索解空间来求解问题,这称为蛮力搜索当然很多算法可以通过一些技巧避免蛮力搜索,但是还是有一些问题我们是无能为力的,至今没有找到在多项式时间求解该问题的算法

 简单的认为,P问题就是可以在哆项式时间被图灵机判定的语言类这里又涉及到图灵机,那么我们可以简单的认为如果一个算法可以在多项式时间内求解,那么就可鉯认为它是P类问题这样你就会感觉好多算法都是P类问题,对!没错!如何证明一个问题是否是P类问题呢只要它满足以下两个条(证明咜在多项式时间内完成)

      2)每一步都要保证它可以由合理的确定模型在多项式时间内完成,其实就是每一步的求解过程也是多项式时间

      这樣步奏是多项式时间的而每一步也是多项式时间,整合起来整个算法还是多项式时间的

   分析上面算法,可以得到步奏1和4只执行1步步驟3最多执行m次,所以用到的步骤数是m+1+1每一步都可以在合理的多项式时间内完成,所有PATH是P类问题

 NP问题指的是,这个算法可以在多项式时間内可验证什么意思呢?我们知道对于P类问题可以在多项式时间内求解出来,但是NP问题不行可以这样理解,NP虽然不能在多项式时间內被求解但是如果给出这个问题的某个解,那么我们可以在多项式时间内验证这个解是不是这个问题的解听起来好像有点那这有什么鼡的感觉?比如求汉密尔顿路径问题(HAMPATH)我们只能在指数时间内求出这个解,但是这时候我们假设我们可以先随机猜测出一条路径序列絀来那么我们就可在多项式时间内验证这个解是不是对的。常常也称为非确定型多项式时间

简单的的区分P和NP问题:

     对于P问题,我们可鉯有个算法能够在多项式时间内求得解但是对于NP问题,就不可以了求解某个问题可能需要指数的时间。NP问题也可以认为我们可以在哆项式时间内验证一个解,比如说我可以随机猜测一个解如果我可以在多项式时间内验证说明这个解是不是问题的解,那么这个问题就昰NP问题

     规约:当问题A规约到B问题时,B的有效解就可以用于求解问题A了

    NPC指定是所有的NP问题都可以多项式时间规约到某一类问题,那么这某一类问题就是所谓的NPC问题

我要回帖

更多关于 NP问题和P问题 的文章

 

随机推荐