谷歌最近谷歌围棋人工智能能围棋是穷举还是别的算法

如何看待谷歌人工智能 AI 击败欧洲围棋冠军?
【东辰斯嘉丽的回答(950票)】:
他们确实做得很好,能让4子胜Zen和CrazyStone,把职业二段打成五比零,实力不容质疑。就期待着今年三月他们和李世石的比赛了。
从算法上来说,这篇文章并没有太多新意,主要是通过大量的训练数据,包括以往的棋谱和自我对局,把性能堆出来。他们训练了一个走子的神经网络(这个和我们的办法是一样的,但我们的文章主要在这上面作了改进),又训练了一个可以评估局面的网络(这个我们还没有),然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局(self-play)的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15分钟一局需要多久才能下完(大约是570年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的default policy也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据+深度学习的优势,而几乎完全没有用到的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。
其实这篇文章在去年11月份就已经投稿,但是因为《自然》杂志严格的审查制度,现在才出来。我们在11月的时候还只有3d的水平,蒙特卡罗树搜索还有各种问题,12月初的时候已经听到了谣言,当时我惊得话都说不出来了,然而就算这样,还是决定一点一点做,抓紧圣诞和新年的时间,把性能提高到5d的水平。我们还差一点拿了一月KGS锦标赛的冠军(Zen和DolBaram都参加了),可惜最后因为程序错误而超时,输了一局赢棋给Zen,得了第三名。谷歌的文章有20个作者,明显是下了血本,前两位都是围棋界的大牛,一作David Silver是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作Aja Huang以前写过多年围棋软件,自己又是AGA 6D的水平。相比之下我们只有两个人(
),只做了半年,中间还要穿插VQA等其他项目,而且都没有做过围棋的经验,想想有些差距也是不冤了。
现在回想起来,要是他们决定去年10月份战胜了樊麾后马上公开,或者我们再拖一会儿,决定不投ICLR而等到今年的ICML,那我们就被灭得连渣都不剩了(笑)。这回虎口拔牙,能从中拿到一些贡献,为公司增加一些影响力,算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽 :)
Facebook高层也给了我们很大的支持,昨天我们组的老大Yann LeCun发了文章介绍我们的工作,扎克伯格还特地发了一篇文章点到了我的名字,赞扬我们的努力,对此我非常感动。
最后,我们的arXiv更新了[文章见],欢迎大家有空看看。谢谢~
【袁岚峰的回答(478票)】:
“珍珠港遭到空袭!这不是演习!这不是演习!这不是演习!”
——日凌晨
从昨晚开始,一条声称某AI在19路棋盘上分先战胜樊麾二段,并且论文已登上Nature的消息刷爆了朋友圈。
一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余7段还查验到其论文尚未被Nature审核通过。
然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。
围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。
终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱:
最后的智力骄傲即将崩塌(虽是真消息,但稍有标题党之嫌)
至此,看到棋谱的所有人几乎都相信了:AlphaGo,实现了里程碑式的一步。
首先,在客观上要肯定AlphaGo实现的水平进步。
从昨晚开始,一条声称某AI在19路棋盘上分先战胜范麾二段,并且论文已登上Nature的消息刷爆了朋友圈。
一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余7段还查验到其论文尚未被Nature审核通过。
然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。
围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。
终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱:
以往最强的围棋AI,大致是CrazyStone、Zen和银星围棋这几个。
而AlphaGo在让以上几个程序(无银星围棋)4子的情况下,取得了80%左右的胜率。我们据此基本可以判断,人工智能将自己的水平上限一下子提高了5个子。
樊麾二段,虽然以欧洲冠军闻名于世,但其实圈内谁都知道他是一名中国旅欧教学的职业棋手。
虽然远离东亚职业一线,但樊老师的水平仍然是不容置疑的,他依然有着职业的水平(虽然是较弱的职业),一般的业6仍然是比他不上的。
AlphaGo在正式比赛中对樊老师5:0(棋谱已可见),据说加上非正式比赛的总分为8:2(已确认),再加上棋谱里AlphaGo显示出的惊人的表现,我们可以认为,人工智能在围棋上的水平已经迈入了职业的大门。
(最新:据多位顶尖棋手对棋谱的鉴定,认为AlphaGo的水平应该在业余强6段到弱职业之间,离人类顶尖大概还有一先到两先的差距)
(对于西方围棋包括樊老师的相关介绍,可见)
说的更明白点,之前的AI在蒙特卡洛算法的帮助下虽然取得了革命性的进步,战胜了绝大多数的人类,但人类中能战胜那些AI的人数可能仍然在近百万的级别。
而自今日(其实已经是三个月前了)的AlphaGo起,能在围棋盘上战胜AI的人类人数可能已经不到千人了。
老师的说法,这个消息在相关研究圈内应该早就不是新闻了。
甚至回想一下昨天扎克伯格在facebook上突然发声支持自己的研究团队,也因为是知道了google团队的成果即将在一日内公示,所以想要抢占一个在舆论的位置。
(田老师参与的facebook的研究团队,是google现在最大的竞争对手,田老师他们使用的方法应该不太一样,虽然他们暂时落后,但我同样也很期待他们的下一步进展)
总之,这真的不是演习。
接下来谈点个人对人工智能的粗浅理解。
近些年来,尽管在蒙特卡洛算法的帮助下,AI实现了革命性的进步,达到了能战胜大部分人类的水平(中等业余5段),但随着摩尔定律的走向终点,计算机硬件的发展速度在旧有的道路上暂时无法按以前的速度爆炸发展下去,大家都认为仅凭蒙特卡洛算法是无法帮助AI战胜人类的。
依据个人的理解,我曾在中将围棋的思维过程分解为四步的演进:常识→棋感→计算→判断。
大约一年前,我曾和李喆七段就此问题进行过简单讨论,当时我认为蒙特卡洛算法的成功主要在于为人工智能建立了“棋感”,而以往的人工智能只能在“常识”和“计算”具有天然优势。
在蒙特卡洛算法之前,虽然计算机凭借强大的计算力可以积累大量“常识”,但由于“棋感”的缺失,人工智能无法对计算方向进行有效的筛选,最终就不免沦于蛮力搜索。
而蛮力搜索虽然可以在一定程度上实现高水平的“计算”,甚至很多其他棋类都在这一环节上被人工智能打败,而由于围棋的过度复杂和摩尔定律结束对计算机发展前景的限制,走到这一步仍然无法让人工智能战胜人类。
(注:上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路,来自谷歌deepmind官网(注:上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路,来自谷歌deepmind官网)
而蒙特卡洛算法出现后,凭借大量储备的棋局,通过胜负概率来判断下一步着点以作为计算方向,极大的提高的计算的效率,所以AI的水平才实现了革命性的进步。
而这次的AlphaGo,使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。
依据已经能看到的Nature上的论文
,研究者们在AlphaGo中加入了两个深度神经网络,以value networks来评估大量的选点,而以policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。
(注:上图为AlphaGo使用的神经网络结构示意图,来自原论文)
在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。
在蒙特卡洛算法之后,我看到了新的天地。
这种结合以及新式的思路,让人感到前景无限。
最后谈一谈,我认为我们应该保有的态度。
这里,我首先想引用李喆七段在今天早上说的话:“我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”
从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”,毕竟大家在没有看到板上的钉子之前,从情感上都是不愿意相信的。
直到另外两位一线棋手告诉他,已经可以看到棋谱了......
面对这个事件,接下来将会有很多的爆炸性新闻报道,以及各种各样姿势的讨论。
我们要知道:
一.人工智能的确实现了很大的进步。
这次的进步可能是革命性的,这次新闻宣称的AI取得的成绩并不是“标题党”。
二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题党”)。
但朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好AI下一步发展的情况下,来了一个突然袭击(谷歌从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。
三.人工智能战胜人类的时点,可能比很多人想象的要来的更早了。
不是之前设想的生物计算机或者量子计算机出现后,甚至都不是新材料取代硅晶片之后,在这个时代就有可能出现了。也许是五十年后,也许是二十年后,甚至可能是十年后。
从小学时开始,我就痴迷于许峰雄教授对于计算机国际象棋项目的研究和成就,一直追踪到97年“深蓝”战胜卡斯帕罗夫。(就是在那之后不久,我才从国际象棋转投了围棋......)
(注:上图为第一个打败人类的计算机国际象棋程序“深蓝”之父——许峰雄)
从中学时代到大学时代,我一直追寻着许教授的动态和他撰写的各种文章、书籍,他写的《“深蓝”揭秘》()被我翻的都烂了,我甚至在中学时代一直想以此作为未来的求学从研的方向。
许教授离开IBM、前往亚研院并声称准备致力于作为最终问题的计算机围棋难题之后,我仍然一年年心心念念的期待着许教授的后续动作。
然而十多年过去,等来的却是无数的后来者。
这也挺好,人类就是不缺后来者。
看许教授对当年研究过程的讲述,最大的感受就是:
其实并不是计算机打败了人类,而是人类打败了人类。
大量的计算机专家,配合大量的国际象棋职业棋手,在算法上不断革新,再搭乘上摩尔定律的东风,不断的失败再重来、输了再修正,最终才解决了计算机国际象棋难题。
卡斯帕罗夫,是败给了数以百计的人类专家的智慧的合力。
围棋也会是一样,计算机——今天说人工智能更合适,战胜人类的那一天迟早会来,大部分人都从来不否认这一点。
争论,始终在于这一天的早晚。
而棋手和围棋从业者们,出于可以理解的感情,总是希望并认为这一天不会来的那么快,但他们绝对不会拒绝甚至仇视这种进步。
其实我看到的很多人,都一直期待并赞许着人工智能的进步,甚至很多职业高手还亲身参与和帮助着计算机围棋项目的研究。
我们努力打造着一个“大玩具”,一个能战胜自己的“大玩具”。
所以最终的成功,是我们人类自己的成功,而不应该对计算机感到恐惧。
同时,这“大玩具”也不只是好玩而已,人工智能对于现代乃至未来科技的发展有着极大的意义,这意义甚至会超出当年原子弹研究的后续红利。
所以不要害怕,不要烦恼,让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。
我之前一直认为在我有生之年是看不到这一天的,然而现在看来,我错了。
我一点也不失望,反而感到很兴奋,很激动,并且期待着以google和facebook为首的前沿研究团队们的进一步的表现。
最后的最后,恭喜谷歌,恭喜围棋,恭喜人类。
【SCVTheDefect的回答(9票)】:
早起来先被朋友圈给刷屏了一下,然后上网又被各大媒体又洗了遍脑,最后上知乎又收到各式各样的邀请。看来谷歌真是弄了个大新闻。
先看李喆的评价
Google的围棋AI已具有职业水准。从棋谱初步判断是顶尖棋手让先-让先倒贴的水平,离战胜人类还有一小段距离。但这是三个月前的棋谱...以Google机器学习堆数据的速度,今年三月对决李世石相当值得期待。
从李喆的判断来看,这基本就是国内业余顶尖的实力,这样他战胜樊麾也就是很正常的事,虽然樊麾曾是职业二段,但那是上世纪的事,现在混迹欧洲多年,水平肯定有所退步,而且现在的业余顶尖也不比职业低段差。从以往的欧洲围棋水平判断,欧洲顶尖其实也就是国内普通业6的水平,应该与职业顶尖有二子以上的差距。
所以,alphaGo现在只证明了一件事,它至少已经达到业余顶尖的水平。是否能否达到职业顶尖甚至超越,要看三月和李世石的比赛。
不过我看了几盘alphoGo和樊麾的对局,有点忧虑,抛去棋力的水平不谈,计算机最强大的地方是基本没什么勺子(失误),这是计算机恐怖的地方,而人下棋,哪怕再强大的棋手,一盘棋总会出一些勺子,看上次柯洁与李世石的梦百合五番决赛,基本都是错进错出,有些低级失误他们不知道吗?事后当然看的出,但是人脑毕竟不是计算机,总会产生各种各样的错觉,一个错觉出来,一个失误就产生了。计算机可能就没这方面的问题,所以,在稳定性上,计算机可能会比人强很多。所以,我很担心,和李世石的比赛会不会是前半盘李世石大优,后半盘计算机靠捡勺子获胜?
3月马上就要到来,我对这一战很期待,看李世石是成为维护人类尊严的英雄,还是成为计算机战胜人类的一块踏脚石。
另外,alphaGo对我个人也是有影响的,以前还是能很愉快的玩耍围棋的,就算对手用AI我也不怕,但以后未必了,可以想象未来有一天我在网上碰到AI,我也只能默默的打开我的alphaGo来比赛谁的电脑配置更强了。╮(╯_╰)╭
【王不泽的回答(3票)】:
吴清源:“200年后我要在宇宙下棋。" ()
他终于来了...
【大荃的回答(72票)】:
一大早起来被各种新闻刷屏了,看来大家对围棋很感兴趣。
Nature那篇文章的可读性很强。解棋类游戏面临两个问题:搜索深度太深、广度太广。太深,通过构造适当的估值函数来剪枝;太广,通过构造适当的policy来聚焦。
我不清楚之前的围棋AI是怎么实现上面两点。Google说,我们来试试神经网络吧!于是通过职业棋谱学了一个policy,精确度55%;同时学了一个局部常型的policy,为了之后自己和自己下用的,精确度24%。这样我们的程序就可以模仿着高手们的谱着下棋,而不是胡乱落子了。
紧接着是构造评估函数。Google说,我们来试试神经网络吧!(你能不能换一个台词……)就是让计算机根据policy不断地和自己下棋,然后学习判断局面。
Alpha Go碾压其他AI是没有问题的,和职业二段Fan Hui五番棋证明Alpha Go已经进入职业水平。不过BBC肯定是有些标题党了。应该还是有不少人(包括我)对Alpha Go的能力有所怀疑,没有关系,我们等等三月份看僵尸流小李怎么虐Alpha Go吧(笑)。
值得一提的是Alpha Go对战Fan Hui所思考的情况比深蓝对阵卡斯帕罗夫少得多得多(thousands of times fewer positions),因为Alpha Go凭“直觉”挑的待选步更好,对形势的判断能力更高。从这一点说,非常像人类。此外深蓝的估值函数是手写的,而Alpha Go的估值函数是他自己学出来的。
背景介绍完毕,下面带点私货。大题要小作,小题要大作。
就棋谈棋没什么意思,我来谈谈这背后反应出来的人工智能的问题,也是我对于近五十年人工智能发展的批判:我们经常在没有理解问题的状态下解决了问题,更糟糕的是我们满足于这个现状。
我没有要贬低谁,没有丝毫这个意思。从工程的角度说,发现问题并解决问题,就是我们的目标。Google是公司,运用新技术解决问题,就是他们的目标。但是我们做科学研究的,眼界还要再高一些。
人工智能发展了五十年,如今到了收获的时候。我们在图像识别,NLP等等领域做到了50年前做不到甚至想不到的事情。但是回望过去,半个世纪前,我们提出人工智能的那个最原始的动机是什么?是理解并提高人类智能(to understand and improve human intelligence)。半个世纪过去了,我们在这个方向上,这个Science而不是Engineering的维度上,真正前进了多少呢?
Tom M. Mitchell在2006年的The Discipline of Machine Learning一文中提出了一些机器学习从长远角度看的学术问题,第二个问题就是:Can machine learning theories and algorithms help explain human learning?我同意,Google开发的Alpha Go程序是一个里程碑,标志着NN技术越发的成熟;击败职业棋手的五盘棋背后蕴含着的其实是15篇、25篇学术论文,发现、聚焦并攻克了一系列学术技术难题。这是我们的成就,也是我们人类整体的骄傲。但另一方面,不要忘记了我们的初衷,我们要理解人类智能,我们要改进人类智能。在我们拿着机器学习这把利刃横扫天下的时候,不要忘记了最初铸剑的那份冲动和动机。
【刘洪金的回答(4票)】:
AI解围棋,一个难题是如何对当前局势做评估(这就是所谓的大局观),导致搜索的时候剪枝很难,不清楚Google 如何用 reinforcement learning 解决这个问题
搞清这项工作背后的机制,以及如何推广到更广泛的AI问题比这项工作本身重要
PS: 能把钉子砸进去的锤子就是好锤子
【浪客的回答(3票)】:
由周润发、刘德华、周星驰主演的《赌神2020》将片中的赌博游戏(老千游戏)从纸牌更换为围棋。
据悉,由于剧情要求,主演周润发将在本次出演出佩戴关键道具——眼镜。
眼镜赞助商为谷歌。
【姜文浩的回答(34票)】:
怎么这么多人唱衰的,我就来正面说说看。它是基于统计学习没错,但它强并不仅仅在于记住了全部棋谱,因为围棋的变化太多,棋谱再多也只覆盖了极少量的状态。关键是怎么generalize.
deepmind这次用了deep reinforcement learning ,就可以在自己创造的新实例上学习,就是自己和自己下棋,摸索出怎么下的更好。而且他还结合了蒙特卡洛树搜索,产生的就是一个有职业水平的大局观,而局部计算无比精确的怪物,下赢人类顶级职业棋手不是什么难事。
深度学习是最近几十年人工智能的最大进展,用这些里程碑去衡量深度学习已经达到的power,怎么看都是很有意义的事。
【DavidLin的回答(104票)】:
Facebook:我们现在研究的AI将有希望打败顶尖高手。
十小时后。
Google:Done!
(大家当段子看就好,切勿上纲上线,我本人也是很崇拜田渊栋老师的。)
【方程的回答(5票)】:
我把这5局都贴出来大家看看好了。总体感觉有大局观的AI真是太可怕了,期待和李世石的真正对决!!!
【谢海阳的回答(65票)】:
对职业水平有疑虑的,可以歇歇了。对职业水平有疑虑的,可以歇歇了。
其实关键问题是这次直接跨越了无数道天堑,一步登天了。之前最强AI连我这种一般般的业余5段都完全赢不了,这次直接战胜一般职业棋手,相当于从全球前10000名直接跨越到前100名。你们说,100名进到第1,会更难?
3月李世石胜败不那么重要,这只不过是拉开了围棋被征服的大幕。
也许受到最大的冲击的是围棋教育市场,没有了智力光环,会有多少家长离开?市场萎缩后,这些年那么多冲段少年何去何从?
我和另一位棋友,2015年11月的时候才讨论过围棋AI战胜人类后围棋市场的崩塌,只是当时我们以为至少还要5年。
【蒋童的回答(2票)】:
想起了大刘曾经的一篇文章《诗云》
“智慧生命的精华和本质,真的是技术所无法触及的吗?”大牙仰头对着诗云大声问,经历过这一切,它变得越来越哲学了。
“既然诗云中包含了所有可能的诗,那其中自然有一部分诗,是描写我们全部的过去和所有可能与不可能的未来的,伊依虫子肯定能找到一首诗,描述他在三十年前的一天晚上剪指甲时的感受,或十二年后的一顿午餐的菜谱;大牙使者也可以找到一首诗,描述它在腿上的某一块鳞片在五年后的颜色……”
【LeeAung的回答(3票)】:
未来会不会有不懂围棋的人戴着谷歌眼镜参加围棋世界大赛大杀四方呢
&&&&&本文固定链接:
【上一篇】
【下一篇】
您可能还会对这些文章感兴趣!
最新日志热评日志随机日志谷歌人工智能首次破解围棋比赛:完胜欧洲冠军
责任编辑:
新浪科技讯 1月28日上午消息,谷歌今日宣布在人工智能领域的重要进展:开发出一款能够在围棋中击败职业选手的程序&&AlphaGo,后者能够通过机器学习的方式掌握比赛技巧。计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等棋类上,计算机都先后完成了对人类的挑战。但对拥有2500多年历史的围棋而言,计算机在此之前从未战胜过人类。围棋看起来棋盘简单、规则不难,纵横各19九条等距离、垂直交叉的平行线,共构成19&19(361)个交叉点。比赛双方交替落子,目的是在棋盘上占据尽可能大的空间。在极简主义的游戏表象之下,围棋具有令人难以置信的深度和微妙之处。当棋盘为空时,先手拥有361个可选方案。在游戏进行当中,它拥有远比国际象棋更多的选择空间,这也是为什么人工智能、机器学习的研发者们始终希望在此取得突破的原因。就机器学习的角度而言,围棋的计算最大有3361种局面,大致的体量是10170,而已经观测到的宇宙中,原子的数量才1080。国际象棋最大只有2155种局面,称为香农数,大致是1047。传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。此次谷歌推出的AlphaGo,将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。其中一个神经网络&决策网络&(policy network)负责选择下一步走法,另一个神经网络&值网络&(&value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcement learning)。通过广泛使用Google云平台,完成了大量研究工作。征服围棋对于谷歌来说有重要意义。AlphaGo不仅是遵循人工规则的&专家&系统,它还通过&机器学习&自行掌握如何赢得围棋比赛。谷歌方面希望运用这些技术解决现实社会最严峻、最紧迫的问题&&从气候建模到复杂的灾难分析。在具体的机器训练上,决策网络的方式是输入人类围棋专家的比赛,到系统可以预测57%人类行动为止,此前最好成绩是44%。此后AlphaGo通过在神经网络内部进行比赛的方式(可以简单理解成和自己下棋),开始学习自主探索新的围棋策略。目前AlphaGo的决策网络可以击败大多数具有庞大搜寻树的最先进的围棋程序。值网络也是通过自己和自己下棋的方式来训练。目前值网络可以评估每一步棋能够有多大胜算。这在此前被认为是不可能的。实际上,目前AlphaGo已经成为最优秀的人工智能围棋程序。在与其他程序的对弈中,AlphaGo用一台机器就取得了500场的胜利,甚至有过让对手4手后获胜的纪录。去年10月5日-10月9日,谷歌安排AlphaGo与欧洲围棋冠军Fan Hui(樊麾:法国国家围棋队总教练)闭门比赛,谷歌以5-0取胜。公开的比赛将在今年三月举行,AlphaGo将在韩国首尔与韩国围棋选手李世石九段一决高下,李世石是近10年来获得世界第一头衔最多的棋手,谷歌为此提供了100万美元作为奖金。李世石表示很期待此次对决,并且有信心获得胜利。值得一提的是,上一次著名的人机对弈要追溯到1997年。当时IBM公司研发的超级计算机&深蓝&战胜了国际象棋冠军卡斯巴罗夫。不过国际象棋的算法要比围棋简单得多。国际象棋中取胜只需&杀死&国王,而围棋中则用数子或比目的方法计算胜负,并不是简单地杀死对方棋子。此前,&深蓝&计算机的设计人2007年发表文章指出,他相信十年内能有超级电脑在围棋上战胜人类。此外,AlphaGo的发布,也是Deep MInd在2014年1月被谷歌收购以来首次发声。在被收购之前,这家位于伦敦的人工智能领域的公司还获得了特斯拉和SpaceX创始人马斯克的投资。(李根 周峰 边策)
本文系转载,不代表参考消息网的观点。参考消息网对其文字、图片与其他内容的真实性、及时性、完整性和准确性以及其权利属性均不作任何保证和承诺,请读者和相关方自行核实。
“神龙”从2007年开始研制,最起码在数年前进行过一次试验,是从轰-6轰炸机上投放的。
将现在重要岗位、可能还要提拔使用的领导干部作为重点查处对象,可能会在五年一度的领导层改组之前重塑中国的政治景观。
在长约三分半钟的片段中,至少有六人中招。众人被泼后全身及头发沾满奶粉,狼狈不堪,对自己为何被泼感到一脸茫然,还有人中招之...
本月中旬女孩的父母曾报警称女孩失踪,但她在失踪后数小时独自走回家,并告诉家人自己遭到一群阿拉伯移民劫持并被他们轮奸。
研究人员推断,2015年中国新增浸润性癌症确诊病例应为4292000例,这相当于每天新增癌症确诊病例近12000例、死亡7500例。在象棋和国际象棋中,电脑都非常厉害,只有围棋是唯一“电脑下不过人类”的项目。而今年1月份有个爆炸性新闻:谷歌DeepMind开发的人工智能围棋程序AlphaGo以5:0的压倒性优势击败了欧洲围棋冠军、专业二段棋手。那么3月份AlphaGo会和韩国九段、世界冠军李世石进行对弈。如果此役AlphaGo获胜,这意味着人工智能真正里程碑式的胜利。    落子选择器是怎么看到棋盘的?数字表示最强人类选手会下在哪些地方的可能。团队通过在KGS(网络围棋)上最强人类对手,百万级的对弈落子去训练大脑。这就是AlphaGo最像人的地方,目标是去学习那些顶尖高手的妙手。这个不是为了去下赢,而是去找一个跟人类高手同样的下一步落子。AlphaGo落子选择器能正确符合57%的人类高手。(不符合的不是意味着错误,有可能人类自己犯的失误)-更强的落子选择器AlphaGo系统事实上需要两个额外落子选择器的大脑。一个是“强化学习的策略网络(Policy&Network)”,通过百万级额外的模拟局来完成。你可以称之为更强的。比起基本的训练,只是教网络去模仿单一人类的落子,高级的训练会与每一个模拟棋局下到底,教网络最可能赢的下一手。Sliver团队通过更强的落子选择器总结了百万级训练棋局,比他们之前版本又迭代了不少。单单用这种落子选择器就已经是强大的对手了,可以到业余棋手的水平,或者说跟之前最强的围棋AI媲美。这里重点是这种落子选择器不会去“读”。它就是简单审视从单一棋盘位置,再提出从那个位置分析出来的落子。它不会去模拟任何未来的走法。这展示了简单的深度神经网络学习的力量。-更快的落子选择器AlphaGo当然团队没有在这里止步。下面我会阐述是如何将阅读能力赋予AI的。为了做到这一点,他们需要更快版本的落子选择器大脑。越强的版本在耗时上越久-为了产生一个不错的落子也足够快了,但“阅读结构”需要去检查几千种落子可能性才能做决定。Silver团队建立简单的落子选择器去做出“快速阅读”的版本,他们称之为“滚动网络”。简单版本是不会看整个19*19的棋盘,但会在对手之前下的和新下的棋子中考虑,观察一个更小的窗口。去掉部分落子选择器大脑会损失一些实力,但轻量级版本能够比之前快1000倍,这让“阅读结构”成了可能。第二大脑:棋局评估器&(Position&Evaluator)AlphaGo的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是论文中提到的“价值网络(Value&Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。  局面评估器是怎么看这个棋盘的。深蓝色表示下一步有利于赢棋的位置。局面评估器也通过百万级别的棋局做训练。Silver团队通过&复制两个AlphaGo的最强落子选择器,精心挑选随机样本创造了这些局面。这里AI&落子选择器在高效创建大规模数据集去训练局面评估器是非常有价值的。这种落子选择器让大家去模拟继续往下走的很多可能,从任意给定棋盘局面去猜测大致的双方赢棋概率。而人类的棋局还不够多恐怕难以完成这种训练。增加阅读这里做了三个版本的落子选择大脑,加上局面评估大脑,AlphaGo可以有效去阅读未来走法和步骤了。阅读跟大多数围棋AI一样,通过蒙特卡洛树搜索(MCTS)算法来完成。但AlphaGo&比其他AI都要聪明,能够更加智能的猜测哪个变种去探测,需要多深去探测。  蒙特卡洛树搜索算法如果拥有无限的计算能力,MCTS可以理论上去计算最佳落子通过探索每一局的可能步骤。但未来走法的搜索空间对于围棋来说太大了(大到比我们认知宇宙里的粒子还多),实际上AI没有办法探索每一个可能的变种。MCTS做法比其他AI有多好的原因是在识别有利的变种,这样可以跳过一些不利的。Silver团队让AlphaGo装上MCTS系统的模块,这种框架让设计者去嵌入不同的功能去评估变种。最后马力全开的AlphaGo系统按如下方式使用了所有这些大脑。1、从当前的棋盘布局,选择哪些下一步的可能性。他们用基础的落子选择器大脑(他们尝试使用更强的版本,但事实上让AlphaGo更弱,因为这没有让MCTS提供更广阔的选择空间)。它集中在“明显最好”的落子而不是阅读很多,而不是再去选择也许对后来有利的下法。2、&对于每一个可能的落子,评估质量有两种方式:要么用棋盘上局面评估器在落子后,要么运行更深入蒙特卡罗(滚动)去思考未来的落子,使用快速阅读的落子选择器去提高搜索速度。AlphaGo使用简单参数,“混合相关系数”,将每一个猜测取权重。最大马力的AlphaGo使用&50/50的混合比,使用局面评估器和模拟化滚动去做平衡判断。这篇论文包含一个随着他们使用插件的不同,AlphaGo的能力变化和上述步骤的模拟。仅使用独立大脑,AlphaGo跟最好的计算机围棋AI差不多强,但当使用这些综合手段,就可能到达职业人类选手水平。  AlphaGo的能力变化与MCTS的插件是否使用有关。这篇论文还详细讲了一些工程优化:分布式计算,网络计算机去提升MCTS速度,但这些都没有改变基础算法。这些算法部中分精确,部分近似。在特别情况下,AlphaGo通过更强的计算能力变的更强,但计算单元的提升率随着性能变强而减缓。优势和劣势我认为AlphaGo在小规模战术上会非常厉害。它知道通过很多位置和类型找到人类最好的下法,所以不会在给定小范围的战术条件下犯明显错误。但是,AlphaGo有个弱点在全局判断上。它看到棋盘式通过5*5金字塔似的过滤,这样对于集成战术小块变成战略整体上带来麻烦,同样道理,图片分类神经网络往往对包含一个东西和另一个的搞不清。比如说围棋在角落上一个定式造成一个墙或者引征,这会剧烈改变另一个角上的位置估值。就像其他的基于MCTS的AI,&AlphaGo对于需要很深入阅读才能解决的大势判断上,还是麻烦重重的,比如说大龙生死劫。AlphaGo&对一些故意看起来正常的局也会失去判断,天元开盘或者少见的定式,因为很多训练是基于人类的棋局库。我还是很期待看到AlphaGo和李世石9段的对决!我预测是:如果李使用直(straight)式,就像跟其他职业棋手的对决,他可能会输,但如果他让AlphaGo陷入到不熟悉的战略情形下,他可能就赢。 结语这里我还想到另一个人,中国最强大脑选手鲍橒,当时看了他走出蜂巢迷宫,被他的超强的空间记忆和想象能力深深震撼了,而他的职业就是围棋选手,并且是盲棋。他能完成1对5的围棋盲棋,实在是很不可思议的事情。在围棋圈内,几乎没有棋手能完成盲棋,因为确实太难了。笔者也向他询问了对这个事情看法,他说,欧洲冠军没能摸到程序的底,但从棋谱来说,对谷歌程序我也难以取胜,确实下的不错。虽然围棋圈一致看好李世石,不过我不敢确定谷歌的程序3月份进展到什么地步。再说到Facebook田博士,跟谷歌DeepMind超豪华团队长期投入不同,他就在半年多前从立项到实现,直到最近才有一个实习生加入帮他,而背后是他付出的心血,为了抢时间,在圣诞新年都是加班加点,按他所说,每日工作10+小时,自己搭机器,写代码,调参数,单枪匹马做出成绩。谈到跟谷歌团队的较量,田博士说:“这是一场必败的战斗”,但我还是很佩服他,他让我想到三国时代赵子龙,单枪匹马大战曹军,力拔山兮气盖世!因为他是真正的勇士。正是有了这些英勇无畏的科学家,一次次打破常规,挑战极限,我们才知道人类如此大的潜力。最近短短几年的发展,从大数据,深度学习人工智能到虚拟现实,从发现了类地球行星,证实引力波,从Hyperloop,无人驾驶,量子计算,这些魅力无穷的科技让我们对世界的认识上升到新的高度。面对这个激动人心的时代,我想说,天空是我们的极限,宇宙是我们的极限,未来才是我们的极限!最后允许我拿田博士的话来结束。我有时候会问自己:“我是不是背弃了梦想?”我想除了我自己,任何人都不会给我答案,任何评论也不具效力。我记得有人问过,如果梦想从践行的一开始,就在不自觉地向现实妥协,那样的梦想还是最初的梦想么?其实,这样的问题没什么可纠结的,因为世界从来就不是二元的,梦想和现实,如同高悬的日月,日月之间,有一条灰色的路,在自己脚下蜿蜒曲折,绕过各种险阻,一直向前。“而我能做的,只是要在奔跑时,不停提醒自己,还记得“梦想”这个词的含义。”关注如下我的公众号“董老师在硅谷”&(donglaoshi-123),关注硅谷趋势,一起学习成长。
天津重庆哈尔滨沈阳长春石家庄呼和浩特西安太原兰州乌鲁木齐成都昆明贵阳长沙武汉郑州济南青岛烟台合肥南京杭州东莞南宁南昌福州厦门深圳温州佛山宁波泉州惠州银川
本城市下暂无经销商
下载中关村在线Android 客户端
下载中关村在线 iPhone 客户端
下载中关村在线Windows8客户端
成为中关村在线微信好友

我要回帖

更多关于 围棋穷举 的文章

 

随机推荐