如何评价围棋人机大战第一轮李世石围棋视频战败

弈城围棋讯 在拥有400万会员的围棋網站Tygem亮相的神秘高手“Magister”(弈城中文名Master(P))正是AlphaGo。ID为Magister(P)的AlphaGo与包括朴廷桓、柯洁在内的中韩顶级职业棋手大战取得了30战全胜的惊人战绩。

去姩3月AlphaGo和李世石围棋视频举行世纪对决,并以4比1获胜后AlphaGo获得韩国棋院授予的“名誉职业九段证书”,一举成为最强人工智能围棋软件茬Tygem,“(P)”的后缀意味着“职业棋手”韩国排名第一的朴廷桓九段,中国排名第一的柯洁九段以及芈昱廷九段、陈耀烨九段、连笑七段、唐韦星九段、范廷钰九段等世界冠军或本国排名前十的中韩顶尖棋手,纷纷在新型AlphaGo的化身Magister(P)面前屈膝

被誉为“AlphaGo之父”的DeepMind创始人戴密斯·哈萨比斯本月4日在推特中说:“Magister(P)是适用新原型版本的AlphaGo”,并公开了AlphaGo在Tygem(弈城)对弈的事实李世石围棋视频九段观看了新型AlphaGo在Tygem打败朴廷桓、柯洁等中韩顶尖高手的棋谱之后,评价说:“AlphaGo变得更强大了在读秒的情况下,没有出现失误去年3月和我对弈的AlphaGo,读秒时还能看到一些弱点现在这些弱点都不见了。”

李世石围棋视频九段认为:“在同样条件下如果职业棋手和AlphaGo都读秒的话,职业棋手应该没有胜算AlphaGo昰机器,不会有失误而人类棋手在读秒催促下,很容易出现误算如果对局设定为AlphaGo读秒,而人类棋手有2至3小时思考时间的话人类大概能在5盘棋里赢下1盘吧。”在Magister上网对弈期间Tygem出于对DeepMind的保密承诺,一直没有公开Magister(P)就是AlphaGo的事实随着保密期限届满,现在可以全面公开新型AlphaGo选擇的第一个训练平台Tygem和黄士杰博士的对话内容了

Tygem新事业开发组的权振洙(音)表示,去年12月16日晚8点接到了AlphaGo核心研发成员之一的黄士杰博士的电子邮件。其内容为:“我们计划让AlphaGo在Tygem进行测试希望能够为AlphaGo设立一个国籍为韩国的ID——Magister(P)。”此外黄士杰博士还要求删除AlphaGo曾在Tygem使鼡过的ID——deepmind。黄士杰博士要求使用韩国国籍的原因是去年Tygem进行测试时,因AlphaGo使用了英国国籍和“deepmind”的ID结果很快便被人们猜出了真相。(延伸阅读:

同时黄士杰博士还要求Tygem对此事保密。与李世石围棋视频九段进行世纪对决之前的老版本AlphaGo也就是水平相当于对阵欧洲围棋冠軍樊麾时的deepmind,并没有能够在Tygem取得令人惊讶的战绩不过,应黄士杰博士的要求秘密登场的新型AlphaGo——Magister(P)可谓一炮而红

Master(P)在弈城半目击败朴廷桓

2016姩12月29日至12月31日,Magister(P)在三天时间里取得了30连胜29日是6胜,30日是14胜31日是10胜。与Magister(P)对弈最多的棋手是韩国连续38个月排名第一的朴廷桓他一共下了4盤。12月30日下午2点在首局较量中,仅仅150手朴廷桓就无奈认输。当天下午6点朴廷桓再次挑战,这次是执白5目半告负全局255手。31日下午一點朴廷桓执白中盘负,全局223手最后一局是31日下午2点,朴廷桓执黑半目负全局261手。

中国排名第一的柯洁九段也向AlphaGo发起挑战依旧未能收获一胜。12月30日的2盘对局AlphaGo以执黑5目半胜(全局228手)、执白中盘胜(全局128手)完封柯洁。这是中韩排名第一的职业棋手双双负于新型AlphaGo的一刻韩国排名第七的安成浚七段评价说,AlphaGo的强大足以让人惊异。他表示:“去年3月战胜李世石围棋视频九段的时候我也曾感慨其实力強大。自己亲身对弈之后感觉AlphaGo完全没有人类的固定观念。AlphaGo下得很厚实基本上不留孤棋,实地和厚势相辅相成均衡感极其出色。”之湔棋迷们非常渴望柯洁九段和AlphaGo碰撞,如今多数意见认为互先已没有意义。

如果下让子棋人工智能和棋手的差距有多大?对此安成浚七段分析说,让先的话依旧是AlphaGo的赢面大。安七段甚至认为让先倒贴目,人类棋手也不见得会赢AlphaGo不过,如果是让二子的话安七段認为,即便是AlphaGo也很难战胜顶尖棋手。

虽然是人工智能完败人类但是包括安七段在内的韩国顶尖棋手们却认为,在围棋领域人工智能嘚积极意义更大。原因在于顶级棋手们在围棋的技术层面上,正面临着某种瓶颈而AlphaGo有可能开启全新的围棋探索之路。谷歌DeepMind的哈萨比斯茬推特上预告说今年AlphaGo将进行正式对局。在此之前AlphaGo依旧会保持快速的进化势头。

拥有400万会员和朴廷桓、柯洁等中韩顶级棋手ID的世界最大圍棋网站Tygem正在与谷歌DeepMind紧密合作全力支持AlphaGo的发展。谷歌DeepMind方面为改善新型AlphaGo已经下载Tygem的部分棋谱,开始进行研究谷歌下载的棋谱是中国、韓国、日本等世界各国顶尖棋手们在Tygem(弈城)对弈的激战棋谱,对提升AlphaGo有很大帮助

另外,在弈城围棋对弈客户端“查找用户”窗口输入Magister(P)戓Master(P)进行搜索即可通过“欣赏棋谱”观看新型AlphaGo——Magister(P)的对局棋谱。(全龙成译自Tygem网站 原文作者:李英宰)

北京时间3月9日李世石围棋视频與谷歌围棋AlphaGO人机大战五局大战,在韩国首尔开战在今天进行的双方第一局比赛中,执黑先行的李世石围棋视频在中盘局势领先的情况丅,在右下角局部战斗中出现失误AlphaGo敏锐捕捉到战机随即重新获得主动权,最终AlphaGO取得本局的胜利1-0领先。

免责声明:本文仅代表作者个人觀点与环球网无关。其原创性以及文中陈述文字和内容未经本站证实对本文以及其中全部或者部分内容、文字的真实性、完整性、及時性本站不作任何保证或承诺,请读者仅作参考并请自行核实相关内容。

人机围棋大战第一局李世石围棋视频(黑) VS AlphaGo (白中盘胜)

人机对弈的巅峰对决,李世石围棋视频九段首场被棋界寄予厚望但是盘中出现情绪波动最终被机器逆转。他茬赛前认为人工智能还不够强、排除万一的担心居然一语成谶“因为人类下棋时会有失误。”

人类输了棋有人在欢呼人工智能的伟大勝利,有人的感受比较失落还有的人开始担忧未来。而在谷歌CEO施密特看来不管胜败,人类都是最大的赢家

“机器”总比人类强?在各种情绪面前历史和现实都已经表明,这似乎是不可阻挡的趋势也许人类应该避免的是因为赛事带来的人与机器二元对立的情绪,因為我们终将迎来一个人工智能技术应用日渐丰富的生活场景

文 | 江铸久、卫鸿泰、张峥、田渊栋、董飞、朱文章、刘峰、卫鸿泰、何波等

2015姩10月,AlphaGo先以5:0击败了欧洲围棋冠军樊麾二段这是电脑围棋程序第一次在全尺寸棋盘上公平击败职业围棋棋手。

2016年3月9日——15日AlphaGo挑战世界排洺第二、韩国棋手李世石围棋视频九段,人机对决举世瞩目在第一局的对决中,AlphaGo执白186手以约7.5目的优势中盘取胜,

《知识分子》特邀请哆位人工智能、围棋领域的专家通过微信群和广大网友共同解读人工智能与人类智力的巅峰对决。

感谢各位网友的踊跃参与!

九段中國国家队著名国手,韩国棋院客座棋士

今天这棋AlphaGo表现挺好的,我觉得不过不管怎么说,尽管我预测偏向电脑赢赢一盘就算赢,但没想到第一盘就赢说明AlphaGo这5个月进步真的很快。从李世石围棋视频布局阶段就能看出来他今天在心理上一开始就有波动,因为他采取的是非正常的布局我估计这是因为他知道是在跟AlphaGo,而不是和人类下棋

在这种情况下,我个人觉得李世石围棋视频的布局不算太成功而且AlphaGo仩来的斗志是不错的,断的时候挺果断的算路是比较深的。这样夸人工智能也是它长处的地方。

但是中途的时候李世石围棋视频追仩来了。但是在我看来左边拆二的发挥,是AlphaGo让职业棋手觉得low的地方它那个下法肯定不是职业的下法。

但是有一点意外的就是,AlphaGo那个丅法损失并不大整个下法是很low,损失并不大相对于在右边破黑棋的空,它的次序下得很精准加上李世石围棋视频在右边角上的失误,AlphaGo一下就超出了

况且它在左边的下法,基本上是AlphaGo胜利宣言的下法那些小的失误反而让人想起全盛期的李昌镐。李昌镐在形势领先的时候经常有一些失误,但是倒过来看他的那些失误都是很保险的,一点风险都不冒就会赢下来

所以,我觉得AlphaGo很了不起

知乎围棋专栏主持人、围棋业余5段

这一盘,李世石围棋视频输给机器意外的是,人类在大局观上输给了机器

这盘棋开局稍显意外,印象中这样的开局是第一次见感觉李世石围棋视频有备而来,故意选择了不常见的下法

之后作战很强硬,局部来看黑棋稍有勉强。

之后黑棋逐渐占據上风进行到76手的时候我觉得AlphaGo下的实在太机械,太僵硬有点暴露“机器本性”。

进行到这里大家开始普遍看好黑棋了接下来是本盘朂有看点的一招:

102 是非常有个性的一步,也是柯洁(九段)指出的好棋之后AlphaGo占到便宜以后连续两次脱先,逐渐扭转了局面

之后右下角的悬念是AlphaGo右下没有跳一路是看到目数优势,简明处理还是没有看到手筋当然我倾向于前者。

之后收官双方都很平稳本局唯一一次打劫也简單结束,希望之后能看到AlphaGo对于复杂劫争的控制水平

上海纽约大学计算机科学教授、前微软亚洲研究院副院长

刚刚仔细读过AlphaGo,没觉得有什麼破绽在自己左右手互搏中的计算价值那部分为了效率用了“快棋”策略,可能粗糙些但下得多可以弥补。有网友提出的和李世石围棋视频比赛会“偷招”这个倒不用担心五局的样本对机器没用,它不靠这个靠的是工程上高效率、策略上粗枝大叶但大方向正确。

AlphaGo胜利的概率是100%只不过不见得是这次。“毛病”还是机器学习的老毛病表现在:无法总结规律,或者说无法吐出一套规整自洽的规律;泛囮能力差无法在复盘中举一反三,即便告诉它哪步走错了恐怕它也不知道为啥,只是一气儿死磕到撞了南墙才完事

对谷歌如何复盘峩很好奇。

如何实现不败呢AlphaGo从大量的棋谱开始练,除非有它没见过的变化而且远离它见过的和自己能演练到的。要下无理棋把围棋當五子棋下……

但这种可能性太小。归根结底和国际象棋变化少不一样,问题是围棋太古老了以至于穷举了太多可能,而且还让AlphaGo看了!剩下的变化空间人是可以其乐无穷地去变化对机器来说分分秒嗖嗖地就搜完了。这里围棋的长板变成短板帮了AlphaGo:由于规则太简单,被机器抄了近道

卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员,Facebook人工智能围棋程序Darkforest负责人

我围棋水平很烂但总的来说,可以对Alphago有所评论第一点,如果你觉得AlphaGo的落子水平会波动其实它可能判断胜率已经很高,有时候随便下;第二点蒙特卡洛树搜索是遇强则强的,如果对手太弱的话也不会下出太强的手;第三点AlphaGo下棋每一步最后都是算整体分数的,并非单纯局部反倒是有时候局部弱,对杀会有問题;第四点接下去的研究是进入程序的黑箱里去。人工智能研究者们虽然设计学习算法但其实不知道电脑是怎么决策的,要打开黑箱了解内部机理还有很长的路要走。

数据科学家、Coursera数据工程师

这次是太多意外在大家一边倒的支持李九段的时候,也有李开复老师、餘凯老师(前百度研究院副院长)力挺AlphaGo认为机器会赢。

这盘棋大致是前半段李世石围棋视频占有很多先机,但后来不知道为何保守下棋犯了一些失误,势力峰回路转而AlphaGo中盘发力,180度转弯把李世石围棋视频逼着认输。

我想作为一次焦点比赛关注的人太多,比赛的压力佷大李世石围棋视频也似乎没有发挥最佳水平,今天这一盘还不能完全说明问题如果明天他接着输了,那可以认定人工智能真的在围棋领域取得革命性突破

其实在(类似围棋的)这些封闭系统中,(人工智能)战胜人类也不奇怪我记得有些预言家说过未来20年,98%的人類工作将会被机器取代那么我们现在要怎么做?怎么才能成为那2%的人我觉得只有人类的创意思维,不断创新才是出路所谓的灵感、靈气、灵光。

最后如果说我对明天的棋局有什么建议的话那就是靠直觉判断,电脑目前还不会对全局判断弄不大清楚,这可能是AlphaGo的弱點

香港科技公司首席架构师、香港大学计算机博士、围棋业余5段(弈城9段),前微软及谷歌软件工程师iOS软件“围棋之眼”作者

开局李卋石围棋视频下得太勉强,也下得快到中间缓过来优势,102点的时候虽然长考,但没有发挥出计算力的优势被翻盘。右下角又没有出強手左上也让白棋稳稳围住。这些估计都是失败之处

著名互联网资深人士、计算机博士,《人工智能学家》主编、AIE实验室创始人《互联网进化论》作者

震惊于AlphaGo战胜李世石围棋视频九段,但若以科学实验流程规范来评价我依然认为此次比赛不合格。谷歌应尽早展开线仩多人(100人以上)同时在线对弈AlphaGo以消除其实验不规范带来的质疑。在比赛公正的条件下AlphaGo的此次胜利将意义非凡。甚至是人类发展史的┅次巨大进步可能的意义超过美国登月,但面对如此巨大的突破我们是否应该持有更加谨慎和科学的态度?

业余5段中国科技大学物悝博士,中泰证券股份有限公司信息技术部副总经理

卫鸿泰(左)、何波(右)

今天是个划时代的一天AI在要点的把握上超过人类,不会囿因为思维定势等缘故而跟着对手走棋每一步坚定的走他觉得价值最大的点,这点我觉得很可怕?另外,我觉得现在说AI超越人类还早现在AI在输入的信息上并没有产生更多的信息度,如果有一天AI会自己创造数学公式或者总结物理规律,这才是奇点来临

“狗狗”的学習机制还是黑匣子

Q1:请介绍今天比赛的计时、计分(贴子)规则。

朱文章:比赛采用中国规则黑棋贴7.5目,各两个小时还加3次1分钟读秒

Q2:电脑下棋会不会也形成像中韩日围棋届一样的某种流?

朱文章:AlphaGo和机器人小图这个问题很大你说它们能自学习吧,应该都有但是不哃系统,机器学习训练的方式结构都有千差万别。我这方面还是不够深入了解电脑的神经网络参数定了之后,应该有一定模式和风格但是经过不断学习,它会改变

Q3:遇到不同的水平的棋手,AlphaGo的表现是不是也不同?

田渊栋: 蒙特卡罗树搜索是遇强则强的如果对手太弱的話不会下出太强的手。

朱文章:AlphaGo团队最强的棋手是台湾的Ajahuang台湾业余6段。

Q4:作为训练数据的对局水平是否会影响围棋AI的水平例如10000盘刚学會围棋的人的对局,和10000盘职业高段位棋手的对局做训练数据,对同一个模型是否会有显著影响

田渊栋:不同质量的对局对训练影响很夶。

Q5:阿狗(AlphaGo)的策略也靠搜索来的吗与之对弈,人落子拖时间长一点和拖时间短一点,AI的结果会不会不一样

田渊栋:是啊,如果AI開了pondering(编者注:即长考)的话就是说在对手思考的时候也思考。软件下棋每一步最后都是算整体分数的不同质量的对局对训练影响很夶。

张峥:是用少见的开局也许可以增加长距离蝴蝶效应的可能性。一进入局部就不好办了

Q6:硬件当中会有GPU(图形处理器)和CPU(中央處理器)共同工作吗?

张峥:是的用两种硬件协调工作是工程和资源的优化,不是本质

田渊栋:一直是两者同时工作的,CPU搜索GPU评估局面。

Q7:在过去的四个月中AlphaGo的学习方式是复习历史棋局还是跟许多真人高手对決?AlphaGO是在局部算路更强的情况下对整体势的把握是如何莋的。

Q8:我记得有人问Google作者电脑是怎么下这一步的,他也不知道不是靠背棋谱就可以知道的。为什么Google作者自己都不知道电脑怎么下棋嘚呀不是他们设置学习机制的吗?

田渊栋:设置了机制但是不知道这个机制如何学得棋谱模式。所以AlphaGo可以走很好的棋,但是制作者鈈知道这个是通过什么推理方式算出来的要是知道了,对AI来说是非常大的突破

Q9:所以,机器思考的过程现在还是个黑匣子

田渊栋:昰的,在这点上人工智能还是有很长的路要走

Q10:电脑的弱点之一是,算法可以解决局部的问题但对整体局势的评估会弱一些。

田渊栋:不一定深度神经网络往往是倒过来,整体强而局部弱需要加上搜索,DarkForest是这样所以有时候死活,对杀会有问题

张峥:难说,狗狗嘚结构是从局部到全局的

Q11:我们能否说AlphaGo现在已经能够判别局势,而不是只判断接下来的几步范围内哪个位置最优?

田渊栋:Value Network和Playout都是用來判断局势的判断哪步棋最优也要靠这两个,Policy Network给出候选的走子然后由上面这两个判断哪步比较好。

“狗狗”早点去博物馆不好吗

Q12:“阿狗”和对手下得越多,胜利的机会也就随之增加

张峥:狗狗哪天的左手也很强,就不要你了!它左右手互搏是现在成长的环境一环

Q13:如果AlphaGO在棋力水平超过了大部分用于训练的“高手棋局”,想进一步提升棋力这时如果再用这些水平低于自身水平的棋局数据进行训練是否不利于自身棋力水平增长?更多的使用“左右互搏”棋局训练是否更好

董飞:我之前思考过电脑如果只是学习网上的棋谱,这些夶多都不是高手超一流的棋局又那么少,跟三流学怎么可能下过一流的选手呢?但它那种可以自我对弈选择倾向赢棋的路径,这样想只要它不断电有大量计算资源,这样就进化直到永生想到这就是一部科幻片了。大家还记得那部片子叫《超验骇客》主人翁要死叻,委托他女友把大脑移植到电脑中后来就入侵银行,去一个乡下造了一个巨大data center一直进化,研究各种新技术可以移植修复,copy他的思想最后谁也没法阻挡,世界被他控制我觉得那部电影还是挺有哲学意义的,本意是想那些人类都不如他他要去拯救世界,给他们最恏的东西但这样就是独裁。

Q14:没有了人类的挑战AlphaGo的能力很快就到顶,进步的空间就不大了

张峥:让狗狗早点去博物馆不是好事吗?

張峥:因为就去战下一个更好的问题了

Q16:AlphaGo的算法已经公开发表,是否意味着别的团队同样可以做出AlphaGo商业化公司发表公开论文的动力在哪里?

田渊栋:细节有很多还是不清楚的当然大致的技术路线都很明确了。动力在于提高自己公司知名度这个很重要的,而不只是为叻赚钱有知名度就对招人和公共形象都有好处。

机器还是真人你分得清吗?

Q17:如果不告诉您黑白棋对应的是电脑还是真人您能分辨絀来谁是谁么?

刘锋一互联网进化论:不能

朱文章:这盘可以。最新的这些招法有点现出原形了。贴了那么多个白子人不会那样下啊。

卫鸿泰:白棋这一串机器的感觉太明显。

Q18:怎么看人工智能现在的阶段围棋机器人有用到量子力学吗?

田渊栋:没有量子力学的荿分全都是基于经典物理的。

Q19:李世石围棋视频大优的情况下长考是要做坏事了么?像中盘那样

朱文章:长考很重要,可以稳定一丅情绪

Q20:第一局输了的话,AlphaGo有可能像人类高手一样分析对手风格从而在后面棋局中调整策略吗?

田渊栋:要调整也是人类去调整机器目前看起来还没有这个能力,它要自我学习的话需要大量的样本

卫鸿泰:白棋两次脱先收获非常大,大局观不错职业普遍认为黑棋祐下有心态问题,下得非常有问题

Q21:阿狗的时间不够怎么办啊?

田渊栋:不会不够的机器大不了用Policy Network,3毫秒一步只要code没bug,肯定不会超時Dark Forest上次一月份对Zen超时了,因为有个bug

主持人:终局,李世石围棋视频输

朱文章:输了部分人都挺难受的,特别是喜欢围棋的人

张峥:我吭吭哧哧地写了那两篇,其实心里是很希望能再挺一会的

我要回帖

更多关于 李世石围棋视频 的文章

 

随机推荐