围棋最强的人AI为什么这么强,强在哪里

当前位置 & &
& 人类AI围棋大战来了:李世石手指都在颤抖
人类AI围棋大战来了:李世石手指都在颤抖
10:55:31&&出处:&&
编辑:朝晖 &&)
让小伙伴们也看看:
阅读更多:
好文共享:
文章观点支持
文章价值打分
当前文章打分0 分,共有0人打分
[03-09][03-09][03-09][03-08][03-08][03-08][03-08][03-08][03-08][03-07]
登录驱动之家
没有帐号?
用合作网站帐户直接登录先讲一个故事。一万年前,差不多是“有史以来”那个年代,人类开始制造能帮自己活得好、活的久的机器人。所有人都在造,这是一场军备竞赛,也是一场无形战争。有人造出的机器人,能给自己治病。有人造出的机器人,能克隆自己。有人造出的机器人,能自动摘果子。有人造出的机器人,能打劫摘果子的机器人。在战争中输掉的机器人,和主人一起同归于寂。胜利的机器人又各有特色,有些在陆上所向披靡,有些在水中称霸一方……这些机器人同它们的主人一起,度过了悠长岁月。人们生生死死,克隆有时,克隆失败有时。机器们忽现忽隐,新造有时,淘汰有时。总体来说,九千余年,平安无大事。机器不算聪明,但“够用了”。60年前,有人突发奇想,想造一个不求最强,但求最聪明的机器人。理想中,这个机器人不需要人给指令,就能分析状况,选择最佳策略,适应甚至改造环境,最好失败后能自行反省修正。最后,他造出一台“大猿机”,孱弱粗糙,丢在一堆机器人里,并不出色。在当时,没有人想到这是转折点。几十年内,这个机器人的计算能力不断发展。2年前,它的最新型号“智人机”懂得了自学,甚至开始创造出一些主人都看不太懂的工具。它开始向各地扩张,一路灭掉了许多老型号机器人。到了2个月前,几乎全世界都能看到“智人机”和它的克隆主人。差不多一个月前,“智人机”忽然自己琢磨出了一个办法,能以极低成本获取能源、自我复制。于是,“智人机”数量突飞猛进,它们成了绝对的主流,占据了更大的地盘,消耗了更多的能源,当然,顺手又干掉了更多的其他种类机器人——及其主人。现在,就在17小时前,“智人机”版本发生重大更新,直接从电动汽车升级到了变形金刚,分分钟毁灭地球十个来回,其他机器人完全不是对手,被挤到角落里苟延残喘。据估计,在“智人机”压力下,高达70%的机器人已走上灭亡之路。“智人机”,以及它的主人,大获全胜。这时,欢庆胜利的主人忽然想起了一件事。拜“智人机”所赐,当初一起造机器人的许多伙伴已经湮灭,万一自己哪天需要伙伴帮忙怎么办?万一哪天,“智人机”不需要自己了,又该怎么办?这个故事可怕之处在于,它是真的。把故事里的“人”,换成“基因”。把“机器人”,换成“生命”。所有时间乘以10万倍,就是地球的生命简史。基因,为了自我复制而制造了生命。然而,20万年前智人出现,2万年前遍布全球,1万年前发明农业,200年前开始工业革命……到如今,被智人灭掉的物种基因库浩如烟海。而一些智人已经为了“自我”背叛基因,用禁欲或节育,让体内的基因无从复制、不再流传。机器人出现,机器人自学,机器人进化,机器人涌现出自我意识……最后,是机器人反叛。民可使由之,不可使知之啊,基因感叹道。这个故事更可怕之处在于,它正在重现。1822年, 数学家查尔斯.巴比奇Charles Babbage发明了计算机,距今约200年。1956年,麻省理工学院的认知科学家马文·明斯基Marvin Minsky提出了“人工智能”(AI)这个概念,距今60年。1997年,“深蓝”击败卡斯帕罗夫,此后国际象棋再无人类是AI对手,距今19年。那时候,人类以为,至少围棋不会被AI破解。因为围棋需要的计算量太大了,一盘围棋可以出现多少种可能?全宇宙目前观测到的原子数,平方,再乘上一百亿。暴力破解行不通,AI学会了两招“深度学习”,第一招,“向人学”,看人类在网上怎么下棋;第二招,“自学”, AI每天自己跟自己对弈100万局。具体到围棋,AI还有两计,一看大局,学会给每一个落子后的局面评分,直接排除掉那些明显拖累局面的“烂棋”;二看细节,学会给每一个落子后的后续发展打分,倘若推算几步后发现发展不妙,立刻抛弃这条路,不再继续。一个大局分,一个细节分,取个平均分,就是谷歌的围棋AI——AlphaGo的思路。简单,但管用。2015年10月, AlphaGo以5:0完胜欧洲冠军、职业棋手二段樊麾。这场胜利震动围棋界和人工智能界,一是因为围棋推算太难,二是因为,这个AI下得太像人了。如果只看棋谱,不看思考时间,根本看不出哪个是AI哪个是人——换言之,在围棋上,这个AI已经通过了图灵测试。而今,AlphaGo将迎战近十年来的世界围棋第一人、韩国九段棋手李世乭。谁会赢?无疑,5个月前迎战樊麾的AlphaGo不是李世乭的对手,然而,就在这5个月里,这个AI至少又跟自己下了1.5亿局。它又进步了多少?或许这次人类还有压箱底的绝技,但我们还能压制AI多久?还有,到了那时候,它是不是变得更像人了?一旦人工智能达到“强人工智能”(artificial general intelligence),它将具备了人类演化至今才获得的大部分心智能力。我们既然能凭之反叛基因,活出不受生物本能局限的人生。AI自然也可以凭之反叛人类——何况比起我们,AI还有天生优势。身为碳基生物,我们至今仍然离了基因不能活。身为(潜在的)硅基生物,AI却不是非要人类不可。史蒂芬·霍金(Stephen Hawking)和埃隆·马斯克(Elon Musk)说,警惕人工智能吧,它们将对人类的生存构成威胁——他们刚刚因此“荣获”了年度卢德奖,专门授予反科学、阻碍技术进步的人士。然而,AI正在让人类失业,这是已然发生的事实。假如你从事的是程序性的工作,不管是体力还是脑力的,在自动化浪潮前,都有失业的危险。为此,理性人应该努力转向AI还没有太大竞争优势的非程序性工作,比如教育者,比如保洁员,比如需要具体评估每颗牙怎么补、每个患者怎么服务的牙医——假如有个钻头在我嘴里,我并不希望它握在AI手里。还有一个更好的选择,挑选“和AI密切合作”的工作。一个典型例子是,在AI碾压人类国际象棋手后,出现了人类可以和AI合作的自由象棋比赛,结果夺冠的不是最强大的AI,而是人和AI配合得最好的组合。无法打败敌人时,就加入他们吧。现在,让我们回过头去考虑一个问题——对于基因来说,人类的出现到底是好是坏?答案是,对于部分基因是好事,对于大部分基因则是坏事。从人类中获益最多的,是那些和人类密切合作的基因,包括人类自身的基因,以及对人类有用的农作物、牲畜家禽、猫狗宠物的基因。其他基因,大多岌岌可危。同样道理,AI出现对于人类来说到底是好事坏事?对于那些现在开始准备和AI密切合作的人类,或许是好事。对其他人类,未必。哪怕有朝一日AI将以“实现自我”而非“服务人类”为目的,举起反叛人类的大旗。最有机会存活下来的,也必定是那些“最懂AI”的人。要亲近你的朋友,更要亲近你的敌人。亦友亦敌的AI,将是人类未来,最该亲近的“人”。就刚刚,李世乭输给了阿尔法狗。编注:游游的所有的文章都无偿授权科学松鼠会使用,她也会把最新的文章通过微博免费放出,在那里,她可以开通打赏功能,为了表示对游游的感谢。在这里,附上游游个人的微信收款二维码,据说她在攒钱去南极。
欢迎转载:
推荐:    【边界】人工智能真的会是围棋的上帝吗?
正在加载...
提要:如果赢不了AlphaGo,这棋下得还有什么意义?本文约10000字,浏览时间约为15分钟。文/张蕾 应虹霞 车莉 发自北京、廊坊、日本东京、大阪2016年3月,《围棋天地》第6期,首席编辑张大勇给农心杯棋评起的标题是《帝国斜阳》。“人类围棋创造了帝国,大家在这个帝国之中进行争霸。但是我觉得,这是我们最后一期纯人类围棋(内容),从下期开始有计算机的交融。起名叫《帝国斜阳》——这是纯人类围棋的黄昏。”在那期杂志后,英国DeepMind公司出品的围棋软件AlphaGo4:1击败了韩国的李世石九段,突破了人工智能(AI)在围棋上的无法在互先的比赛中战胜人类顶级高手的上限。新一期的杂志被命名为《骇世晨曦》。“当时写《帝国斜阳》的时候,还是认为李世石肯定赢。”“可是你用’斜阳’,夕阳西下的这种感觉都有了。”“我当时说’斜阳’,是指(一天中)最后的时光,正常的昼夜轮替,并不是要崩塌了,并不是说你不行。”可这好像成了一道悲观的寓言。“输完三盘棋以后,整个棋界微信圈都特别悲凉,觉得突然来了一个外星人,灾难来临了一样。”迷恋与恐惧张大勇与当今世界围棋第一人柯洁合著了《梦战》一书,记述后者在第二届梦百合杯决赛中战胜李世石的惊险历程和内心成长。当时两人摆棋时,一家媒体来采访,第一个问题就是,你希不希望人工智能围棋出现?柯洁直接回:当然不希望,因为我正处在黄金时代。张大勇与当今世界围棋第一人柯洁合著了《梦战》张大勇明白,李世石的脆败,这使得棋手的神圣感淡化了很多,“棋界有沮丧的感觉”,曾经笃定自己已经爬上围棋世界顶峰的、屈指可数的高手们被迫环顾四周,“发现很多高峰在旁边立着”,“这个感觉,我觉得对于顶尖高手来讲,对他内心的摧残非常难受。”大事件面前,人们开始分化。有人顽固。张大勇身边的一位同事本来身体不好,因为李世石输棋,病情加重,“他是特别伤心,发自内心地伤心。他病休了一段时间,他觉得人类围棋竟然被一个计算机打成这样,他在AlphaGo之后数个月,极力证明AlphaGo走的棋不行。”到了去年底今年初AlphaGo化身Master网络快棋对职业高手60连胜后,“他就变成了回避这个的事情。有点像剪辫子,有的人受不了,要藏起来,坚决不剪,……他平日性格非常好,待人也非常友善,(但)有的时候你跟他谈起来计算机强,他就跟你翻脸。”也有人困惑。理智的言辞是“不要盲目崇拜”。过激的话也有。有的棋手在时过半年后,还认为AlphaGo和李世石的人机大战是“做了一个局”。有一部分棋手迅速臣服,拥抱AI。第一盘比赛后,张大勇问韩国棋手金志锡九段:机器棋力怎么样?金直接摆了两个子。在职业棋界,传统规矩是每三个段位让一子。让两子就意味着职业九段面对职业初级水平,“相当于跑百米,他先让跑20米似的”。正在北京大学哲学系读书的李喆六段发表了三篇与人机大战有关的文章,其中第二盘战罢后的《这两盘棋 没有人会比李世石做得更好》,阅读量的后台数据是30多万,达到历史之最。李世石在于AlphaGo的对决中以失利告终看第二盘棋棋谱,李喆哭了。“我确实从来没有因为棋哭过,基本上输棋也没有哭过,更没有看到棋谱哭。”一步肩冲,以及后面的一系列走法,当时大家都认为AlphaGo亏了,但最后它赢了,“赢得漂亮”。“那步肩冲我认为展现出来说明AI已经有了所谓的’创造性’,不是机器本身的创造,而是它下出来的东西,几乎是经验之外的,虽然我们下过这步棋,但不是在这样的情况之下,……他的这个肩冲,用俗一点的话就是超越时代的,我们这个时代可能下不出来这个棋。”他形容当时的感受:“很震撼”,“就好像一个画家看到一个一百年后的艺术品。”“你说他超越了时代,但他在这个时代出现了,那他岂不是创造了一个时代?”“对,是这样的。围棋现在已经进入了智能围棋的时代。”李喆在日后的一篇文章中说,“人工智能,在迄今为止的工具进化史中,它的出现很晚。越晚出现的工具,力量通常会越强,人们对它的迷恋和恐惧也会越大。”怪兽长成记日,日本东京电气通信大学。加藤英树是UEC杯比赛会场上最忙碌的人。他是年纪最大的“参赛者”,要会友、社交、教徒、受访,还义务承担一些顺便的会务工作。朴廷桓和DeepZenGo的研发者加藤英树UEC杯是日本电气通信大学主办的机器围棋比赛,到2017年已经10届。在AlphaGo降临之前,这里是围棋AI最前沿的阵地。加藤英树是日本最强AI围棋DeepZenGo的代表,按照他的划分,年,AI围棋走过漫长的古典时代,人类将自己对围棋的理解,平移到AI围棋中,由于变化太多,逻辑复杂,这样的平移成果很差。随着2006年蒙特卡洛树搜索的出现,Zen诞生,UEC杯开办,见证了AI围棋急剧发展的时期。2016年DeepMind发表论文,AI围棋进入AlphaGo时代。AlphaGo的原理中既包含蒙特卡洛树搜索,又增加了政策网络和价值网络两个通过自我学习而构建起的神经网络,使得机器棋力突破职业水平的瓶颈,并以几何倍的速度日益进化。去年Zen受AlphaGo影响升级为DeepZenGo,实力亦大为增长。末代UEC杯开赛。从明年起,比赛将更换主办方。比赛的场面很松弛,程序员们穿着休闲装,正式开赛以后便把时间都交给机器,主人们三三俩俩聚在一起聊天。“这个圈子本来是很和气的一个圈子,不过今年变成两大怪兽对决。”来自台湾的旅日棋手王铭琬九段在与其他人交谈时说道,“那种感觉就是一个小村子的角力比赛,结果两大怪兽突然跑进来参赛。”往年机器赛毕会接受职业棋士指导一盘,而今年的冠亚军决出后几乎是以指导的姿态去跟职业棋手下。”“(过去跟现在)完全是两回事。”大概在六七年前,王铭琬担任UEC杯裁判长,那时候他最大的任务,是在机器中途停掉“不知道要怎么办”时,去评判谁赢谁输——就像踢足球踢不到90分钟就没体力踢下去了。对于半途而废局面胜负评判的争议,大家通常不太在乎。“参加这个棋赛的选手,大家都是同志,不是敌人。大家都为了提升电脑围棋,往一个目标去努力。”王铭琬说。加藤在现场指导初来参赛的大学生程序员也体现出这样的意味。今天强大的“怪兽”也是笨拙的过往积累出来的,即便在去年,Zen还需要被让三个子。今年实现互先,并互有胜负。雷米-库伦和黄士杰将蒙特卡洛树搜索用于围棋程序的先驱、法国人雷米-库伦(Rémi Coulom)今年的成绩不佳,只得到第五。雷米是Aja Huang的老师,Aja Huang是AlphaGo论文并列第一作者,AlphaGo的人肉臂黄士杰博士。雷米称对自己的成绩早有预料,因为没有用GPU(图形处理器Graphics Processing Unit的缩写)。“我的大部分业务还是售卖手机应用,手机上可没有GPU,所以我还是集中精力在如果在不使用GPU的情况下让软件变得更强。”42岁的法国人说,“也许是因为我变老了,我发现我对于激烈的竞争没有那么大的动力。我们会继续精进疯石,但我这么做是出于乐趣。”刚听说AlphaGo的消息时,他为Aja感到高兴,但同时也有一点难过,“因为这是一种终结……十年来,打败职业棋手一直是一个令人兴奋的目标。现在这一切都终结了。但是,没关系,我可以把注意力转移到其他项目上。”可能是语言的缘故,也可能出于腼腆,谈话间他会有很多踌躇。尤其是在被问到与Aja如今的联系时,雷米说,“是的,我们有联系,但是你知道,他们公司对员工对外交流控制得很严……有时候我会问他问题,他会说,’啊……可能……也许……’他啥也不能说。”这是独立开发者和大公司员工之间的距离。“新技术需要强大的计算力,所以我想大公司能够动用庞大的计算力,而我没有这样的途径。所以……作为一个个人研究者,现在已无力与大公司抗衡,但是,不管怎样,在计算机游戏的历史上,有的时候有好的想法比拥有强大的硬件要更重要。能够冒出好的想法依然还是让人心潮澎湃。”曾经在AI围棋界处于头号地位的Zen,是由尾岛阳儿和加藤英树两人自主开发。加藤10年前因过劳而患抑郁症,辞职后靠政府的残障年金过日子。遵医嘱的话,他每天只能工作3到4小时。但从UEC杯到接下来大阪举办的最强棋士战(中日韩棋手芈昱廷、井山裕太、朴廷桓迎战DeepZenGo),63岁的老人家要连轴转。如今DeepZen的研发经费还是出自小岛和加藤个人,加藤的经济收入主要来自讲演和热心人士捐助,加上早年研究所时代的积蓄。去年因AlphaGo带热人工智能而加入Zen团队工作的DOWANGO,主要负责向两位研发者提供服务器。抑郁症给加藤造成身体的损害是不可逆的,“脑子中有部分组织半永久不可复元了,血清素不足,神经传导受限,所以容易诱发睡眠障碍,一过劳就会晕倒。”加藤开玩笑说,人工智能火了之后,自己也成了人气明星,因为Zen,他的工作纷至沓来,简直“像艺人一样”,嗔怪Zen“真是一个耍得父母团团转的孩子啊!”从入行以来,加藤的动力始终没变,“人工智能研发至今都还没有大脑——我想给它植入一个!给围棋软件,植入一个真正意义上的聪明的大脑,这是我最初开始研发围棋人工智能的理由之一。标准19路的围棋很难,很难击败专业棋手,但AlphaGo在我没有想像到的,在ZEN的短板处增强了研发,击败了职业棋手,老实说,我很困惑。”“在我们IT或者计算机科学领域里面,毫无例外,重要的工作都是由公司来做。”人工智能专家、北京邮电大学教授刘知青说。他同时是北邮九鼎计算机围棋研究所所长。在程序世界里,存在着成千上万种编程语言,真正走进大众生活的,都是大公司出品,比如C++是实验室的,JAVA是甲骨文的,Windows是微软的……大学里的研究组也做,但影响都不及人们耳熟能详的这些产品,“因为这些东西除了科学上的进步之外,……它要数据的准备,它要计算资源,……大量的机器、人员、资金,方方面面的投入。”说到底,计算机科学不像数学领域,“证明”即达成。计算机科学始终要面对工程和效率的问题。在怪物养成记背后,是程序员个人选择的合集。刘知青在纽约大学念书时,亲眼目睹了两种选择下的人生道路。有的全职终身教授放弃了教职,去了贝尔实验室,“他们愿意在大的团队里面,做出一个更有影响的事情。”也有的人坚持留在大学里,做一般公司不太做的初期创新,这里包含了研究的自由。“最早的蒙特卡洛的方法,神经网络的方法,都是大学的研究团队来做的,并不是公司来做。只是当这些东西相对成熟了,那么大公司就把它拿来,做成一个有影响力的产品。”刘知青说。随着UEC杯的落幕,我与雷米谈起他对这个比赛最美好的记忆。他说:“我得过4次冠军。每次获胜都是很美好的记忆。事实上,我人生第一次来日本也是因为UEC杯主办者的邀请,多亏了UEC杯,我才能来日本,现在也和日本人做生意。我印象深刻的是,我第一次来日本。此前我从未到过亚洲。我生在法国。那是2007年(我来到日本),就好像发现了一个崭新的星球一样。”数与道的转化2015年,樊麾结束欧洲围棋大会后回到在法国的家。他收到一封邮件,英文的。他英文不好,一般这样的邮件会遭到无视。但谁知道为什么,他读了这封来自英国的邮件。邮件说,我们是一家伦敦的公司,想邀请你来看一看。樊麾跟他们开了线上会议,上网搜了公司主页,看到了上面有围棋,说服自己相信收到了一个真实的邀请。英国人告诉这位早年在中国成为职业二段后远渡重洋在法国为围棋开枝散叶的棋手、教练,希望他辅助他们研究机器围棋。樊麾一度设想自己会浑身插满设备,用以导出下棋时的思考方式。而最终他要做的非常简单:跟程序下棋。他很轻松地说,要一个小时就够了。 2015年10月,正在与AlphaGo苦战当中的樊麾(右一)。他第一次跟机器下棋在2015年的法国。一开始机器运转的声音很平缓,对弈时,机器的响声变得剧烈起来,听上去仿佛真的有脑浆在翻滚在思考。他以为,类似的经验,平移到英国,就可以。在他的概念里,人类棋手强于全局观,能用组织化的思维看待各个要素,所以在与AlphaGo的第一局比赛时,“我下得很有全局观,下得很慢,不急于进攻。”对局中,他渐渐发现,AlphaGo要的,跟他一样。比赛的结果全世界都知道了,5:0,AlphaGo完胜。跟AlphaGo对弈之后,“我内心的围棋世界坍塌了”。其后樊麾参加一项重要的欧洲比赛,每局45分钟的时限,加上被AlphaGo沉重打击的内心,他几乎没有信心参赛。“但非常奇怪的事情发生了——我赢了所有的比赛,非常轻易的。我努力想要弄清楚到底发生了什么。我看到我和AlphaGo的比赛,找到了一个新的视角来看我自己的比赛。”樊麾在波士顿大学演讲时道出了自己的故事。“当你学围棋的时候,你学的第一件事是定式、布局,好的方向,好的形状。第二步就是怎么样最好地利用这些形状。但这些还远远不够。如果你想打败大师,你必须忘记你之前学的所有的东西。因为你学的所有东西都像一个笼子一样,把你关在里面……你想的是定式是什么,布局是什么,有时你忘了如何才能让这些棋子联合生效,这就是为什么,当我和AlphaGo比完赛之后,我觉得世界坍塌了,但同时建立起了新的东西,现在我下起棋来完全自由了。”这个自由的故事为他赢得了掌声。他在AlphaGo的V18版本中经历和思考的,世界顶级棋手们在V25及此后的版本中,逐渐体味。“最开始看到当然觉得不能理解,觉得不知道好在哪。但是他就在你不知道他哪里好的时候他就赢了。所以再多看了一些之后,虽然你不理解他好在哪,但他就是这么下就可以赢。所以你就想办法慢慢去理解呗。越来越感受到他的强。”周睿羊九段说,“一开始感觉很难接受这个东西,但是越来越觉得自己理解得太浅太浅了,对围棋的理解。越来越觉得自己还是太弱。”国际象棋领域很早就引入计算机辅助棋手训练,计算机的棋力早已做到可以让职业高手一马。从项目本身的复杂程度来说,国际象棋要稍逊于围棋,因此对于定式和原则的限定会更明确,在这样的背景下,被计算机攻破职业堡垒后,人与机器达到接受与融合,部分定式废止,公认的和棋被推翻,人类的棋力也得到大幅提高。某种程度上,国际象棋已经成为围棋的前车之鉴。颠覆会带来震荡,认知上的震荡,表面不彰,内心翻滚澎湃。“这个我倒不觉得是打击,我倒觉得是挺兴奋的一个事情,这太有趣了。如果没有它的话,我们可能一百年之后,一上来还不敢用点三三。其实它点三三之后我们都明白它为什么点三三,它不扳粘,它是有它的很明显的道理的,但是由于我们的惯性思维,点三三之后一定会扳粘的,习惯了,那样的话我们就不会去点三三。”李喆六段说。开局不久点三三已经成为多位职业棋手在大赛中尝试运用的新招法。“我觉得很有意思的是,我之前有一个同学拍了一个毕业作品,是讲的吴清源和秀哉的那盘棋,里面引用了一句话,三三的弱点是星位,星位的弱点是三三,现在Master或者是AlphaGo很好地去证明了这一点。因为以前讲星位的弱点是三三,更多的意思是抽象的,脚步很空虚,不踏实的。但是现在三三可以直接肩冲,星位可以直接点三三,但是并不能证明星位和三三就不好了。这其实是一个很辩证的东西,很有意思。我觉得围棋里充满了这样的东西。”“研究机器的招法的乐趣在于什么?”“研究机器的招法的乐趣在于把它转化成我能理解的思维方式。”李喆在此前做了七路围棋研究,整个棋盘全部算清,一比较就知道下哪个点。到十九路围棋,人已经算不清了,“我们就说这个地方是厚还是薄,这个地方是虚还是实,我用什么样的策略。”“人工智能体现出来的其实更趋近于第一种思路,虽然它也达不到穷尽,但它还是基于数的一种,最后是胜率的比较。”总之,“在能够用数学达到的地方,就用数学去达到它,我们在数学达不到的地方,我们用道的方式来理解,道理的方式更模糊,但是更具有普遍性,认识围棋也是这样。”人工智能本身不是在创造,它只是一个算法,但作为接收方,我们以人的方式理解,这就构成了“数和道的对话”,“用我们的道理的方式理解它的创造性,就会变成我们自己的吸收,我觉得这个是非常非常有意义的事情。”“人是没有出路的”2016年11月。60岁的日本棋手赵治勋九段对DeepZenGo的电王战中,DeepZen显示胜率超过50%的情况下,加藤代表主动认负,引起争议。“一般来说是将胜率预测设定在某一特定数值,比方说30%(低于30%则机器认负)。但如果在胜率预测40%的时候,我感觉盘面比较艰难,也会武断地决定投子认输。这种灵活的判断,还是只有人类能做,机器不灵......所以基本上是由我来作出判断的。……总之,认输这件事,目前还是需要研发团队来作出判断,而不是交给AI围棋本身。我听说AlphaGo的这个数值是10%,我不太喜欢这个,这里还是有文化差异的吧,日本和欧美对围棋文化的理解不同。在日本,有’玷污棋谱’一说,如果最后的棋型走得很奇怪的话,对围棋是一种亵渎。日本有这样的传统。”对此,刘知青则表示反对,“我觉得把它中断下来是不合适的,因为我作为一个科研人员来看它,这是一个测试过程,我希望能够展现它的弱点是什么。加藤把它停下来了,其实是阻碍它的弱点的暴露。”另有观点认为,加藤替机器做决定,可能使机器丧失原本运筹的取胜机会。加藤也承认,自己电王战时意识还停留在机器水平大幅落后于人类棋手时期,认为死磨硬泡等待对手犯错与玷污棋谱无异,“现在回过头来,我觉得那个时候,就有必要修改认输机制了——因为到了互先,你是可以等待对方出错的,这没有关系。然而我当时并没意识到。……(不过)有这种(原本胜机丧失掉)可能也没有什么。本来就是研发者在承担所有的责任。比方说,如果在对弈过程中,程序出现BUG,然后AI围棋输了,这些责任都是研发者在承担。最后的认输判断也不例外。说到底,一切交由AI,也是研发者作出的判断。”刘知青反对:“你没有决定权,当它下棋的时候,你已经没有决定权了”“你替他认输,真是有悖于科学的道理,……你要看AlphaGo被李世石击败的时候,它是怎么下荒唐棋的,这个是我们为数不多的一个机会见到这件事,你不让它(继续下),怎么办?”科学精神、人类的自主权,人对工具的态度,与工具的关系,与自我和认知紧密相联。有人工智能专家曾经预言,如果制造出能战胜职业棋手的国际象棋AI,那么后者一定具备从战略素养到战术能力的全方位的强人工智能。事情并未这样发展,但结果是人类收获了足以辅佐其棋艺精进的机器。跟国际象棋AI类似,围棋AI并非从人类总结出的棋理逻辑出发来构建,而是将人下棋的过程,拆解出大量的对弈积累(政策网络),识别形状的好坏(价值网络),对变化的可能性进行有效筛选剪枝后随机搜索验证(蒙特卡洛树搜索),得出人看来最优化的一步(胜率最高)落子。“AlphaGo(围棋行为的输入和输出)的过程,它也可以更好地揭示了人下围棋的过程。”刘知青说,这反过来让我们“对于人类思考的一种方式,可能有个更深的、更本质的理解,我觉得这个意义上可能更重大一点。……曾经认为围棋就是一个神圣的东西,其实它不是,或者说认为我们大脑思维是一种神圣的东西,其实也不是,它是一个神经系统的物理过程,但可能超出了普通的认识,但是也不是一个不可超越的或者是神秘的过程,现在我们可以看到,所有的这些物理过程都不是神秘的,我们有更好的认识,而且是可以复制他们的,而且可以超越他们的。”这样的认知、复制和超越的过程,使得人工智能由弱变强,终极问题随之诞生:最终人工智能会导向何种归宿呢?乐观的观点是工具强大且受人控制,为人服务。悲观的入特斯拉的老板Elon Musk,他认为最好的情况是,人成为机器的宠物。霍金也对人类未来的掌控权担忧。“我觉得首先这个东西好坏不讲,这个趋势是必然的,就是说这个是必然的方向,无论好坏。”刘知青认为,纵然前途未知,人类却仍然会将人工智能发展下去,并承担好与坏可能性的并存。“人必须要做。因为人要竞争。你竞争就得利用这个东西,除非你不竞争了,你说我放弃,没有人愿意放弃,你要竞争,你必须要做这个事情,除非你说跟我无关,我这人放弃了,但是只要你想竞争,你必须要利用机器,你利用这个机器的时候,你就要促进它的发展,这个机器肯定会越来越强,这个与你一直无关吗?”“其实是人性促使了这个东西?”“是的。人是没有出路的。……人在借助这样的工具,你没有办法(避免争夺掌控权)。”人类亲手为自己开创了一个未知的结局。在刘志清看来,意义更多地落于奔向这个结局的过程:“我们是通过人工智能的研究,通过机器的发展,也是认识人的局限性、人的能量、人的地位,其实都是认识我们自己,认识到我们自己。”自由的人从小下棋,国家队10年,有个问题一直困惑着李喆——下棋的社会意义是什么?父母亲是医生、教师,他们的社会意义很好理解。棋手成天下棋,为了什么?追寻棋道吗?那么,棋道又是什么?是胜负吗?当一位棋手年纪渐长,反应速度变慢,计算力下降,无法在现有的竞技体系中获取胜利了,那他(她)追求的就不是棋道了吗?李喆跟时越、朴文垚等棋手朋友探讨过这个问题,没谁说得清。他去看书找答案,获得一些启发,但难以系统。所以,当读大学的机会降临时,他毫不犹豫地选择暂别竞技体系,那时他的等级分排在全国前三,距离世界冠军并不远。AlphaGo的降临成为棋手参悟围棋、理解自身与社会关系的重大机会。“我们对于围棋的认识有了更趋近真理的方法,之前从来不知道我们对围棋的认识到底达到一个什么程度,有了这个之后,可能有了更好的参照,有更好的帮助我们去理解。”李喆说。AlphaGo是用强大到深不可测的棋力来给人们提供参照的。“AlphaGo的棋风可能是千变万化的,没有什么是它的棋风。它没有棋风,随心(所欲)。”周睿羊说,“看到它朴实地下,就可以赢,就是美啊。”“对你来说,它是一个棋手吗?”“当然……是。对于我们现在来说,它就是神。”罗洗河九段受邀参与人工智能围棋的研制和测试时,旁人为了增加产品与工作人员的亲近感,说,我们把产品当孩子一样养大吧。罗洗河说,我不这么认为,“我就是在造神”。一年多的工作下来,罗说,“造神是无法求证的理想。不断的更近一些也是很美妙的。”跟很多棋手的感知相反,围棋AI给王铭琬的启示是,“不用那么怀疑自己”,“其实我个人下棋一开始还是蛮有用概率性的想法去下去。”这位本因坊战、王座战、日本大师赛冠军,圈中人称“怪腕”的棋手说,“因为我本身并不是那种一流的棋手,运气好的时候拿一两个头衔。我跟柯洁、赵志勋一开始就站在不一样的地方在看这个围棋。柯洁是以下赢为目的,而我只觉得,下完了……只要好玩就好了。……围棋电脑到现在并没有告诉人到现在人对围棋的看法和研究是没有用的,正好是相反,这个方向是没错的……以前自己对这个方向的努力还不够。”在王铭琬看来,“围棋的目的不是为了打败对方,而是双方共同创出的一个时间跟作品。从这个方面来说,电脑打败人类,是让人类回归原点。”胜负只是一个人为的机制,“说人类很注重胜负只是因为它容易报道,容易理解,并不是说人类真的只喜欢胜负,要是脱离了胜负这个桎梏、枷锁的话,说不定会有更自由的发挥,是(我)自己抱有的看法。”围棋传媒有个经典问题:如果有“围棋上帝”,你认为自己跟祂有多大差距?在AlphaGo出现之后,棋手们对这个问题的答案有了更谦逊,同时又包含更多可能性的回答和思考。 正在与DeepzenGo对弈的赵治勋(右)“人很难去评判有没有上帝这回事。但上帝,确实是迟迟不肯露脸的那个存在,不肯跟我们人类棋手一起切磋,一切喝酒聊天。但AI出来了,至少在形式上是看得见摸得着的。它比人类更强大,比李世石、柯洁更强大,成了一种类似上帝般的存在,然后我们人类为了接近它,努力去追赶去超越。这跟从前不一样的。从前的话,一旦成了人类中的最强棋手,就会以为老子天下第一,不得了了。但现在,AI来袭!它或许就是上帝的化身,是看得见摸得着的上帝。而因为看得见,它吸引着我们人类棋手去靠近它。从前看不见,所以人类就在那里坐等着。在未来的围棋世界,就算你达到人类棋手之最了,你未必是围棋世界之最,就会激发起你的上进心。而不像从前,自以为老子天下第一,你会变得谦卑,用心精进。这,我觉得实在太有趣了!”韩国旅日的超一流棋手、日本棋战获头衔次数最多的棋手赵治勋九段说。作为一个传奇人物,他在当下最传奇的事情莫过于,没有手机。“在日本,没有手机的恐怕也只有我一个了(笑)。因为我不会弄手机,对我纯属浪费。”这个没有通讯工具的人,我们只有在棋赛上才得一见。在3月日本大阪举行的最强棋士战中,赵治勋出任裁判长。循惯例,日本大赛会举行前夜祭。标志性的蓬乱的头发,红润的面色,赵治勋在舞台中央妙语连珠,活像得到了落语大师的真传。前夜祭上每个人都着正装出席,加藤英树先生也脱下围棋AI大赛上的休闲打扮,换上笔挺光鲜的西装。在性质不同的比赛中快速切换,让人难免有恍惚之感。世界似乎越来越大,在思维层面上,我们拥有不断被解放出来的自由。“如果可以选择,您更愿意做很老实但很少犯错无懈可击不知疲倦的AI围棋棋手,还是很狡猾但会犯错的人类棋手?”这个问题只提给过老顽童赵治勋。“我宁愿当个人,下棋有输的时候,也有赢的时候。输棋的时候我总会非常非常悲伤,简直就是世界末日。但正因为这样,所以赢棋时的快乐,就是百倍的。而如果是一直赢下去,永远不会输的话,恐怕太无趣了。所以我想当人。”赵治勋说。他还拥有着为人的任性。在严肃阐述了AlphaGo的强大之后,他说,“如果代表人类出战的是柯洁,我相信他将百分百战胜AI围棋。”理由也是百分百人的理由,“我坚信柯洁能赢。因为我跟他关系很好。这不是玩笑话。柯洁才19岁。我从前也有过一阵棋力还算强的时候。按道理说,柯洁不可能知道我,可是在某些聚会中见面,他都会主动跟我打招呼,向我问好,我非常非常开心!真的。我一直以为他不可能知道我这个人的......我是柯洁的粉丝!”而在昨天的第一局较量后,执黑以1/4子惜败的柯洁表示:“(自己)输得没什么脾气。”。(杨昕雨对本文亦有贡献。感谢常昊、周睿羊、李喆、刘知青、华学明、张大勇、谢锐、王煜辉、房学峰、王平、加藤英树、芈昱廷、赵治勋、王铭琬、俞斌、马林、罗洗河、雷米-库伦受访)
正文已结束,您可以按alt+4进行评论
责任编辑:jerfguo
扫一扫,用手机看新闻!
用微信扫描还可以
分享至好友和朋友圈
中国公开赛
美国大师赛
F1中国大奖赛
F1巴林大奖赛
钻石联赛上海站
F1西班牙大奖赛
法国网球公开赛
Copyright & 1998 - 2018 Tencent. All Rights Reserved

我要回帖

更多关于 手机版最强围棋软件 的文章

 

随机推荐