热火朝天的近义词“人机大战”究竟有什么意义

&figure&&img src=&https://pic2.zhimg.com/v2-efe64a69e092cfcfe682_b.jpg& data-rawwidth=&1280& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/v2-efe64a69e092cfcfe682_r.jpg&&&/figure&&blockquote&按:这是最近某次在北大宣(hu)讲(you)人工智能的录音记录。我在整理出的文字基础上稍稍作了删减和补充——作为一个不发paper不懂科研,只把机器学习当工具的工程码农,也只能这样从应用角度出发来提(lan)纲(yu)挈(chong)领(shu)了 :-)&/blockquote&&p&刚刚大家看了创新工场相关的视频,里面有一家叫美图的公司。美图马上就要在香港上市了(12月15日,美图公司正式上市),这是创新工场投资的一个开始成长为独角兽的公司。&/p&&p&其实,美图也是一家AI公司,有非常多的可以用人工智能的地方,最典型的的就是人脸识别。除此之外,还有很多可以应用AI的地方,比如,传统的磨皮是典型的数字图像处理算法,但是不是也可以用人工智能技术来改进呢?让机器学习什么是最白最美的皮肤,什么样的磨皮方式和现在要处理的皮肤是最匹配的。这样,就能既做了脸部美容,又因人而异,保持每个人的皮肤和脸型特点。&/p&&p&美图有世界上最大的人脸数据库,也许其中女性脸部居多,但也因此有非常广泛的人工智能应用场景。在这样的创业公司里面,人工智能变成了公司的内在驱动力。而美图本身就是一个非常技术化的公司,美图上市后,未来的发展一定会不断引入新的人工智能技术。&/p&&p&所以,今天我想跟大家讨论的主题就是科研和创业的关系,它的核心话题是人工智能。大家都知道现在是人工智能的黄金时代,那科研里面人工智能的角色是什么?创业里面人工智能的角色是什么?人工智能如何从书本上跳到真实挣钱的公司产业,能够创造出许多既赚钱,又实现人生梦想的企业家和创业者呢?&/p&&h2&什么是人工智能?&/h2&&p&这个问题,我觉得对计算机专业以外的人和计算机专业内的人,对不懂机器学习的人和懂机器学习的人,得到的答案未必是一样的。而且我相信,即便是同样学计算机的人,即便是同样懂得机器学习或者深度学习的人,对于什么是人工智能,给出的答案也未必是一样的。&/p&&p&很多人说人工智能的时候,脑子里会出现一个像人一样的机器人。这个图景在科幻小说里比较常见,在科幻电影里比较常见。但不要把它想象成,仅仅是非专业人才会想象的一个途径,专业人为什么不能想象这样的人工智能定义?&/p&&p&专业人士天天看教科书,看数学公式。可是你看这些数学公式的时候,有没有想过,这些东西未来的某一年会不会突破某一个临界点?会不会让你做的一个程序变得真正和人一样聪明,甚至比人还聪明?如果你的答案是“会”,那么为什么?如果你的答案是“不会”,那么又是为什么?&/p&&p&我们完全可以从数学的角度,从计算机科学的角度去想一想这些理论上的问题成立不成立。我们应该建立一些相对比较科学的逻辑,就是当你去看待人工智能是什么时候,你应该有你自己科学的逻辑,有你自己科学的认识,或者说你自己科学的定义,然后从科学的角度,判断人工智能技术会不会突破临界点。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-3f489f6dab6d88b2e3406_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic1.zhimg.com/v2-3f489f6dab6d88b2e3406_r.jpg&&&/figure&&p&今天流行的深度学习技术是机器学习算法的一种。而机器学习从本质上来说,其实就是用数学或计算机科学的手段,对世界的局部或整体进行建模。如果世界简单到黑白分明,那一个简单的线性函数就能描述这个世界。但我们要处理的局部世界的问题总是越来越复杂的,因此就需要越来越复杂的算法、函数来描述这个世界。&/p&&p&深度学习之所以取得这么大的进展,主要还是因为深度学习提供了一种非常丰富的、非常有描述能力的建模方式。比如许多许多层的神经网络结构可以模拟非常复杂的世界规律。&/p&&p&学数学的、学计算机科学的同学不妨在脑子里做一个头脑实验:如果深度学习的网络结构是可以不断扩展的,那么,多复杂的神经网络才可以描述我们身边的真实世界?这一方面取决于实现深度神经网络的计算结构、计算能力是不是真的可以不断扩展,另一方面取决于我们如何理解这个宇宙的复杂度。&/p&&p&假设你的答案是,深度学习在未来可以通过不断扩展,达到描述这个真实宇宙的能力,那不用说,基于深度学习的人工智能算法一定会超越人类的智慧。因为人只不过是这个宇宙中的一部分,人的智慧也不过是建立在对身边这个真实世界的建模的基础上。当然,你的答案也可能是否定的。但这个头脑实验会是个非常有意思的实验。&/p&&h2&人工智能就在我们身边&/h2&&p&当我们把人工智能定义成依赖于机器学习为主的技术,来拟合世界的一部分,就会发现,这样一个定义可以很自然地应用到我们的生活中。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-d7d073f6bd6d8c4f63f7ec04ed92270b_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic4.zhimg.com/v2-d7d073f6bd6d8c4f63f7ec04ed92270b_r.jpg&&&/figure&&p&这是一个手机截屏的图片,可以看到,这个手机上装了非常多的应用。&/p&&p&事实上,当我们在用手机的时候,很多常见的应用,已经嵌入了人工智能的特点和特性。比如说微软小冰可以跟用户聊天;滴滴出行、亚马逊购物这些应用里面的一些推荐算法都会自动推荐最好的产品,或给出租车司机安排一些最好的路线;而Google、百度这样的搜索引擎本身,事实上已经是人工智能驱动的了,无论是搜索结果的排序,还是搜索引擎智能回答一些人类问题,这背后,都是基于机器学习的人工智能技术。&/p&&h2&人工智能的历史&/h2&&p&我们基本可以把人工智能的发展划分为三次热潮,每次热潮其实不太一样,但贯穿这三次浪潮的,有一个很有意思的现象,就是都有下棋这件事。下棋是人工智能的研究者最爱用来展示人工智能技术的一个领域。原因在于,一方面,下棋是人类智慧的一个体现,机器一旦在这个领域取得突破,所有人都会觉得很吃惊,另一方面,解决机器下棋的问题,涉及人工智能研究的许多根本性技术,像搜索啊,贪心算法啊,强化学习啊,等等。&/p&&p&五六十年代的人工智能大师在通用计算机刚刚诞生不久、计算能力还非常有限的条件下,纯粹通过数学或者非常原始的编程模型去实现他们心目中的人工智能。早在那个时候,那些人工智能大师就已经看到了下棋这件事。图灵曾在他生命的最后几年,在纸上写过一个可以实现国际象棋原理的代码,只是当时的计算机的处理能力不够,这个代码没有办法变成一个真正的可以与人下棋的程序。&/p&&p&实际上,五六十年代有一种比较适合当时计算机能力的棋类,叫西洋跳棋。计算机的西洋跳棋程序曾经在五六十年代战胜了一个人类的专业西洋跳棋棋手。虽说对手在专业级别水平也不算很高,但当时的电脑,你们想象一下,是什么样的,电脑处理能力又是什么样子。电脑战胜了人,所以在当时是一个小小的轰动事件,意味着人们已经开始关注人工智能。&/p&&p&当西洋跳棋胜人之后,人们会说,计算机好厉害,是不是要毁灭人类了。可没过几年,人们就会说,西洋跳棋太简单了,国际象棋这种才能代表人类智慧。计算机不是厉害么,那么你下个国际象棋试试?&/p&&p&后面的故事大家都知道了。1997年IBM的深蓝战胜世界棋王卡斯帕罗夫。那时候,我在读大学,那件事给我的震撼,给我们这些懂编程的人的震撼,一点都不亚于今年3月AlphaGo战胜李世石时带给我们的震撼。&/p&&p&可没过几年,人们又觉得,战胜国际象棋的计算机程序其实也算不了什么。我们人类不是还有围棋吗?今年3月以前,很多围棋培训班的老师都会对孩子们说,围棋是目前唯一一种没有被计算机攻破的人类智慧运动。可结果呢?&/p&&figure&&img src=&https://pic4.zhimg.com/v2-962e3611ed4dab3b8feca09d1de92a4d_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic4.zhimg.com/v2-962e3611ed4dab3b8feca09d1de92a4d_r.jpg&&&/figure&&p&这种所谓人类的智慧游戏贯穿着机器的AI发展史,成为技术人员和普通人的认知能力之间的一个非常好的桥梁。你给普通人讲人脸识别,他最多会当作一个计算机的技能,就像所有的停车场都会识别车牌一样,他不会觉得这个东西有多困难。一张人脸,普通人只会把它理解成鼻子、眼睛嘴巴。很多不会下围棋的人,认为围棋也不过如此,但会下围棋的知道围棋的深浅是深不可测的。所以一旦计算机在围棋上赢了人类,那人类受到的震撼远远不是一般的技术超过人类所能够比拟的。&/p&&p&我讲历史,只是想告诉大家,人类是一个健忘的动物,也是一个喜新厌旧的动物。设想一下,过两年AlphaGo已经远远超过所有人类棋手,连手机上的围棋也可以轻松打败人类的九段,那时候人类还是会说,围棋算什么,围棋可不能算人工智能,这个东西太简单了,计算机必须拿出更大的本事来,才能被称作人工智能。&/p&&p&很有意思,人类就是这么嘴硬。当然,这也可以认为是普通人对于人工智能定义的自适应性,就是根本没有一个量化的标准。计算机智能在不断发展,但到底发展到什么程度,才是普通人心中的人工智能呢?这个尺子一直在变。&/p&&h2&深度学习的复兴&/h2&&p&从技术本源上说,深度学习有好几十年的历史。但2006年,才是深度学习复兴的一个标志性的年代。这不完全是因为深度学习的大师Geoffrey Hinton在这一年发表了那篇著名的深度学习论文,其实,在2006年前后,深度学习赖以发展的大数据、计算能力、移动互联网等等,都开始发展和成熟起来。&/p&&p&从2006年开始,业界慢慢具备了大数据的能力和计算能力。对世界建模的前提是这个世界要有丰富的数据供计算机来学习。但是在2006年以前,这个数据是非常非常匮乏的,这个世界拥有数据,但这个数据未必能够被数字化,或者未必能够数字化之后未必能够被收集起来。&/p&&p&那么2006年前后,产业革命发生了非常大的变化,我相信大家能够想到一些,一个非常大的要点就是搜索引擎,搜索引擎起到了把大数据聚合起来一个提纲挈领的作用,它把所有的网上信息都聚合在一起了。&/p&&p&另一个非常有标志性的技术进步就是移动互联网。移动互联网让我们每个人都可以非常方便地为这些大数据库来贡献数据。你在网上的每一次购物,每一次打车,每一次点击行为都会变成大数据的一部分。&/p&&p&有了这些大数据,也有了一定的计算能力,深度学习就有了用武之地,这是深度学习复兴的根本。&/p&&h2&第三次AI热潮有何不同?&/h2&&p&有人说现在人工智能这么火,这么多人给出高价来招聘人才,这么多创业公司这么多钱堆上去,这次的人工智能浪潮会不会又像前两次一样,马上就跌入低谷,没有后续了呢?&/p&&p&我们不是未来预测学家,也没法预测未来,但是我可以给大家一个我们创新工场的判断。&/p&&p&第三次人工智能浪潮和前两次相比,有着本质的不同,这是因为,在很多的垂直领域,人工智能第一次展现出来计算机能把一件事做到足够好的能力。&/p&&p&至少在语音、在视觉等垂直领域,计算机做的事情都可以超过人类的心理阈值。是否超过心理阈值,是人们是否接受你的产品,接受你的技术的一个前提条件。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-c15feebd32f8e69a356cd1c_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic2.zhimg.com/v2-c15feebd32f8e69a356cd1c_r.jpg&&&/figure&&p&比如语音识别,人类对语音识别的准确率一定会有一个心理阈值。一旦你低于这个阈值,不管你是低1%还是低50%,人们都会认为这个产品是没用的。只有你高于这个阈值,人们才认为这个产品是有用的。&/p&&p&至少在视觉领域,在语音识别领域,在深度学习工作得非常好的领域,第一次第二次人工智能浪潮的时候,这些技术虽然发展到了一定的高度,但是还没有达到人类的心理阈值。&/p&&p&而第三次人工智能浪潮非常不一样。&/p&&p&大家可以回想一下2014年这个时间节点,普通人大概是在2016年知道人工智能这件事。但科研界的人更多的看到的是科研数据上的突破。比如机器视觉,科研界通常用ImageNet视觉比赛的结果来衡量机器视觉的发展程度。恰恰是在2014年,基于深度学习的计算机算法在ImageNet上超越了人类,一下子将识别错误率降低到了比人类识别错误率还低的程度。&/p&&p&一张图片上有多少个人脸,有很多相对模糊或者相对阴暗的人脸,人可能都未必分得出来的时候,计算机就认出来了。在这种情况下,说明计算机在视觉领域解决方案达到的程度已经超过了人们的心理阈值。所以人一下就感觉这个东西有用了。&/p&&p&这是我们想说的第三次人工智能浪潮和前两次浪潮的本质不同。这个本质不同带来的结果是,计算机人工智能的程序,人工智能的应用真正能在商业领域开花结果,能在商业模式里赚到钱了。以前是拿人工智能“骗钱”的,现在是拿人工智能赚钱的。&/p&&p&所以会说从2006年开始的这样一个第三次人工智能浪潮,创新工场非常确信它会是一个产业革命,会进入一个稳健的发展、成熟期,而不是一个昙花一现的浪潮。原因就是我刚才说的,在很多领域,它已经超过了人的心理阈值,已经变成了一个可以用的算法或者说可以用的工具。&/p&&h2&AI时代的创业和投资&/h2&&p&刚刚提到深度学习复兴,其实在人工智能的第三波浪潮,它做到了在多个领域超越人类的心理阈值,并开始创造商业价值。这些领域可能包括识别领域、自动化领域、互联网大数据领域。而深度学习,或者说人工智能正在解决这些领域里的问题。&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-c1a4db028fe459f957f683_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic1.zhimg.com/v2-c1a4db028fe459f957f683_r.jpg&&&/figure&&p&如果说在这些领域里面比较一下,我们认为可能未来最大的领域是无人驾驶。为什么说人工智能可以代替司机?我不知道大家对人工智能或者说无人驾驶,是怎么预期的。是预期每天去哪里都有无人驾驶车来接你,还是会预期每个人家里买一辆无人驾驶汽车?&/p&&p&业界主流的判断会认为,无人驾驶会首先从一些限定领域进入我们的生活。比如说在美国,现在业界看好几个无人驾驶落地、产生商业模式的机会,其中之一就是货车运输。因为货车运输相比较来说有固定路线,同时对人类来讲,货车运输是一个非常艰苦的工作。货车运输用无人驾驶可以大大提高效率。&/p&&p&在美国实验过,把若干辆货车编排成一个车队,货车之间间隔2米或1米,然后在路上就像一个火车一样。只有最前面的货车有一个人类的司机帮忙监控一下,后面的货车都跟着前面的货车的行为来走,可以保证不会追尾,然后快速地把大量的货物像火车一样,从一个地方运到另一个地方。&/p&&p&所以这是美国人非常看好的一个无人驾驶的应用领域,但我觉得这未必是中国的第一个应用领域。中国有中国的特点,很多中国的无人驾驶公司已经在设想许多特定的领域,开展最早的无人驾驶商用化的实验。&/p&&p&比如说,在我们北大的校园里,先把校车做成无人驾驶。校车的好处是路线固定,范围固定,时间固定,就连校车能够遇到的交通标志和障碍都是已经确定的。那么在这个基础上,要解决的问题相对简单得多。&/p&&p&所以人工智能取代人类一定是一步一步的,绝不会有一天,你睡觉起来发现楼下司机全没了,全变成无人驾驶的,这是不可能的。当无人驾驶在生活中潜移默化地一步步取代你的时候,甚至你都感觉不到人工智能来了,你会说什么智能,不就是开校车吗,这不叫无人驾驶。&/p&&p&直到有一天,无人驾驶的出租车来接你了,你可能也未必觉得它是人工智能。这个例子只是告诉大家,就是人工智能会悄悄地成为我们人类的帮手,甚至在你无法觉察的时候。&/p&&p&但是对于我们专业的人来说,我们应该尽量留意这些事情,尽量去看到什么东西可以给我们创造机会,什么东西有潜在的商业价值,而自己应该在里面扮演什么角色。&/p&&p&其实,计算机的发展经历了非常明显的时代化。在每一个时代,只有一种技术可以主导,也只有符合时代技术潮流的公司才能生存下来。在1990年做人工智能,敌不过那些做PC和互联网的,但是今天就不同了。今天已经不是PC时代或早期的互联网时代了。今天,你能跟联想抢PC的生意吗,能跟戴尔抢显示器的生意吗,能跟百度抢搜索引擎的生意吗?作为创业者,必须在最好的时代做这个时代里最有机会发展起来的事情。&/p&&p&创新工场认为,当今时代的主流方向是人工智能。&/p&&p&未来5到10年甚至更长一段时间的主流是人工智能,如果你们有创业的理想,恰好又学过人工智能,那就处在了一个非常好的,也是非常有挑战的位置上。这个时代正在召唤创业者,这个时代正在召唤像PC时代的柳传志,互联网时代的李彦宏,移动互联网时代的王兴那样的创业者,来投入到人工智能的创业浪潮中。这个未来的创业明星,也许就在你们中间。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-a669be5edd61aeb0356fa_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic1.zhimg.com/v2-a669be5edd61aeb0356fa_r.jpg&&&/figure&&p&创新工场会把一个新兴的产业,比如人工智能,按照架构分成不同的部分。在不同的部分,会有不同层级的公司进行创业,从而搭建整个生态环境。这种划分是我们创新工场,用来指导人工智能投资的基本原则,在每一种细分领域,都有可能创造出很多十亿级别百亿级别,甚至万亿级别的初创公司。&/p&&p&一个最有趣的例子是Google。我在Google的时候很多事情未必看得那么透,但是我离开后,从局外人的思路看很多事情,会看到一些规划确实高人一筹。比如说,当年Google和百度一样都是在做桌面搜索引擎,但是Google是第一个从桌面搜索引擎提出了移动优先的策略,这为移动互联网打下了非常扎实的基础。同样的,Google在2011年就开始做谷歌大脑,在2012年就提出了AI First的战略,基本是走在了所有科技公司的最前面。&/p&&p&Google每一个产品,只要能和人工智能结合的,它都会选择结合。因为人工智能会在很多领域提供一些高级算法。在座的学过深度学习的应该比较清楚,深度学习的平台化是一个非常大的挑战。我相信在未来3年左右的时间,会有一个非常彻底的改观。因为很多公司包括谷歌在内都在大力地做这些方面的事情。其次呢,深度学习需要大量的数据,可能要百万千万甚至亿级数据,才能达到一个非常非常好的效果。但其实,有些领域根本就没有所谓的海量数据,更不要说大数据了。那反过来讲呢,深度学习这种对人类世界的建模方式,是唯一的建模方式吗?我觉得未必,在未来几年,大家可能会发明出更好的建模方式,去适应那些缺乏大数据的领域。&/p&&p&机器虽然在模仿人,但其实只是模仿人的一部分。人的学习有一个非常大的特性,叫举一反三。我们家孩子只有5岁,可是我清楚地记得他两岁的时候,我带他去商店里,看到小孩玩的那种滑板,他就看了一眼。然后过了很久,他又到一个场合看到了一个不一样的滑板,他马上就说,这是滑板。而计算机视觉程序,这些对象识别程序要学上百万张滑板才能辨别出来。这是计算机和人一个非常大的差异。&/p&&p&大家应该知道,现在正在研究的许多热门领域,比如迁移学习,比如少样本情况下的机器学习算法等等,就是让机器来更好地模仿人类的智慧,而不是必须有巨大样本量的情况下才能学到东西。&/p&&h2&创新工场AI布局蓝图&/h2&&p&这是创新工场,为人工智能未来的发展和投资所画的一个蓝图。这也许是今天我的演讲里最重要的一张图。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-98c45dc1c6bf96afa76d_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic3.zhimg.com/v2-98c45dc1c6bf96afa76d_r.jpg&&&/figure&&p&这是我们对机器学习对深度学习,对人工智能在各个垂直领域,在不同的应用场景,几年内走向成熟,几年内走向产业化的一个预判。大家可以5到10年后再拿出这张图来看一下,看看创新工场的对未来的感知,是不是像当年对移动互联网未来的感知那么准。&/p&&p&这是创新工场目前在人工智能的布局。右边的方案是我们正在投资或者已经投资的人工智能的公司,这里面有很多公司已经发展得非常好。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-73b59a16dd31ce11b1a1c9ae4896a3fa_b.jpg& data-rawwidth=&865& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&https://pic4.zhimg.com/v2-73b59a16dd31ce11b1a1c9ae4896a3fa_r.jpg&&&/figure&&p&比如旷视,美图,驭势,第四范式。说到第四范式,大家可能感觉名字比较奇怪,他们做的是商业智能,把金融行业的数据拿过来,帮助建立这些金融行业需要的各种模型。大家知道金融行业数据可能是现在所有行业里面数据最全,质量最高,同时是对数据的需求最大的一个行业。&/p&&p&创新工场实际上已经投入的人工智能相关的公司就有大概20家,同时在左边,我们希望利用新成立的人工智能工程院来做一些人工智能的早期研究和早期孵化。&/p&&p&对正在学习的和即将毕业的学生来讲,这都是一个好消息。如果你们想从事人工智能,如果有创业的打算,想赶上这波人工智能的大潮,那创新工场的人工智能工程院可以提供一个非常好的机会。&/p&&p&如果是毕业应届毕业生的话,可以以工程师或者研究员的身份加入,如果是非应届毕业生,可以申请实习。我们和从美国回来的大牛一起来搭建四五个小项目。每一个小项目,做人工智能领域的一个方向,包括自然语言处理,机器视觉,数据挖掘等。做项目期间,可以拿工资,可以接受导师的培养,不用定点上下班,只要完成任务就可以。在这里可以学习到足够的知识,也能够为科研贡献一份力量,还有可能走上创业的道路。&/p&&h2&问答环节&/h2&&p&1. 问:你好,我想问一下,在教育领域的应用,可以怎么进行改革呢?另一个问题是,非技术背景怎么进入人工智能领域?&/p&&p&答:在教育领域的应用,我可以给大家举一些例子。我们创新工场投资的教育公司很多,有一家叫vipkid。美国的老师来教中国的小朋友,现在有3000多个美国老师,然后在美国老师和学生交流过程中,用的是一个视频教育系统。现在这种最基础的视频教育系统能够把两个人从美国和中国连接在一起,那么接下来呢?是不是应该利用这种虚拟的环境,让教学更身临其境?这里面有很多VR/AR以及人工智能技术的用武之地。&/p&&p&第二个问题,非技术同学如何参与其中,比如说创业,甚至说参与到工场项目中来。我觉得有两个层面的问题,一方面是非技术有没有可能转行做技术,我觉得这是有可能的。另一方面是说,如果你想在非技术领域从事创业又该怎么做,其实即便是一个人工智能公司,也需要商务落地,也需要商务人才,特别是在现有条件下。&/p&&p&2. 问:现在,比如说互联网,肯定有些好的项目就被大公司买掉了,包括BAT都在做很多尝试,我们做项目有什么优势呢?&/p&&p&答:非常好的一个问题。这个问题其实在创新工场内部也有争论,虽然我们看好人工智能是一个大势所趋,但是大公司小公司都在做人工智能,为什么小公司就一定会有更好的成功机会呢?&/p&&p&从历史角度来看会发现,实际上在每一轮的历史浪潮里,比如在互联网的时代,有百度有谷歌,但是丝毫不影响移动互联网时代出现新的公司。这是因为在每一个技术浪潮里,上一个技术浪潮的领军人物,他的企业重点,研究重点,或者研发方向未必能够快速转型,在新出现的热点领域里面,中小公司拥有大把的机会。&/p&&p&3. 问: 我一直想问一个问题,任何一项新技术出现都会变成一个非常严重的问题,就是安全问题。安全问题会不会带动安全产业共同发展?&/p&&p&我觉得这是两个层面的事情,一个是从技术层面,技术只是人类的工具,任何技术都不是非黑即白的,任何技术都有安全上的缺陷,需要其他技术或者管理手段来弥补。技术怎么被人类使用,这个才是安全的问题。我们都在用电、用汽车,但没人会问,用电或者用汽车会不会导致大规模的安全隐患。其实每个懂科技的人都可以用电来制造杀人的武器,也可以把汽车改造成杀人的武器。人工智能技术也是一样。人工智能和其他任何技术一样具有好的一面和危险的一面。我们必须研究如何使用人工智能技术,如何与好的应用模式、应用规范相结合,才不至于出现危险的局面。所以,安全专家会不断面临新的挑战,人工智能技术的发展也会反向促进安全技术、安全产业的相应的进步和发展。&/p&
按:这是最近某次在北大宣(hu)讲(you)人工智能的录音记录。我在整理出的文字基础上稍稍作了删减和补充——作为一个不发paper不懂科研,只把机器学习当工具的工程码农,也只能这样从应用角度出发来提(lan)纲(yu)挈(chong)领(shu)了 :-)刚刚大家…
&p&我自己总结了一个机器人学习、机器人的学习资料。需要的可以点击以下链接下载:&/p&&p&&a href=&//link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s/bH0Ev7icqzqTwZ38a8c4MQ& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&mp.weixin.qq.com/s/bH0E&/span&&span class=&invisible&&v7icqzqTwZ38a8c4MQ&/span&&span class=&ellipsis&&&/span&&/a&&/p&&p&&br&&/p&&p&我看到有人在问,Andrew Ng的视频,还有代码这些的资料。再次整理一下:&/p&&p&1、机器学习实战的书:&a href=&//link.zhihu.com/?target=https%3A//www.amazon.cn/%25E6%259C%25BA%25E5%%25E5%25AD%25A6%25E4%25B9%25A0%25E5%25AE%259E%25E6%-%25E7%25BE%258E-Peter-Harrington/dp/B00M2DL02A/ref%3Dsr_1_1%3Fie%3DUTF8%26qid%3D%26sr%3D8-1%26keywords%3D%25E6%259C%25BA%25E5%%25E5%25AD%25A6%25E4%25B9%25A0%25E5%25AE%259E%25E6%& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《机器学习实战 (图灵程序设计丛书 72)》 [美]Peter Harrington, 李锐, 李鹏, 曲亚东, 王斌 书评 简介 电子书下载 Kindle电子书&/a&&/p&&p&2、Andrew Ng老师的视频教程:&a href=&//link.zhihu.com/?target=https%3A//mooc.guokr.com/note/16274/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Machine Learning:斯坦福大学机器学习个人笔记完整版(附所有视频和字幕)&/a& (现在Andrew Ng老师没开新课了,这是一个同学自己下载的所有视频和相关资料,大家可以自行下载)&/p&&p&3、Andrew Ng老师早期的一个机器学习公开课:&a href=&//link.zhihu.com/?target=http%3A//open.163.com/special/opencourse/machinelearning.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯坦福大学公开课 :机器学习课程&/a&&/p&&p&4、Andrew Ng老师机器学习课的代码。Python版本:&a href=&//link.zhihu.com/?target=https%3A//github.com/icrtiou/Coursera-ML-AndrewNg& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&icrtiou/Coursera-ML-AndrewNg&/a&&/p&&p&
Matlab版本:&a href=&//link.zhihu.com/?target=https%3A//github.com/vugsus/coursera-machine-learning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&vugsus/coursera-machine-learning&/a&&/p&&p&&br&&/p&&p&&b&另外,鉴于现在深度学习这么的火热,而且现在做机器学习也避免不了了解及应用深度学习,我这里也加入一些深度学习的内容。&/b&&/p&&p&1、入门的数学和编程基础和机器学习的要求是一样的。&/p&&p&2、入门读物还是推荐Andrew Ng老师组织的一个WIKI,&a href=&//link.zhihu.com/?target=http%3A//deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&UFLDL Tutorial - Ufldl&/a& , 非常建议大家老老实实花两个星期的时间把这个wiki的内容和相关程序自己实现一次。而且,这个wiki是有中文版本的,在每个页面的最下面都可以点击查看中文版本。(PS:我还很荣幸的当时参与了当时的翻译工作,为内容的中文化做了一点点微小的工作。)。&/p&&p&3、现在的深度学习应用最为广泛的就是卷积神经网络(Convolutional neural network, CNN),所以建议大家可以多看看这个方面的内容。正好这几天Fei Fei Li老师的CNN课程又开课了,大家有兴趣可以去看看。这个网站会同步更新,而且有中文翻译。&a href=&//link.zhihu.com/?target=http%3A//www.mooc.ai/course/268& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&【中文字幕】2017春季CS231n 斯坦福深度视觉识别课&/a&。&/p&&p&4、做深度学习避免不了的要选择一个平台,Tensorflow,Caffe,Torch,MxNet等等都是选择。如果是新手,尤其是基于Windows平台的新手,我还是比较建议用Tensorflow。具体的内容可以参见这个&a href=&//link.zhihu.com/?target=http%3A//www.bilibili.com/video/av/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&莫烦系列教程 - Tensorflow教程&/a&。&/p&&p&5、最后,就是勤联系、勤联系、勤联系啦。&/p&&p&6、最后的最后,如果没有项目参与,那么最好的检验自己的学习成果的手段就是参加比赛啦。国外的Kaggle,KDD CUP,...。国内的天池大数据竞赛,...。&/p&&ul&&li&&a href=&//link.zhihu.com/?target=https%3A//www.kaggle.com/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&kaggle.com/&/span&&span class=&invisible&&&/span&&/a&&/li&&li&&a href=&//link.zhihu.com/?target=http%3A//www.kdd.org/kdd-cup& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&kdd.org/kdd-cup&/span&&span class=&invisible&&&/span&&/a&&/li&&li&&a href=&//link.zhihu.com/?target=https%3A//tianchi.shuju.aliyun.com/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&tianchi.shuju.aliyun.com&/span&&span class=&invisible&&/&/span&&span class=&ellipsis&&&/span&&/a&&/li&&/ul&&p&&br&&/p&&hr&&p&这几年,机器学习绝对是计算机领域最热门的话题和方向。笔者不属于专门研究机器学习,但是平时的工作会经常用到一些相关的算法。因此,对于机器学习也仅仅是入门的水平。&b&但是我想也正是因为我只是一个入门汉,所以能够从我们入门者的角度来总结如何入门,希望对还在门外的同学有一些帮助。&/b&&/p&&p&&b&
学&/b&&/p&&p&很多人翻看任何一本机器学习的书,看到一推的数学公式就开始打退堂鼓了。开始搜索,提问“机器学习需要哪些数学知识?”然后得到的结果可能会是“矩阵分析,概率论,优化设计……”而且还会有大量的人推荐一些例如“All of Statistics”,“Convex Optimation”等等外文教材。至少我当时面对的情况就是这样的。这种情况很可能后面会朝以下画风发展。&/p&&p&看到上述推荐的那些经典教材,你像看待圣经一样看待他们。抱着一种学会了那些课,我再看机器学习的书简直就会是探囊取物的想法,你下载了巨多相关材料。但是,慢慢你会发现,除了把他们下载了下来,你并没有任何的进步。你并没有完完整整的看完一本,你并没有在机器学习方面卓越超群。&/p&&p&入门阶段真的需要这么多的数学储备吗?未必。&/p&&p&&b&入门阶段我感觉你只要有普通工科专业大一大二那几门基础数学课“线性代数”,“高数”,“概率论与数理统计”就可以让你入门了。&/b&&/p&&p&所以,千万别被机器学习中的数学所吓倒而不知道该如何下手。&/p&&p&只要有上述的几门课的基础,你完全可以看懂很大一部分机器学习算法。&/p&&p&&b&
程序语言&/b&&/p&&p&机器学习入门最佳的方法其实就是理论和代码一起学习。一边看相应的理论推导,一边看并且实践经典代码。&b&所以,为了更快入门,我推荐你最好能够懂点MATLAB或者是Python语言。&/b&&/p&&p&Matlab和Python说实话做高端的机器学习肯定是不推荐的,但是如果你想的是机器学习快速入门,那这两门语言绝对是绝佳选择。 &/p&&p&&br&&/p&&p&&b&
第一步&/b&&/p&&p&有了上述基础后,你可以开始看点机器学习的相关内容了。我看很多人推荐elements of machine learning。我想说,你想让一个基础为零的人去看这本书,真的合适吗???&/p&&p&&b&所以,我推荐的是Machine Learning in action,(这里面的完成语言为Python)这是英文版本的。当然如果你觉得英文对你是一个完全过不去的坎,(虽然我建议做技术的人都必须至少要看得懂英文)现在有中文版本,叫“机器学习实践”。&/b&&/p&&p&这本书用尽量少的公式把机器学习的基本算法都过了一遍,而且还讲得很清楚,更为重要的是他将公式和代码结合了起来。因此,你的机器学习并没有那么的抽象了,你知道算法里的公式如何的转化为代码。&/p&&p&所以,第一步,你可以耐着性子将这本书看完。反正我当时,把书中的代码自己敲了一次,虽然代码有的下载,你也可以选择只是把代码看懂完事。但我还是建议,自己敲一次,运行运行,这样你会得到不一样的体会。&/p&&p&&br&&/p&&p&&b& 第二步&/b&&/p&&p&&b&学习Coursera上面Andrew Ng老师的machine learning的课程。&/b&这门课造福了众多机器学习的入门者,不仅仅是因为课程全面,内容由浅入深。更加重要的是这门课程每次课都有课堂作业,作业不需要你写出来所有的代码,但是关键代码要你写出来,而且还会教你如何调试代码。&/p&&p&初学者学这门课的时候很可能会买有耐心,又是英文的,又有进度要求,又有作业。没关系,你可以把视频下载下来(很多网盘里都有下载好的视频),然后慢慢的去啃。作业也是,可能你自己不能一口气写出来,没关系,在自己做了大量尝试后,去Github上面下载一些别人写好的代码看一看,找找自己的问题到底出在了哪里。&/p&&p&&b&总之,一定要耐着性子过一遍甚至是几面这个课程。&/b&&/p&&p&&br&&/p&&p&&b&
第三步&/b&&/p&&p&这时候你已经对机器学习很多简单的算法比较清楚了,但是可能还没有一种大的全局观。所以,我建议大家可以看看这两本中文教材。&b&周志华老师的西瓜书《机器学习》和李航老师的《统计学习方法》&/b&,这两本书都是作者花了大量心思编写的,也是在中国众多科技书籍中难得的两本佳作。&/p&&p&英文书籍,&b&可以推荐《Patten Recognition and Machine Learning》,《Elements&br&of Statistical Learning》&/b&(但是这本书难度比较大,如果你有足够的耐心,可以慢慢啃,多次的啃。相信每次都会有不同的收获。我自己已经看了好几次,但是确实每次都没有完全看完,但是目前我遇到很多问题,我去翻这本书,还是能找到很多答案,尤其是我做稀疏相关的工作,里面的相关内容讲解非常清楚。)&/p&&p&&br&&/p&&p&&b&
第四步&/b&&/p&&p&这时候,机器学习你已经可以说大概入门了。后面的事情,&b&就得根据你的需求来制定相关的学习路线。&/b&&/p&&p&比如,做大数据分析的,得去学学spark,Hadoop等计算框架;&/p&&p&另外,图模型,深度学习……等等内容,都是一些方向。&/p&&p&自然语言处理、图像识别、语音识别等等也是一些应用方向,更有大量的领域知识需要结合。&/p&&p&&br&&/p&&p&&br&&/p&&p&在前沿部分和第一到第三步的内容,如果你能按照这几步走下来,入门是肯定可以的。至于后面的机器学习精通部分,我也只能说:Good Luck and Have Fun&/p&&p&&br&&/p&&p&&br&&/p&&p&广告时间:机器学习、未来智能、机器人相关话题,可关注公众号:&/p&&p&&b&&i&平衡小车之家&/i&&/b&&/p&&figure&&img src=&https://pic1.zhimg.com/55cd1f8dcd6e246782ec_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&430& data-rawheight=&430& class=&origin_image zh-lightbox-thumb& width=&430& data-original=&https://pic1.zhimg.com/55cd1f8dcd6e246782ec_r.jpg&&&/figure&
我自己总结了一个机器人学习、机器人的学习资料。需要的可以点击以下链接下载: 我看到有人在问,Andrew Ng的视频,还有代码这些的资料。再次整理一下:1、机器学习实战的书:
&figure&&img src=&https://pic2.zhimg.com/v2-cc61b9e4f9b152ae319b1c_b.jpg& data-rawwidth=&644& data-rawheight=&440& class=&origin_image zh-lightbox-thumb& width=&644& data-original=&https://pic2.zhimg.com/v2-cc61b9e4f9b152ae319b1c_r.jpg&&&/figure&&p&&b&感谢&/b&&b&AlphaGo&/b&&b&对围棋的贡献,人机缠斗刚刚开始&/b&&b&|&/b&&b&陈经&/b&&/p&&p&请点击“风云之声”,打开新的世界&/p&&p&科技与战略风云学会,受过科学训练的理性爱国者们组建的智库。科学素养,家国情怀,横跨文理,纵览风云。&/p&&p&&b&导读&/b&:以AlphaGo为代表的新一代围棋AI将有超过职业棋手的技术实力。而人类的围棋水平在人工智能程序的帮助下,会取得突飞猛进,特别是在大局观上的认识。另一方面,围棋也将通过人类高手与机器的反复缠斗,以一种前所未有的方式展示其自身的魅力。AlphaGo与李世石的五盘人机大战,只是一个开始。&/p&&p&————————————————————————————————&/p&&p&日人机大战第五盘,AlphaGo执白280手中盘胜李世石,总比分4:1结束了这场持续一周的围棋盛事。&/p&&p&我在广州爱范儿公司和吴肇毅九段一起直播了这场比赛,感觉对机器的招法比较能够理解。这使得我在这场特殊的比赛中,有时对局势的判断比吴九段更为准确,虽然我的围棋水平不高。&/p&&p&&i&&figure&&img src=&https://pic2.zhimg.com/v2-cc61b9e4f9b152ae319b1c_b.jpg& data-rawwidth=&644& data-rawheight=&440& class=&origin_image zh-lightbox-thumb& width=&644& data-original=&https://pic2.zhimg.com/v2-cc61b9e4f9b152ae319b1c_r.jpg&&&/figure&陈经在爱范儿与吴肇毅九段一起直播解说人机大战的收官之战&/i&&/p&&p&下面用几个图来解释一下机器开盘的失误和技术特色。&/p&&p&&i&&figure&&img src=&https://pic2.zhimg.com/v2-ad760d93b6cc0dd_b.jpg& data-rawwidth=&538& data-rawheight=&536& class=&origin_image zh-lightbox-thumb& width=&538& data-original=&https://pic2.zhimg.com/v2-ad760d93b6cc0dd_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第五局第&/i&&i&26&/i&&i&手&/i&&/p&&p&在右边的常见套路中,AlphaGo选择了16位挡而不是Q10拆,放黑17位打入,接着继续18位打,放黑19位冲21位断,很简单地就弃掉了三子。粗粗一看黑吃下三子实空不小,但这是AlphaGo的招法创新,黑布局感觉已经落后了。因为白有A位靠下的手段,会在上面形成一道厚势,白棋把棋走在外面,对于厚味外势的价值估计得比人类棋手更准,而且它的整体行棋方式也能与之配合。人类高手出于实战考虑选择实地的更多,通常认为虚虚的外势不太好掌控。从大局观来看,AlphaGo的理解更合乎棋道。&/p&&p&&i&&figure&&img src=&https://pic3.zhimg.com/v2-9adeb3acef4d6f4343674f_b.jpg& data-rawwidth=&538& data-rawheight=&536& class=&origin_image zh-lightbox-thumb& width=&538& data-original=&https://pic3.zhimg.com/v2-9adeb3acef4d6f4343674f_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第五局第&/i&&i&60&/i&&i&手&/i&&/p&&p&这个局面的看点是AlphaGo第48手断入,然后被黑51全部吃下,亏了不小的目数。这是确定无疑的损失,机器犯了错。这个错误非常象AlphaGo和樊麾的第三局,它也是在黑右下大空里走了几手,没有棋却损了空。为什么它这么下?&/p&&p&48手这个断是很明显的直觉要点,在AlphaGo的策略网络里估计会是排名很前的选择。后续捣乱可以连续多招,黑要小心应对,下错了就立刻完蛋。黑应对了,白可以继续“考验”黑。AlphaGo也会用策略网络模拟黑的应对,正确应对的招数肯定有,但也有错误的建议给出来。这样,连续搜索展开后,在不少叶子节点AlphaGo高兴地发现黑应错了被白一举击溃。就算黑一直应对正确,最后白损失也不大,能够完封右边中,大局上还是自己好。所以,蒙特卡洛模拟(MCTS)对48这手给出的胜率评分会比较高。这应该算是AlphaGo算法框架的一个bug。AlphaGo愿意下这种“局部变化复杂,对手应对错误自己立刻胜利,应对正确自己稍亏但大局还好”的辣招。对人类高手来说,这种计算应该不难,所以就占了便宜。48手算是亏目较多的一次小bug,但是局面还早。这时AlphaGo对自己的胜率估计应该比下出48手时低一些了,它终于知道吃了亏,但当初就是愿意去这么试。因为手数较多,它下48的时候并不知道会亏。只有定型的差不多了,才觉得算清了,没有东西。&/p&&p&同样原理的着手在收官阶段出现多次,AlphaGo几次在一路扑吃被提。它不亏,不会减少自己的胜率,万一对手不应还提高了胜率,损了劫材但反正它不想打劫。我估计这类着法是它的策略网络向人学习的,人经常在后半盘打劫、读秒打将的时候下这种一路扑。AlphaGo不理解人的意图,但把招学了过去。学过去发现能提高胜率,就这么用起来了。&/p&&p&象48手亏空这样的小bug是人可以利用的。如果人类高手完美发挥,各个环节都顶住,可能下和平的收空棋也能赢它了。但难度会很高,AlphaGo在划分地盘这个环节实在太厉害了。这种棋要做的选择非常多,哪步能占更多的空人没有特别好的精确测算方式,只有靠感觉为主。而AlphaGo用几百万次模拟来统计性地判断,比人要准得多。这是AlphaGo的核心能力,大局观碾压人类。&/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-d412daf05c8cb608700ddc80d140cc93_b.jpg& data-rawwidth=&554& data-rawheight=&545& class=&origin_image zh-lightbox-thumb& width=&554& data-original=&https://pic1.zhimg.com/v2-d412daf05c8cb608700ddc80d140cc93_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第五局第&/i&&i&70&/i&&i&手&/i&&/p&&p&不少职业棋手认为李世石69过于靠上,被70镇头攻击局势很不利。具体应该在哪吊,说法很多。不管黑下哪,这种局面是AlphaGo擅长的。它不一定要成哪一块空,黑进来它各种方法都会模拟试一下。如果模拟发现退缩不行,它就会进行镇头分断攻击,最后往往会将成空潜力转移到另一片地方去。最后人下来下去,总是被它在某个区域围出很大的一片空。这种以厚势为基础的浮动攻击,靠吃棋威胁最后把虚空做实的下法,真的是很赏心悦目。&/p&&p&人类棋手评棋时往往会觉得,是不是破空手法不对啊,是不是该往这个方向跑,是不是打入深一些才好,是不是进得太深了。我认为这很可能是根据结果来看的马后炮。在这种局面下,拥有厚势的一方可能已经有了局面的主动权,AlphaGo根据自己的评分还是判断得比较准的,你怎么进来它都有应对的办法。&/p&&p&&i&&figure&&img src=&https://pic3.zhimg.com/v2-4da9f1bcee6c51a2e79de3_b.jpg& data-rawwidth=&539& data-rawheight=&534& class=&origin_image zh-lightbox-thumb& width=&539& data-original=&https://pic3.zhimg.com/v2-4da9f1bcee6c51a2e79de3_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第五局第&/i&&i&100&/i&&i&手&/i&&/p&&p&李世石如果选择正确,可能情况会好些。可是实战几乎所有人都发现黑大亏了,自己两眼苦活,白左上角已经活了,中间又瞬间出现大空。这时白下出了100这手棋,人们应该立刻意识到这等于是“胜利宣言”。这手很有味道,它并不是试图在左下围更多的空,而是准备让黑打入做活,但白也消除所有不安定因素收官稳稳获胜。下C5之类的点是可能围空更多,但黑仍然可以进来捣乱,黑右下的厚势就有用了。还不如用100这手消除任何变数。这种思维是人很难有的,它不去在里面守,反而在外面用坚实的拆一来守。&/p&&p&后半盘黑的挣扎都没有用,AlphaGo展现了高超的局面控制能力。最后认输时李世石盘面领先5目,是因为电脑想稳胜,让了一些回去。&/p&&p&这局李世石算是成功地测试出了AlphaGo开局亏目的一个小bug,但由于自身发挥有问题,还是被AlphaGo控制了,基本没有机会。李世石的大局观和局面判断比AlphaGo要差很多,右下意料之外的收益可能反而害了他,让他以为领先优势不小,后面没有果断出手制造第四局赖以获胜的复杂局面。这局也没有制造出劫争,AlphaGo避劫照样控制大局。&/p&&p&在总共五局高水平对局中,AlphaGo确实表现出了令人叹为观止的技术水平。可以非常有把握地预测,以AlphaGo为代表的新一代围棋AI将有超过职业棋手的技术实力。而人类的围棋水平在人工智能程序的帮助下,会取得突飞猛进,特别是在大局观上的认识。机器即使在围棋上完全战胜了人,也不是灾难。可以看看国际象棋领域已经发生过的事,有助于围棋界正确认识机器的作用。国际象棋程序的等级分比人类最高水平还高四五百分,对人类可以让一个兵或者二先,平下人最好结局只是和。人们已经完全承认AI水平远高于人,用它们来更新布局理论,研究新手,在人与人对下时应用。这样人的水平也取得了飞速进步,国际象棋大师越来越多。这次人机大战围棋的关注度空前提高,这对围棋发展是非常有益的。所有热爱围棋的人,都要感谢AlphaGo的贡献。&/p&&p&但另一方面,围棋也将通过人类高手与机器的反复缠斗,以一种前所未有的方式展示其自身的魅力。AlphaGo与李世石的五盘人机大战,只是一个开始。不少新闻分析说,围棋人工智能将很快全面战胜人类,我认为这是不正确的。&/p&&p&理论上来说,因为劫的存在,围棋是一种“上下文有关文法”,同样一个局面,前一招是不是提劫,后续逻辑就会完全不一样(按中国规则禁止全局同形再现,有更多形式的“上下文有关”,但最常见的是劫)。而国际象棋、中国象棋等棋种是“上下文无关文法”,当前局面如何形成的不影响后面结果。围棋的复杂性,广为人知的是状态空间数比国际象棋多100多个0。但是从围棋艺术和计算机算法角度来看,这种“上下文有关”造成的复杂性,远远超乎人的想象。下棋的人都知道,劫是让围棋的境界与艺术性大大升华的一个东西。基于MCTS的国际象棋程序,因为“上下文无关”,可以用多次模拟完美逼近看似很大的搜索空间。但是在围棋上,“上下文有关”的劫,因为可以在全盘任何一处找劫,MCTS算法的分枝数量瞬间爆炸,对搜索质量造成毁灭性的打击。这还只是一些简单的劫争。如果再考虑缓气劫、两手劫、连环劫、多劫循环,可以说围棋搜索算法仅仅只摸到打劫的边,根本没有深入劫争问题的核心。&/p&&p&可以想象将围棋盘扩大到21路,状态空间数又多几十个0,AlphaGo训练之后在划分地盘这个核心能力上还是可以超过人类,并不怕状态空间增多。但是就算棋盘缩小到17路,AlphaGo也还是不喜欢打劫。只要还是MCTS算法框架,面对劫争程序开发者想过各种处理办法,都没能很好应对复杂的劫争。谷歌团队也不太可能在这个问题上取得突破性进展。&/p&&p&可以非常有把握地说,打劫的能力将是人类远远强于围棋程序的地方。但是这个问题上机器也不是没有出路,AlphaGo就向我们展示了如何通过避开劫争分枝来控制局面。人类如何通过行棋,将机器逼得不得不打劫,会是一个很有意思的技术问题。从围棋理论上来说,一方不怕打劫,一方拼命避劫,总是善于打劫的一方有利一些,高手善打劫。人类最高水平的棋手打劫能力是9段,机器的打劫能力可能只有业余3段。按AlphaGo把劫材走光的风格,它不可能是一个劫争高手。但是人类高手也没有这样的经验,如果将一个不配合的却棋艺高超的对手逼入劫争。&/p&&p&在对于非确定地域的价值估计上,AlphaGo可以通过几百万次收完算子的统计模拟,对人类有着压倒性的技术优势。表现出来就是大局观非常好,人类最高水平是9段,AlphaGo可能有13段。&/p&&p&在封闭式局部的战斗中,AlphaGo对人类最高水平也仍然有优势。因为人类存在算不清、得失判断不清的问题。这方面的能力对比AlphaGo是10段,人类是9段。&/p&&p&在多个头绪关联的开放式接触战中,不需要引入劫争的复杂,AlphaGo的搜索模块也会碰到不小的麻烦。因为头绪多,对杀结果决定胜败,只有人类高手能理清逻辑,找到正确的行棋路线图。在这种复杂盘面,AlphaGo的三大搜索武器,价值网络、快速走子策略、策略网络全都失灵,就会忽然出现怪异的行棋选择。这是人类战胜机器最有希望的领域,人类是9段,机器只有业余5段。&/p&&p&在局部区域的定型手法中,AlphaGo出现了不保留变化早早定型的倾向。有些局面还会过早把手段使出来,以目数绝对亏损收场。这都是小问题。而人类心理状态不稳定,很难做到持续稳定地发挥出最高水平,是一个大问题。&/p&&p&总体来说,AlphaGo和人类高手风格迥然不同。事先分析,AlphaGo和人类高手各有所长,交锋起来看点十足。AlphaGo会的,是在实战中最经常使用的。以大局观为基础的行棋方向选择,是行棋中最常用最实用的本事,AlphaGo远超人类。在局部接触战中,AlphaGo拥有类似于穷举的战斗力,人类占不到便宜(亏目是AlphaGo为了提升胜率的小bug行为,明知杀不过也下。真正对它有利的战斗,它不会放过)。这两项本事都是最常用的,所以AlphaGo平时行棋就带有一种独特的魅力,时不时让人类惊叹它的判断力与创造力。人类如果在这两项技术上和AlphaGo斗争,将毫无胜算,甚至差距会越拉越大。&/p&&p&而人类需要有意地将局面引入对自己这方有利的格局中。通过劫争,复杂盘面多处头绪关联分析,在适合于自己的战场将AlphaGo击溃。人类互相之间针锋相对,很容易到达这种局面。然而AlphaGo会有意绕过劫争分枝,抢先定型简化局势。&/p&&p&双方这样各有所长,又特点鲜明,持续缠斗起来会非常火爆,看点十足。我非常期待,职业棋手们能够普遍了解AlphaGo的特性,制定正确的迎战策略。而双方又无疑会互相学习,试图减轻自己的弱点,学习对方的长处。如谷歌可能会通过持续训练与研发,将AlphaGo的弱点隐藏得更深。而人类一方面加强自己的大局观与局部手段,另一方面又动脑筋去使出手段将局面引导入劫争、复杂盘面。从围棋艺术发展来看,这会是一个非常激动人心的历史机遇。&/p&&p&因此,要非常感谢谷歌研发出了AlphaGo这么一个威力强大又十分有趣的好东西。人类与机器激动人心的缠斗不会很快结束,双方的优势与弱点都会长期存在。围棋作为计算机算法“完全信息博弈”问题中当之无愧的皇冠,会进一步展示出它真正的魅力,不会一下子被突破,很长时间内还会是核心难题。人类也会不断向机器学习它擅长的领域,提高自己的技艺。围棋历史上又一次意义巨大的革命已经在发生。&/p&&p&&b&作者简介&/b&:笔名陈经,香港科技大学计算机科学硕士,科技与战略风云学会会员, 微博@风云学会陈经,棋力新浪围棋6D。二十一世纪初开始有独特原创性的经济研究,启发了大批读者。2003年的《经济版图中的发展中国家》预言中国将不断产业升级,挑战发达国家。2016年8月出版新书《陈经说:中国的官办经济》。&figure&&img src=&https://pic4.zhimg.com/v2-fa04fac9eea_b.jpg& data-rawwidth=&640& data-rawheight=&640& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-fa04fac9eea_r.jpg&&&/figure&&/p&&p&【本文日发表于观察者网(&a href=&https://link.zhihu.com/?target=http%3A//www.guancha.cn/chenjing/_354171_s.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&陈经:感谢AlphaGo对围棋的贡献,人机缠斗刚刚开始&/a&)。】&/p&&p&请关注风云学会的微信公众平台“风云之声”,微信号fyvoice&/p&&p&知乎专栏:&a href=&http://zhuanlan.zhihu.com/fengyun& class=&internal&&风云之声 - 知乎专栏&/a&&/p&&p&一点资讯:&a href=&https://link.zhihu.com/?target=http%3A//www.yidianzixun.com/home%3Fpage%3Dchannel%26id%3Dm107089& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&【一点资讯】风云之声 www.yidianzixun.com&/a&&/p&&p&今日头条:&a href=&https://link.zhihu.com/?target=http%3A//toutiao.com/m/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&风云之声 – 头条号(TouTiao.org)&/a&&/p&
感谢AlphaGo对围棋的贡献,人机缠斗刚刚开始|陈经请点击“风云之声”,打开新的世界科技与战略风云学会,受过科学训练的理性爱国者们组建的智库。科学素养,家国情怀,横跨文理,纵览风云。导读:以AlphaGo为代表的新一代围棋AI将有超过职业棋手的技术实力…
&figure&&img src=&https://pic1.zhimg.com/v2-d6565691fcbce3a61e36ba04_b.jpg& data-rawwidth=&656& data-rawheight=&430& class=&origin_image zh-lightbox-thumb& width=&656& data-original=&https://pic1.zhimg.com/v2-d6565691fcbce3a61e36ba04_r.jpg&&&/figure&&p&&b&AlphaGo&/b&&b&的命门其实很简单&/b&&b&|&/b&&b&陈经&/b&&/p&&p&请点击“风云之声”,打开新的世界&/p&&p&科技与战略风云学会,受过科学训练的理性爱国者们组建的智库。科学素养,家国情怀,横跨文理,纵览风云。&/p&&p&&b&导读&/b&:本文写于李世石和AlphaGo第四盘对局获胜后。李世石接到谷歌的邀请,只考虑3分钟没提什么条件就应战了。从人类与机器斗争的角度看,这真不折不扣是《三体》中描述的有碍于人类生存的“傲慢”。不夸张地说,只要李世石要求谷歌公布一张AlphaGo的败局谱,这次人机大战的胜利者就非常可能改写。&/p&&p&————————————————————————————————&/p&&p&日,人机大战第四局李世石执白180手中盘胜AlphaGo。说这一胜是人类历史上最重要的一胜也不为过,就不多说了。从围棋技术与算法上来说,最重要的意义是,我们终于看到了一张AlphaGo的败局谱,明确知道AlphaGo有重大bug,前三局过后看似威力无比的机器,发起疯狗症竟然会走出那么可笑的招法。&/p&&p&现在终于知道,为什么谷歌只公布了与樊麾的五盘正式对局的棋谱,却不公布非正式对局里二盘败局的棋谱。哪怕一盘败局的全谱泄露出来,人类稍作调查就会知道如何对付它。李世石接到谷歌的邀请,只考虑3分钟没提什么条件就应战了。从人类与机器斗争的角度看,这真不折不扣是《三体》中描述的有碍于人类生存的“傲慢”。不夸张地说,只要李世石要求谷歌公布一张AlphaGo的败局谱,这次人机大战的胜利者就非常可能改写。但也不能怪李世石,估计所有职业棋手都想不到,这是人类的共性。我们要感谢李世石,终于用生命一般的抗争在第四局逼出了真相。&/p&&p&1996年国际象棋第一次人机大战,卡斯帕罗夫就谨慎得多。他提出先由助手和IBM的机器下测试棋,正式比赛时卡斯帕罗夫以4:2获胜。这是因为国际象棋程序当时已经发展多年,显示了不低的实力。而围棋程序也是发展了多年,虽然取得了几次重大进步,人的感觉仍然是职业棋手让五六子的水平。樊麾的失利是一个重要信号,但从人类情绪来看,越是不懂围棋技术的人越敢预测机器的胜利。棋迷与职业棋手更了解自己这边的“强大实力”,更了解围棋作为一个算法问题的复杂度,傲慢没有减少。&/p&&p&第四局李世石获胜的关键,赛前我就在上一篇文章中作出了非常接近实战进程的预测:开放式接触战,利用机器“不喜欢打劫”的特性,让机器犯昏。(&a href=&https://link.zhihu.com/?target=http%3A//www.guancha.cn/chenjing/_353749_s.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&陈经:在AlphaGo完胜后继续分析其算法巨大优势与可能的缺陷&/a&)&/p&&p&李世石这第78手在人类看来,其实还是有漏洞的,仔细拆解会发现这并不是最佳着手,黑棋应对了白不行。但是这招非常神奇地引发了机器的bug。为什么会有bug,难有定论,我认为最可能是AlphaGo的价值网络出问题了。&/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-e0dd66ebb6f54_b.jpg& data-rawwidth=&605& data-rawheight=&598& class=&origin_image zh-lightbox-thumb& width=&605& data-original=&https://pic1.zhimg.com/v2-e0dd66ebb6f54_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第四局第&/i&&i&82&/i&&i&手&/i&&/p&&p&如图至第82手。80和82都是必然的,所以叫78为神之一手。其实AlphaGo这时走B位,据职业棋手分析,空里没有什么棋。如果白M13扑,黑可以 提掉78一子,白L13再打吃,黑粘在78位。下面白吃不掉63这个子。对人来说变化并不复杂。观战棋手猜测李世石预想的变化图是这样的: &/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-136b7caeedf_b.jpg& data-rawwidth=&608& data-rawheight=&597& class=&origin_image zh-lightbox-thumb& width=&608& data-original=&https://pic1.zhimg.com/v2-136b7caeedf_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第四局第&/i&&i&82&/i&&i&手后变化图&/i&&/p&&p&如果AlphaGo走1位,那白只好2位先手接回一子,再4位先手切断,在外面做出一片形势,局势还能维持。&/p&&p&&i&&figure&&img src=&https://pic3.zhimg.com/v2-3cbf114d65e1d05909aa5feb483b25e1_b.jpg& data-rawwidth=&603& data-rawheight=&601& class=&origin_image zh-lightbox-thumb& width=&603& data-original=&https://pic3.zhimg.com/v2-3cbf114d65e1d05909aa5feb483b25e1_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第四局第&/i&&i&93&/i&&i&手&/i&&/p&&p&而AlphaGo却走了实战的83手,后面一连串招法都特别糊涂的样。所以犯错是从83手开始的。Deepmind负责人哈萨比斯说从79到85手,机器都以为自己胜率高达70%,到第87手才发现不对劲,一步棋评分就急剧下降了。降到多少没有说,但肯定是个很低的分,所以才后面一连串搞笑的棋。这些搞笑的棋本身到是不难解释,为了偷得可怜的一点胜率,它觉得别的招都不如你打吃看不见。Zen之类的MCTS程序落后了乱下很常见。我们要解释,为什么AlphaGo下了错误的83。&/p&&p&这个局面特别复杂,把整个棋盘中间都卷进去了,可以说根本不是地块划分的问题。决定性因素就是怎么出棋,出多大的棋,出劫的话怎么造对自己有利的劫。从AlphaGo的算法来看,它会从当前这个局面进行搜索展开,对叶子节点给出判断。一半是靠价值网络,一半是靠“快速走子策略”走到终局。&/p&&p&价值网络的意思是,它静态地看整个盘面,用一个多层的神经网络直接算,就报告这个局面谁会胜。虽然它能“深度学习”到很多隐藏的概念,我们很难想象,在一个火药桶一样的盘面上,一个静态的不搜索的神经网络居然可以判断清楚最终的胜负。这种复杂局面,我断定价值网络的判断误差是极大的。也许价值网络在各种叶子节点粗粗地一看,黑棋在中间以多打少似乎应该是形势一片大好。这应该不难理解,无论谷歌怎么拿几亿个局面训练价值网络,我也不相信它能判断清楚。&/p&&p&那么AlphaGo在叶子节点还有一半的机会,就是“快速走子”你一招我一招不停直到终局。这个快速走子策略的实力还不错,速度比策略网络快1000倍的情况下,单只靠这个策略就有KGS的3D实力,做得其实很好了。但我们再想想,这么复杂的盘面,两个KGS的3D在那下到终局,你信得过它们的模拟质量?黑死还是白死估计就是随机的了。如果让两个真实的人类3D在这个局面下,黑好白好确实可能等于扔硬币。&/p&&p&如果“快速走子终局”给的结果是随机,基本就是价值网络在那主导判断了。它要是有系统性的错误偏向,误以为黑形势一片大好,那可能一大堆叶子节点都有类似错误,因为盘面很相似。所以综合起来,AlphaGo的MCTS模块,让价值网络在那高兴,下了83和85还是继续高兴,胜率还是70%。终于在白下了86,黑87后,价值网络发生了“跳变”,这里出现了棋块特征的本质变化,一大片类似叶子节点的价值网络判断都倒转过来,于是只一手,胜率就从70%跳到30%之类的悲惨数字了。&/p&&p&这是我的猜测,只能尽量地往合理上靠,最终如何希望Deepmind能给出分析。但是显然,复杂的对杀盘面会对价值网络造成严重困扰,这应该是AlphaGo体系架构中一个不太好消除的命门。同时复杂的对杀盘面,又让“快速走子策略”模仿精度下降。要是两个3D在那下和平棋终局,你占10目我占9目,错进错出最后一平均是可能把局面好坏概率性模拟清楚。但要是50-50%机会的大对杀,就和其它地方无关了,模拟到最后也提供不了什么有效信息。&/p&&p&AlphaGo搜索中的两个武器都失灵了,就只有依靠“策略网络”提供的各个候选点的概率了。同样的原因,这个策略网络只是一个静态评估,复杂盘面各处头绪很多,各种要点多得是,看上去的好点到处都是。我不相信策略网络就那么凑巧对真正的好点给出高的概率。&/p&&p&&b&可以非常合理的认为,对于复杂的、头绪很多的对杀盘面,&/b&&b&AlphaGo&/b&&b&所有的搜索武器都会失灵,容易做出错误选择!三大搜索武器“策略网络”、“价值网络”、“快速走子终局数子”,全都失灵!&/b&&/p&&p&&b&都失灵了,不管你怎么调参数拼凑一个&/b&&b&MCTS&/b&&b&架构,最后也还是失灵。这就是&/b&&b&AlphaGo&/b&&b&的命门!&/b&&/p&&p&让我们人类开心的是,这并不是很难实现的!我和Zen下过,水平不够怎么也下不过它。要么局部被它杀死,要么圈地大局观搞不过。但是下多了,慢慢也琢磨出来了办法。就不要怕它,这里开一片头绪,那里开一片,留着不动。然后各种头绪慢慢凑一起,这里的选择会影响那里。这种情况下Zen就昏了,它的搜索武器其实比AlphaGo更差,更是全都失灵了。我虽然也昏,但就死盯着某一个“阴谋”,设计一条路线图就够了,不去搜索那么多乱七八糟的。最后哈哈,Zen上当了,我阴谋得逞,吃了一大片终于赢了。其实我的水平真的远不如Zen,各个局面手段和大局明显不如。&/p&&p&那么对李世石这样的职业高手来说,复杂盘面更不是个事了。职业高手能理清楚复杂盘面的推理逻辑,用清楚的变化图给出杀招。这正是体现大高手水平的地方。&/p&&p&因此我大胆推测,AlphaGo其实没有那么可怕。所有MCTS为基础的程序都有的大漏洞,它一样有,而且从算法角度没有什么好办法解决!这是算法原理决定的,不是写程序代码错了几行的小bug。&/p&&p&如果职业高手们了解了AlphaGo的漏洞,就不要客气搞什么棋理圈地,直接就上去跟它杀!但不要在局部乱杀,不是说“在此决一胜负”,如李世石第一局开始的杀法,不对。&b&要这里留点味道,那里留些头绪,最后这些乱子凑到一起去,一定把&/b&&b&AlphaGo&/b&&b&弄昏头。&/b&&/p&&p&因此,除了“不喜欢打劫”以外,AlphaGo还不喜欢复杂的盘面。所以前三局中它表现得特别喜欢定型,有手段就使出来,减少头绪。这是它的搜索特性决定的。&/p&&p&分析清楚以后就可以肯定,AlphaGo的漏洞不小。开始人类不了解它,看它下得象模象样,还时不时有好招,被它吓到了,没有找到它的命门。它是有几招绝活玩得不错,封闭局面算得不错,圈地运动搞得不错,几百万次算到终局去人不可能玩得过。选点也很靠谱,算得快算得准。在它擅长的领域和它打,当然就不是对手,哪怕是人类最高水平的也不行。但复杂盘面是人类的天生优势,这不是MCTS那几招搞得定的,需要人类高手制造头绪归纳头绪的逻辑能力。&/p&&p&AlphaGo的缺陷被测试出来以后,人类高手将可能对机器取得压倒性的胜利。当然人类高手需要改变下法,不要和自己人下那样讲棋理数着目下。碰到机器就要搅,越复杂越好。不是一处变化多手数多那种复杂,而是搅出的头绪越多越好。&/p&&p&这还没有提到打劫的能力,这更是人类高手胜过机器的地方。机器可以用控制流避开劫争,但这终究不是办法。如果人想通了,自己不要虚,大胆引入劫争分支,机器总是避劫原理上就不合于棋道。当然这个分析起来更复杂。&/p&&p&综上所述,如果高水平围棋程序还是基于MCTS架构的,都会有难以解决的大缺陷。我对人类高手一段时间内压制机器充满信心! &/p&&p&&b&作者简介&/b&:笔名陈经,香港科技大学计算机科学硕士,科技与战略风云学会会员, 微博@风云学会陈经,棋力新浪围棋6D。二十一世纪初开始有独特原创性的经济研究,启发了大批读者。2003年的《经济版图中的发展中国家》预言中国将不断产业升级,挑战发达国家。2016年8月出版新书《陈经说:中国的官办经济》。&figure&&img src=&https://pic4.zhimg.com/v2-fa04fac9eea_b.jpg& data-rawwidth=&640& data-rawheight=&640& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-fa04fac9eea_r.jpg&&&/figure&&/p&&p&【本文日以《感谢李世石生命般的抗争 现在我敢说AlphaGo的命门其实很简单》为题发表于观察者网(&a href=&https://link.zhihu.com/?target=http%3A//www.guancha.cn/chenjing/_353915_s.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&陈经:感谢李世石生命般的抗争 现在我敢说AlphaGo的命门其实很简单&/a&)。】&/p&&p&请关注风云学会的微信公众平台“风云之声”,微信号fyvoice&/p&&p&知乎专栏:&a href=&http://zhuanlan.zhihu.com/fengyun& class=&internal&&风云之声 - 知乎专栏&/a&&/p&&p&一点资讯:&a href=&https://link.zhihu.com/?target=http%3A//www.yidianzixun.com/home%3Fpage%3Dchannel%26id%3Dm107089& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&【一点资讯】风云之声 www.yidianzixun.com&/a&&/p&&p&今日头条:&a href=&https://link.zhihu.com/?target=http%3A//toutiao.com/m/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&风云之声 – 头条号(TouTiao.org)&/a&&/p&
AlphaGo的命门其实很简单|陈经请点击“风云之声”,打开新的世界科技与战略风云学会,受过科学训练的理性爱国者们组建的智库。科学素养,家国情怀,横跨文理,纵览风云。导读:本文写于李世石和AlphaGo第四盘对局获胜后。李世石接到谷歌的邀请,只考虑3分钟…
&figure&&img src=&https://pic1.zhimg.com/v2-6ced4cff0abbf_b.jpg& data-rawwidth=&557& data-rawheight=&358& class=&origin_image zh-lightbox-thumb& width=&557& data-original=&https://pic1.zhimg.com/v2-6ced4cff0abbf_r.jpg&&&/figure&&p&&b&在&/b&&b&AlphaGo&/b&&b&完胜后继续顽强地分析其缺陷&/b&&b&|&/b&&b&陈经&/b&&/p&&p&请点击“风云之声”,打开新的世界&/p&&p&科技与战略风云学会,受过科学训练的理性爱国者们组建的智库。科学素养,家国情怀,横跨文理,纵览风云。&/p&&p&&b&导读&/b&:本文写于李世石和AlphaGo第三盘对局后,发表于第四盘李世石取胜前6个小时。AlphaGo以3:0战胜李世石后,围棋界都绝望了,对机器产生了恐惧。陈经却基于对算法的了解,坚持分析AlphaGo的弱点,并精准地预测到了李世石在第四局获胜的方式。&/p&&p&————————————————————————————————&/p&&p&日人机大战第三局,AlphaGo执白176手中盘胜李世石,以3:0的比分提前取得了对人类的胜利。&/p&&p&这一局李世石败得最惨,早早就被AlphaGo妙手击溃,整盘毫无机会。最后李世石悲壮地造劫,在AlphaGo脱先之后终于造出了紧劫。但AlphaGo只靠本身劫就赢得了劫争,粉碎了AlphaGo不会打劫的猜想。这一局AlphaGo表现出的水平是三局中最高的,几乎没有一手棋能被人置疑的,全是好招。三局过去,AlphaGo到底实力高到什么程度,人们反而更不清楚了。&/p&&p&看完这三局,棋界终于差不多绝望了,原以为5:0的,都倒向0:5了。有些职业棋手在盘算让先、让二子是否顶得住。整个历程可以和科幻小说《三体》中的黑暗战役类比,人类开始对战胜三体人信心满满,一心想旁观5:0的大胜。一场战斗下来人类舰队全灭,全体陷入了0:5的悲观失望情绪中。&/p&&p&我也是纠结了一阵子,看着人类在围棋上被机器碾压的心情确实不好。但是承认机器的优势后,迅速完成了心理建设,又开心地看待围棋了。其实挺容易的,国际象棋界早就有这样的事了。这个可以等五盘棋过后写。&/p&&p&现在我的感觉是,棋界整体还是对AlphaGo的算法以及风格很不适应。一开始轻视,一输再输,姿态越来越低,三盘过后已经降到一个很低迷沉郁的心理状态了。这也可以理解,我一个围棋迷都抑郁了一会,何况是视棋如生命的职业棋手。但是不管如何,还是应该从技术的角度平心静气地搞清楚,AlphaGo到底是怎么下棋的,优势到底在哪些,是不是就没有一点弱点了?&/p&&p&现在有了三盘高水平的棋谱,质量远高于之前和樊麾的五盘棋谱。还有谷歌号发表在《自然》上的论文,介绍了很多技术细节,还有一些流传的消息,其实相关的信息并不少,可以作出一些技术分析了。&/p&&p&之前一篇文章提到,从研发的角度看,谷歌团队把15-20个专家凑在了一起,又提供了巨量的高性能计算资源,建立起了整个AlphaGo算法研究的“流水线”。这样谷歌团队就从改程序代码的麻烦工作中解放出来,变成指挥机器干活,开动流水线不断学习进步,改善策略网络价值网络的系数。而且这个研发架构似乎没有什么严重的瓶颈,可以持续不断地自我提升,有小瓶颈也可以想办法再改训练方法。就算它终于遇到了瓶颈,可能水平也远远超过人类了。&/p&&p&这些复杂而不断变动的神经网络系数是AlphaGo的独门绝技,要训练这些网络,需要比分布式版本对局时1200多个CPU多得多的计算资源。AlphaGo算法里还是有一些模块代码是需要人去写的,这些代码可不是机器训练出来的,再怎么训练也改不了,谷歌团队还不可能做到这么厉害。例如蒙特卡洛搜索(MCTS)整个框架的代码,例如快速走子网络的代码。这里其实有两位论文共同第一作者David Silver和Aja Huang多年积累的贡献。这些人写的代码,就会有内在的缺陷,不太可能是完美无缺的。这些缺陷不是“流水线”不眠不休疯狂训练能解决的,是AlphaGo真正的内在缺陷,是深度学习、self-play、进化、强化学习这些高级名词解决不了的。谷歌再能堆硬件,也解决不了,还得人去改代码。&/p&&p&第一局开局前,谷歌就说其实还在忙着换版本,最新版本不稳定,所以就用上一个固定版本了。这种开发工作,有可能就是人工改代码消除bug的,可能测试没完,不敢用。&/p&&p&总之,像AlphaGo这么大一个软件,从算法角度看存在bug是非常可能的。在行棋时表现出来就是,它突然下出一些不好的招数,而且不是因为策略网络价值网络水平不够高,而是MCTS框架相关的搜索代码运行的结果。如果要找AlphaGo潜在的bug,需要去仔细研究它的“搜索 ”。这可能是它唯一的命门所在,而且不好改进。&/p&&p&那么MCTS的好处坏处到底是什么?幸运的是,Zen和CrazyStone等上一代程序,以及facebook田渊栋博士开发的Darkforest都用了MCTS。它们和AlphaGo虽然棋力相差很远,但是行棋思想其实很相似,相通之处远比我们想象的高得多。&/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-6ced4cff0abbf_b.jpg& data-rawwidth=&557& data-rawheight=&358& class=&origin_image zh-lightbox-thumb& width=&557& data-original=&https://pic1.zhimg.com/v2-6ced4cff0abbf_r.jpg&&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-55f69b196cc3cf0f2d1b6aa309fc2cf9_b.jpg& data-rawwidth=&558& data-rawheight=&366& class=&origin_image zh-lightbox-thumb& width=&558& data-original=&https://pic1.zhimg.com/v2-55f69b196cc3cf0f2d1b6aa309fc2cf9_r.jpg&&&/figure&Darkforest&/i&&i&对前两局的局势评分&/i&&/p&&p&这是田渊栋贴的Darkforest对前两局的局势评分。可以看出,这个评分和棋局走向高度一致,完全说得通。而且谷歌也透露了AlphaGo对局势的评分,虽然一直领先,但第二局也有接近的时候,能够相互印证。如果到网上下载一个Zen,输入AlphaGo和李世石的对局,选择一个局面进行分析,也会有像模像样的评分出来。这究竟是怎么回事?&/p&&p&从技术上来说,所谓的局势评分,就是程序的MCTS模块,对模拟的合理局面的胜率估计。连AlphaGo也是这样做的,所以几个程序才能对同样一个局面聊到一块去。所有程序的MCTS,都是从当前局面,选择一些分支节点搜索,一直分支下去到某层的“叶子”节点,比如深入20步。&/p&&p&这个分支策略,AlphaGo和Darkforest用的是“策略网络”提供的选点,选概率大的先试,又鼓励没试过的走走。到了叶子节点后,就改用一个“快速走子策略”一直下完,不分支了,你一步我一步往下推进,比如再下200步下完数子定出胜负。这个走子策略必须是快速的,谷歌论文中说AlphaGo的快速走子策略比策略网络快1000倍。如果用策略网络来走子,那就没有时间下完了,和李世石对局时的2小时会远远不够用。下完以后,将结果一路返回,作一些标记。最后统计所有合理的最终局面,看双方胜利的各占多少,就有一个胜率报出来,作为局势的评分。一般到80%这类的胜率就没意义了,必胜了,机器看自己低于20%就中盘认输了。&/p&&p&AlphaGo的创新是有价值网络,评估叶子节点时不是只看下完的结果,而是一半一半,也考虑价值网络直接对叶子节点预测的胜负结果。走子选择就简单了,选获胜概率最大的那个分支。机器也会随机下,因为有时几个分支胜率一样。&/p&&p&MCTS这个框架对棋力最大的意义,我认为就是“大局观”好。无论局部如何激烈战斗,所有的模拟都永远下完,全盘算子的个数。这样对于自己有多少占地盘的潜力,就比毛估估要清楚多了。以前的程序,就不下到终局,用一些棋块形状幅射之类的来算自己影响的地盘,估得很差,因为一些棋块死没死都不清楚。MCTS就不错,下到终局死没死一清二楚。MCTS也不会只盯着局部得失,而是整个盘面都去划清楚边界。这个特点让几个AI对局势的评估经常很相似,大局观都不错。MCTS对于双方交界的地方,以及虚虚实实的阵势,通过打入之类的模拟,大致有个评估。当然这不是棋力的关键,大局观再好,局部被对手杀死也没有用,可能几手下来,局势评估就发生了突变。&/p&&p&AlphaGo的大局观还特别好,特别准确,主要是它模拟的次数最多,模拟的质量最好。而且这个大局观从原理上就超过了人类!比如人看到一块阵势,如果不是基本封闭的实空,到底价值多少评估起来其实是非常粗的。高手点目时经常这样,先把能点的目算清楚,有一些小阵势如无忧角就给个经验目数,然后加上贴目算双方精确目数的差值,然后说某方的某片阵势能不能补回这个差值,需要扣除对方打入成的目数,孤棋薄棋减目数。这类估算有很多不精确的因素。&/p&&p&AlphaGo就不一样了,它会真的打入到阵势里,来回模拟个几十万次,每一次都是精确的!人绝对没有能力像AlphaGo这么想问题,一定是利用经验去估算阵势的价值,误差就可能很大。极端情况下,一块空有没有棋,职业棋手根本判断不清,AlphaGo却可以通过实践模拟清楚,没棋和有棋相比,目数差别太大了。AlphaGo虽然不是严格证明,但通过概率性地多次打入模拟,能够接近理论情况,比人类凭经验要强太多了。我可以肯定,AlphaGo的大局观会远远超过职业高手,算目也要准得多,所以布局好、中后盘收束也很强大。甚至Zen之类的程序大局观都可能超过职业高手。&/p&&p&例如第二局这个局面:&/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-00de2aeb9dee34e2c66f4cd_b.jpg& data-rawwidth=&558& data-rawheight=&546& class=&origin_image zh-lightbox-thumb& width=&558& data-original=&https://pic1.zhimg.com/v2-00de2aeb9dee34e2c66f4cd_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第二局第&/i&&i&73&/i&&i&手&/i&&/p&&p&李世石左下占了便宜,本来局势还可以。但是他70和72手吃了一子落了后手,被AlphaGo走到73,大局一下就落后了。这个在前面Darkforest对局势的评估图中都非常清楚,是局势的转折点。李世石要是手头有个Zen辅助,试着下两下都可能会知道70手不要去吃一子了。大局观不太好的职业高手,比如李世石就是个典型,大局观不如Zen真不一定是笑话。李世石比Zen强的是接触战全局战的手段,要强太多了。MCTS实事求是不怕麻烦下完再算子的风格,比起人类棋手对于阵势价值的粗放估算,是思维上先天的优势。&/p&&p&AlphaGo比其它程序强,甚至比职业高手还强的,是近身搏杀时的小手段。&/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-68525ade45fdfe51ee96ebc_b.jpg& data-rawwidth=&558& data-rawheight=&542& class=&origin_image zh-lightbox-thumb& width=&558& data-original=&https://pic1.zhimg.com/v2-68525ade45fdfe51ee96ebc_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第三局第&/i&&i&32&/i&&i&手&/i&&/p&&p&第三局,李世石29和31是失着。29凑白30双,虽然获得了H17的先手,但是中间的头更为重要。当黑31手飞出后,白32象步飞可以说直接将黑击毙了。在盘面的左上中间焦点处,AlphaGo的快速走子网络会有一个7*7之类的小窗口,对这里进行穷举一样的搜索,用人手写的代码加上策略网络。32这步妙招可能就是这样找出来的,李世石肯定没有算到。但是AlphaGo是不怕麻烦的,就一直对着这里算,比人更容易看到黑三子的可怜结局。这个计算对人有些复杂,只有实力很强的才能想到算清楚,对AlphaGo就是小菜。李世石一招不慎就被技术性击倒了。AlphaGo对这种封闭局部的计算,是它超过人类的强项。&/p&&p&但是AlphaGo的搜索是不是就天衣无缝了?并不是。来看第二局这个局面: &/p&&p&&i&&figure&&img src=&https://pic1.zhimg.com/v2-b04616b8fbddf0aff27d47f_b.jpg& data-rawwidth=&558& data-rawheight=&550& class=&origin_image zh-lightbox-thumb& width=&558& data-original=&https://pic1.zhimg.com/v2-b04616b8fbddf0aff27d47f_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第二局第&/i&&i&56&/i&&i&手&/i&&/p&&p&AlphaGo黑41手尖冲,43手接出作战。最后下成这样,这是三局中AlphaGo被众多职业棋手一致认为最明显的一次亏损失误,如果它还有失误的话。我们猜想它为什么会失误。关键在于,这里是一个开放式的接触战,棋块会发展到很远的地方去。AlphaGo的小窗口封闭穷举搜索就不管用了,就只有靠MCTS在那概率性地试。这里分支很多,甚至有一个复杂的到达右上角的回头征。我认为AlphaGo这里就失去了可靠的技术手段,终于在这个人类一目了然的局面中迷失了。它是没有概念推理的,不知道什么叫“凭空生出一块孤棋”。也不确定人会在50位断然反击,可能花了大量时间在算人妥协的美好局面。&/p&&p&&i&&figure&&img src=&https://pic4.zhimg.com/v2-08ce70ee963d930e9979_b.jpg& data-rawwidth=&557& data-rawheight=&550& class=&origin_image zh-lightbox-thumb& width=&557& data-original=&https://pic4.zhimg.com/v2-08ce70ee963d930e9979_r.jpg&&&/figure&李世石对&/i&&i&AlphaGo&/i&&i&第一局第&/i&&i&136&/i&&i&手&/i&&/p&&p&再来看AlphaGo一个明确的亏损。第一局白AlphaGo第136手吃掉三子。这里是一个封闭局面,是可以完全算清楚的。可以绝对地证明,136手吃在T15更好,这里白亏了一目。但是为什么AlphaGo下错了?因为它没有“亏一目”的这种概念。只有最终模拟收完数子,白是179还是180这种概念,它根本搞不清楚差的一个子,是因为哪一手下得不同产生的,反正都是胜,它不在乎胜多少。除非是176与177子的区别,一个胜一个负,那136就在胜率上劣于T15了,它可能就改下T15了。&/p&&p&这个局面白已经胜定了所以无所谓。但是我们可以推想,如果在对局早期,局部发生了白要吃子的选择,一种是A位吃,一种是B位吃,有目数差别,选哪种吃法?这就说不清了。AlphaGo的小窗口穷举,是为了保证对杀的胜利,不杀就输了。但是都能吃的情况下,这种一两目的区别,它还真不好编程说明。说不定就会下错亏目了。&/p&&p&&b&经过以上的分析,&/b&&b&AlphaGo&/b&&b&相对人类的优势和潜在缺陷就清楚多了。它的大局观天生比人强得多,因为有强大的计算资源保证模拟的终局数量足够,策略网络和价值网络剪枝又保证了模拟的质量。它在封闭局部的对杀会用一个小窗口去穷举,绝对不会输,还能找到妙手。它布局好,中盘战斗控制力强,都是大局观好的表现。它中后盘收束差不多都是封闭局面了,基本是穷举了,算目非常精确,几百万次模拟下来什么都算清了。想要收官中捞点目回去不是问题,它胜了就行;但是想收官逆转是不可能的,影响了胜率它立刻就穷举把你堵回去。&/b&&/p&&p&&b&但是封闭式局面的小手段中,&/b&&b&AlphaGo&/b&&b&可能存在不精确亏目的可能性,不知道怎么推理。在开放式接触战中,如果战斗会搞到很远去,它也可能手数太多算不清,露出破绽。但不会是崩溃性的破绽,要崩溃了它就肯定能知道这里亏了,不崩吃点暗亏它就可能糊涂着。目前来看,就是这么两个小毛病。&/b&&/p&&p&&b&另外还有打劫的问题。如果是终局打劫,那是没有用的,它就穷举了,你没有办法。如果是在开局或者中局封闭式局部有了劫争,由于要找劫,等于强制变成了杀到全盘的开放度最大的开放式局面了。这是&/b&&b&AlphaGo&/b&&b&不喜欢的,它的小窗口搜索就用不上了。而用&/b&&b&MCTS&/b&&b&搜索,打劫步数过多,就会超过它的叶子节点扩展深度,比如&/b&&b&20&/b&&b&步就不行了,必须“快速走子”收完了。这时它就胡乱终局了,不知道如何处理劫争,模拟质量迅速下降。所以,这三局中,&/b&&b&AlphaGo&/b&&b&都显得“不喜欢打劫”。但是,这不是说它不会打劫,真要逼得它不打劫必输了,那它也就被&/b&&b&MCTS&/b&&b&逼得去打了。如果劫争发生在早中期手数很多,在打劫过程中它就可能发生失误。&/b&&/p&&p&当然这只是一个猜想。它利用强大的大局观与局部手段,可以做到“我不喜欢打劫,打劫的变化我绕过”,想吃就给你,我到别的地方捞回来。当然如果对手足够强大,是

我要回帖

更多关于 热火朝天的近义词 的文章

 

随机推荐