谷歌看埃及下面有一块和围棋样的浙北地区围棋段位赛,那个是什么情况?到底是什么?

携手民生之声,构建和谐社会。竭力打造中国第一民生网站!           
导语:习近平同志从历史的维度出发,论证了坚持植根于人民,坚持群众路线,树立群众观点,保持党同人民群众的血肉联系的重要性。习近平总结了政党执政的规律和政权兴亡的重要规律,认识到人心向背最终决定着一个政党或一个政权的前途和命运。习近平认为密切联系群众,保持与人民群众的血肉联系,是中国共...
您当前的位置:&>&
逆天的谷歌人工智能AlphaGo到底是什么?
核心内容:今天,整个朋友圈都被这个事情刷屏了,那就是谷歌人工智能AlphaGo和李世石的世纪围棋大战!
昨天,李世石比赛输了,人工智能逆袭了?人类真的败给人工智能了吗?
接下来,就让我们了解一下,这个逆天的谷歌人工智能AlphaGo到底是为何物?
1936年,艾伦&图灵提出了一种可以辅助数学研究的机器(后来被称为&图灵机&),80年过去了,人类在人工智能领域已经取得突飞猛进的发展。上世纪90年代,IBM超级计算机&深蓝&击败国际象棋世界冠军,引发了&电脑是否超越人脑&的热议。然而,围棋因其变化莫测的招式成为了AI(Artificial&Intelligence,人工智能)难以攻克的&禁地&。当然,这个世界总有&不信邪&的人。DeepMind开发的AI程序AlphaGo,击败了欧洲围棋冠军樊麾。
AlphaGo是什么来历?
&&&&&& 起初,DeepMind是英国的一家小型人工智能公司,专精于深度学习和分析建模领域,在2014年被谷歌收购。这家公司的创始人名叫德米斯&哈萨比斯(Demis Hassabis),他拥有剑桥大学和伦敦大学学院的计算机科学和认知神经科学学位,还是一位国际象棋大师。从外表上来看,&学生气&的哈萨比斯很普通,但是其对AI的见解和愿景改变了很多的看法,其中就包括著名物理学家史蒂芬&霍金。一直以来,霍金总是倾向于&AI威胁论&,认为智能机器终有一天会威胁人类的安全。不过在与哈萨比斯长谈了4个小时之后,霍金似乎转变了态度。
&&&&&& 介绍完DeepMind的负责人,我们把目光转回到AlphaGo。事实上,AlphaGo成名已久,曾经先后与Crazy Stone和Zen(两款知名围棋程序)进行了500局对弈,仅有一局失利。此外,其也优于Facebook的围棋程序Dark Forest,后者得到了马克&扎克伯格的支持。AlphaGo具备策略网络(Policy Network)和估值网络(Value Network)能力,前者分析局面、预测对手招式,后者负责判断胜率,可以在2微秒内走出一步棋,而Dark Forest仅具备第一种能力,并且走棋所花费的时间也要更慢。
&&&&&& 当然,真正让AlphaGo成名的还是战胜欧洲围棋冠军樊麾,这在当时引起了轩然大波,甚至推升了谷歌的股价,毕竟这是电脑对人脑的一次胜利。更重要的是,站在计算机的角度来看,与象棋相比,围棋的难度要大很多,每个步数的潜在组合非常复杂,曾有专家说AI十年内都无法掌握围棋。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维&西尔弗、艾佳&黄和戴密斯&哈萨比斯与他们的团队开发,这个程序利用&价值网络&去计算局面,用&策略网络&去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,李世石输了。
阿尔法围棋(AlphaGo)是一款围棋人工智能程序。这个程序利用&价值网络&去计算局面,用&策略网络&去选择下子。
&&&&&& 深度学习
&&&&&& 阿尔法围棋(AlphaGo)的主要工作原理是&深度学习&。&深度学习&是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络&大脑&进行精准复杂的处理,就像人们识别物体标注图片一样。 
&&&&&& 阿尔法围棋(AlphaGo)是通过两个不同神经网络&大脑&合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何&思考&的,但更多的训练后能让它进化到更好。
&&&&&& 第一大脑:落子选择器 (Move Picker)
&&&&&& 阿尔法围棋(AlphaGo)的第一个神经网络大脑是&监督学习的策略网络(Policy Network)& ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成&落子选择器&。
&&&&&& 第二大脑:棋局评估器 (Position Evaluator)
&&&&&& 阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这&局面评估器&就是&价值网络(Value Network)&,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的&好&与&坏&,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
《民生呼声》栏目提醒您:
1、所有内容,一经提交,均无法撤消或修改,请您慎重对待每一次发言;
2、在必要时,您将承担一切因您的行为而直接或间接引起的法律责任
3、所有发言本站在未调查核实前,概不负责其真实性。人机大战只是一场特殊的围棋对弈?其实谷歌在下一盘很大的棋
新蓝网·浙江网络广播电视台
分享到微信:
核心提示:对于此次引来全世界关注的人机大战,谷歌董事长施密特称不管输赢都是人类的胜利。而实际上,此次人机围棋大战,不管输赢都是谷歌的胜利。中国科技企业搜狗的董事长王小川表示,谷歌不是莽撞地进行了一场比赛,而是进行了精心的布局和策划,是一次成功的商业运作。而在这次高调亮相的背后,是谷歌的新商业野心——人工智能竞赛真的开始了。
对于此次引来全世界关注的人机大战,谷歌董事长施密特称不管输赢都是人类的胜利。而实际上,此次人机围棋大战,不管输赢都是谷歌的胜利。中国科技企业搜狗的董事长王小川表示,谷歌不是莽撞地进行了一场比赛,而是进行了精心的布局和策划,是一次成功的商业运作。而在这次高调亮相的背后,是谷歌的新商业野心——人工智能竞赛真的开始了。一场轰动世界的人机大战背后本应是科技圈和围棋圈的一场博弈,却成为了全社会舆论的焦点。谷歌想要做的绝不止一场人工智能战胜围棋冠军比赛那么简单。而为了此次大赛,谷歌也是做足了准备。一方面,谷歌自身做足了功夫。王小川分析:“此次人机大战是一次成功的商业运作。谷歌深刻地考虑了选什么人,他们做了充分的准备、缜密思考全盘的事情。谷歌此次动用了上万台的机器,对外宣称1200台,2000个GPU,比深蓝计算力提高了3万倍。”王小川表示,谷歌制造了一种必须取胜的强大气场,同样让人印象深刻,这也营造出了商业噱头,“他们花了超过4亿英镑收购这个团队,进入谷歌后,也得到了支持,你要什么资源,我都可以无条件满足你。”他的这一观点,和目前围棋排名第一的柯洁不谋而合,柯洁也表示,如果李世石输掉比赛,那么就是给谷歌的一次“免费宣传”。另一方面,谷歌多管齐下最大化地激发了社会化传播。很多科技巨头,如中国的李开复、王小川,甚至是国际竞争对手扎克伯格的关注和公开表态。今年将重点发力人工智能的搜狗、竞争激烈的视频网站等,也都在人机大战的流量中,找到了自己的增长点。从效果来看,此次人机大战是一次多赢的事件。人工智能揭露了谷歌的新野心为何一场围棋比赛会如此重要?除了被上升到人脑和电脑的竞赛外,也彰显出作为主办方谷歌的野心。2015年10月份,谷歌CEO皮查伊表态,谷歌计划将人工智能研发和所有核心业务联合起来,包括搜索引擎、广告、视频网站YouTube和电子商场Play。而实际上,谷歌想要用人工智能颠覆的绝不止于此。2015年3月,谷歌机器学习大规模应用于医药研发——经过多年的研究,神经网络深度学习应用于虚拟药物筛选,高通量的筛选过程通过计算机完成,可以检测出药物是否应该更换或者加量。同月谷歌宣布自动驾驶汽车将在5年内上市;2015年4月谷歌隐形眼镜实时监测血糖;2015年6月谷歌人工智能摄像头即时翻译拓展到27种语言;2015年10月谷歌利用人工智能来排名网页;2015年11月谷歌人工智能帮你回复邮件;2015年12月:谷歌开发人工智能聊天机器人……对此,关注互联网行业的华尔街顶级分析师卡洛斯科基纳曾表示,不论是投资者还是分析师,都忽略了谷歌在人工智能领域的布局。而在此之前,谷歌对于人工智能的成绩出奇地低调。曾和Facebook数次博弈同样巨资布局人工智能的还有Facebook、微软、苹果等各家商业巨头。而在所有巨头中,谷歌和Facebook的关系格外敏感。此次人机大战,人们也十分关注Facebook的反应,尽管facebook创始人扎克伯格对谷歌表示了祝贺之词。他们双方的博弈有很多细节,例如从对外发布上,如2015年11月,Facebook发表论文,提到了一种将蒙特卡洛数搜索与深度学习相结合的方法,称它甚至能够表现出人类般的下棋风格。没过几天,2015年12月初,谷歌阿法狗的创始人就表示,几个月后,我相信会出现一个大惊喜。此次谷歌大张旗鼓地赢得了与李世石的比赛背后,不仅揭示出谷歌的新野心,也折射出在与对手竞争中的退与进。人工智能是巨头们发展的方向,而“深度学习”是竞争的焦点。这一领域需要通过开源来吸引更多的开发者加入,来推动技术的进步;同时,这也是科技公司们集思广益,减少自己科研经费压力的一种方式;更为重要的是,越多的人使用一个平台,这个平台就会变得越来越好,这是一种网络效应。因此,人机大战背后,是巨头们的平台之争,也是巨头们下一轮战役的起跑枪。北京晨报记者 孙雨■名词解释模样围棋术语,指看轻局部得失注重未来收益的棋形。谷歌如此投放巨资,绝不只是想下围棋。■链接一局游戏引发的交易阿法狗此次的名声大噪,也让谷歌DeepMind公司很是长脸。DeepMind 2010年创立于英国,一直致力于创造可以模仿人类思维、学习如何玩电子游戏的人工神经网络。2014年被谷歌正式并入麾下。在尚未有任何正式产品的情况下,DeepMind仅仅凭借一个让电脑自学玩游戏的小程序,即被谷歌以超过4亿英镑收购,如此大手笔,当然是看中了技术背后的商业潜力。
来源:北京晨报编辑:季元恺从谷歌AlphaGo围棋高手,看人工智能-微众圈
微众圈,我的微信生活圈!
微信扫一扫阅读
从谷歌AlphaGo围棋高手,看人工智能
摘自公众号:发布时间: 21:12:49
这是一场事关人类未来的战斗!谷歌AlphaGo人工智能与围棋世界冠军李世石的人机大战已经开始了,第一场李世石输了。 AlphaGo是围棋程序界的常胜将军。此前与法国“疯石”、日本“zen”等当今最优秀围棋程序进行的500盘博弈中,只输了一盘。几个月前,它击败了欧洲围棋冠军、前中国职业棋手樊麾,一时名声大噪。 AlphaGo背后是深度思维(DeepMind),一家英国公司,成立于2011年,总部位于伦敦,一直鲜为人知。这一次人机大战的主角AlphaGo的背后,就是这家成立不到5年的深度思维公司。 该公司的创始人是哈撒比斯(Demis Hassabis) 人工智能是什么?如果你一直以来把人工智能(AI)当做科幻小说,但是近来却不但听到很多正经人严肃的讨论这个问题,你可能也会困惑。这种困惑是有原因的:1.我们总是把人工智能和电影想到一起。星球大战、终结者、2001:太空漫游等等。电影是虚构的,那些电影角色也是虚构的,所以我们总是觉得人工智能缺乏真实感。 2.人工智能是个很宽泛的话题。从手机上的计算器到无人驾驶汽车,到未来可能改变世界的重大变革,人工智能可以用来描述很多东西,所以人们会有疑惑。 3.我们日常生活中已经每天都在使用人工智能了,只是我们没意识到而已。John McCarthy,在1956年最早使用了人工智能(Artificial Intelligence)这个词。他总是抱怨“一旦一样东西用人工智能实现了,人们就不再叫它人工智能了。”因为这种效应,所以人工智能听起来总让人觉得是未来的神秘存在,而不是身边已经存在的现实。同时,这种效应也让人们觉得人工智能是一个从未被实现过的流行理念。Kurzweil提到经常有人说人工智能在80年代就被遗弃了,这种说法就好像“互联网已经在21世纪初互联网泡沫爆炸时死去了”一般滑稽。 所以,让我们从头开始。 首先,不要一提到人工智能就想着机器人。机器人只是人工智能的容器,机器人有时候是人形,有时候不是,但是人工智能自身只是机器人体内的电脑。人工智能是大脑的话,机器人就是身体――而且这个身体不一定是必需的。比如说Siri背后的软件和数据是人工智能,Siri说话的声音是这个人工智能的人格化体现,但是Siri本身并没有机器人这个组成部分。 其次,你可能听过“奇点”或者“技术奇点”这种说法。这种说法在数学上用来描述类似渐进的情况,这种情况下通常的规律就不适用了。这种说法同样被用在物理上来描述无限小的高密度黑洞,同样是通常的规律不适用的情况。Kurzweil则把奇点定义为加速回报定律达到了极限,技术进步以近乎无限的速度发展,而奇点之后我们将在一个完全不同的世界生活的。但是当下的很多思考人工智能的人已经不再用奇点这个说法了,而且这种说法很容易把人弄混,所以本文也尽量少用。 最后,人工智能的概念很宽,所以人工智能也分很多种,我们按照人工智能的实力将其分成三大类。弱人工智能Artificial Narrow Intelligence (ANI): 弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。 强人工智能Artificial General Intelligence (AGI): 人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。Linda Gottfredson教授把智能定义为“一种宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。”强人工智能在进行这些操作时应该和人类一样得心应手。 超人工智能Artificial Superintelligence (ASI): 牛津哲学家,知名人工智能思想家Nick Bostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。超人工智能也正是为什么人工智能这个话题这么火热的缘故,同样也是为什么永生和灭绝这两个词会在本文中多次出现。现在,人类已经掌握了弱人工智能。其实弱人工智能无处不在,人工智能革命是从弱人工智能,通过强人工智能,最终到达超人工智能的旅途。这段旅途中人类可能会生还下来,可能不会,但是无论如何,世界将变得完全不一样。 接下里我们看一看AlphaGo原理最近我仔细看了下AlphaGo在科学杂志《Nature》上发表的文章,写一些分析给大家分享。AlphaGo这个系统主要由几个部分组成:1. 走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。2. 快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。3. 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。4. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。我们的DarkForest和AlphaGo同样是用4搭建的系统。DarkForest较AlphaGo而言,在训练时加强了1,而少了2和3,然后以开源软件Pachi的缺省策略(default policy)部分替代了2的功能。以下介绍下各部分。 1.走棋网络:走棋网络把当前局面作为输入,预测/采样下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。DarkForest在这部分有创新,通过在训练时预测三步而非一步,提高了策略输出的质量,和他们在使用增强学习进行自我对局后得到的走棋网络(RL network)的效果相当。当然,他们并没有在最后的系统中使用增强学习后的网络,而是用了直接通过训练学习到的网络(SLnetwork),理由是RLnetwork输出的走棋缺乏变化,对搜索不利。有意思的是在AlphaGo为了速度上的考虑,只用了宽度为192的网络,而并没有使用最好的宽度为384的网络(见图2(a)),所以要是GPU更快一点(或者更多一点),AlphaGo肯定是会变得更强的。所谓的0.1秒走一步,就是纯粹用这样的网络,下出有最高置信度的合法着法。这种做法一点也没有做搜索,但是大局观非常强,不会陷入局部战斗中,说它建模了“棋感”一点也没有错。我们把DarkForest的走棋网络直接放上KGS就有3d的水平,让所有人都惊叹了下。可以说,这一波围棋AI的突破,主要得益于走棋网络的突破。这个在以前是不可想像的,以前用的是基于规则,或者基于局部形状再加上简单线性分类器训练的走子生成法,需要慢慢调参数年,才有进步。当然,只用走棋网络问题也很多,就我们在DarkForest上看到的来说,会不顾大小无谓争劫,会无谓脱先,不顾局部死活,对杀出错,等等。有点像高手不经认真思考的随手棋。因为走棋网络没有价值判断功能,只是凭“直觉”在下棋,只有在加了搜索之后,电脑才有价值判断的能力。2. 快速走子那有了走棋网络,为什么还要做快速走子呢?有两个原因,首先走棋网络的运行速度是比较慢的,AlphaGo说是3毫秒,我们这里也差不多,而快速走子能做到几微秒级别,差了1000倍。所以在走棋网络没有返回的时候让CPU不闲着先搜索起来是很重要的,等到网络返回更好的着法后,再更新对应的着法信息。其次,快速走子可以用来评估盘面。由于天文数字般的可能局面数,围棋的搜索是毫无希望走到底的,搜索到一定程度就要对现有局面做个估分。在没有估值网络的时候,不像国象可以通过算棋子的分数来对盘面做比较精确的估值,围棋盘面的估计得要通过模拟走子来进行,从当前盘面一路走到底,不考虑岔路地算出胜负,然后把胜负值作为当前盘面价值的一个估计。这里有个需要权衡的地方:在同等时间下,模拟走子的质量高,单次估值精度高但走子速度慢;模拟走子速度快乃至使用随机走子,虽然单次估值精度低,但可以多模拟几次算平均值,效果未必不好。所以说,如果有一个质量高又速度快的走子策略,那对于棋力的提高是非常有帮助的。为了达到这个目标,神经网络的模型就显得太慢,还是要用传统的局部特征匹配(local pattern matching)加线性回归(logistic regression)的方法,这办法虽然不新但非常好使,几乎所有的广告推荐,竞价排名,新闻排序,都是用的它。与更为传统的基于规则的方案相比,它在吸纳了众多高手对局之后就具备了用梯度下降法自动调参的能力,所以性能提高起来会更快更省心。AlphaGo用这个办法达到了2微秒的走子速度和24.2%的走子准确率。24.2%的意思是说它的最好预测和围棋高手的下子有0.242的概率是重合的,相比之下,走棋网络在GPU上用2毫秒能达到57%的准确率。这里,我们就看到了走子速度和精度的权衡。和训练深度学习模型不同,快速走子用到了局部特征匹配,自然需要一些围棋的领域知识来选择局部特征。对此AlphaGo只提供了局部特征的数目(见Extended Table 4),而没有说明特征的具体细节。我最近也实验了他们的办法,达到了25.1%的准确率和4-5微秒的走子速度,然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力,因为只要走错关键的一步,局面判断就完全错误了;而图2(b)更能体现他们快速走子对盘面形势估计的精确度,要能达到他们图2(b)这样的水准,比简单地匹配24.2%要做更多的工作,而他们并未在文章中强调这一点。在AlphaGo有了快速走子之后,不需要走棋网络和估值网络,不借助任何深度学习和GPU的帮助,不使用增强学习,在单机上就已经达到了3d的水平(见Extended Table 7倒数第二行),这是相当厉害的了。任何使用传统方法在单机上达到这个水平的围棋程序,都需要花费数年的时间。在AlphaGo之前,Aja Huang曾经自己写过非常不错的围棋程序,在这方面相信是有很多的积累的。3. 估值网络AlphaGo的估值网络可以说是锦上添花的部分,从Fig 2(b)和Extended Table 7来看,没有它AlphaGo也不会变得太弱,至少还是会在7d-8d的水平。少了估值网络,等级分少了480分,但是少了走棋网络,等级分就会少掉800至1000分。特别有意思的是,如果只用估值网络来评估局面(2177),那其效果还不及只用快速走子(2416),只有将两个合起来才有更大的提高。我的猜测是,估值网络和快速走子对盘面估计是互补的,在棋局一开始时,大家下得比较和气,估值网络会比较重要;但在有复杂的死活或是对杀时,通过快速走子来估计盘面就变得更重要了。考虑到估值网络是整个系统中最难训练的部分(需要三千万局自我对局),我猜测它是最晚做出来并且最有可能能进一步提高的。关于估值网络训练数据的生成,值得注意的是文章中的附录小字部分。与走棋网络不同,每一盘棋只取一个样本来训练以避免过拟合,不然对同一对局而言输入稍有不同而输出都相同,对训练是非常不利的。这就是为什么需要三千万局,而非三千万个盘面的原因。对于每局自我对局,取样本是很有讲究的,先用SL network保证走棋的多样性,然后随机走子,取盘面,然后用更精确的RL network走到底以得到最正确的胜负估计。当然这样做的效果比用单一网络相比好多少,我不好说。一个让我吃惊的地方是,他们完全没有做任何局部死活/对杀分析,纯粹是用暴力训练法训练出一个相当不错的估值网络。这在一定程度上说明深度卷积网络(DCNN)有自动将问题分解成子问题,并分别解决的能力。另外,我猜测他们在取训练样本时,判定最终胜负用的是中国规则。所以说三月和李世石对局的时候也要求用中国规则,不然如果换成别的规则,就需要重新训练估值网络(虽然我估计结果差距不会太大)。至于为什么一开始就用的中国规则,我的猜测是编程非常方便(我在写DarkForest的时候也是这样觉得的)。4. 蒙特卡罗树搜索这部分基本用的是传统方法,没有太多可以评论的,他们用的是带先验的UCT,即先考虑DCNN认为比较好的着法,然后等到每个着法探索次数多了,选择更相信探索得来的胜率值。而DarkForest则直接选了DCNN推荐的前3或是前5的着法进行搜索。我初步试验下来效果差不多,当然他们的办法更灵活些,在允许使用大量搜索次数的情况下,他们的办法可以找到一些DCNN认为不好但却对局面至关重要的着法。一个有趣的地方是在每次搜索到叶子节点时,没有立即展开叶子节点,而是等到访问次数到达一定数目(40)才展开,这样避免产生太多的分支,分散搜索的注意力,也能节省GPU的宝贵资源,同时在展开时,对叶节点的盘面估值会更准确些。除此之外,他们也用了一些技巧,以在搜索一开始时,避免多个线程同时搜索一路变化,这部分我们在DarkForest中也注意到了,并且做了改进。5. 总结总的来说,这整篇文章是一个系统性的工作,而不是一两个小点有了突破就能达到的胜利。在成功背后,是作者们,特别是两位第一作者David Silver和Aja Huang,在博士阶段及毕业以后五年以上的积累,非一朝一夕所能完成的。他们能做出AlphaGo并享有现在的荣誉,是实至名归的。从以上分析也可以看出,与之前的围棋系统相比,AlphaGo较少依赖围棋的领域知识,但还远未达到通用系统的程度。职业棋手可以在看过了寥寥几局之后明白对手的风格并采取相应策略,一位资深游戏玩家也可以在玩一个新游戏几次后很快上手,但到目前为止,人工智能系统要达到人类水平,还是需要大量样本的训练的。可以说,没有千年来众多棋手在围棋上的积累,就没有围棋AI的今天。在AlphaGo中,增强学习(Reinforcement Learning)所扮演的角色并没有想像中那么大。在理想情况下,我们希望人工智能系统能在对局中动态地适应环境和对手的招式并且找到办法反制之,但是在AlphaGo中增强学习更多地是用于提供更多质量更好的样本,给有监督学习(Supervised Learning)以训练出更好的模型。在这方面增强学习还有很长的路要走。 常见的几个问题:问题1:“Alphago的MCTS做rollout的时候,除了使用快速走子,还用了搜索树的已有部分,看起来像是AMAF/RAVE反过来:AMAF是把快速走子的信息传导到树的其它无关部分,Alphago是把树的其它无关部分拿来增强快速走子。我怀疑这是不是它棋力比其它DCNN+MCTS强的原因之一。&这个办法在解死活题的文章中出现过,会在一定程度上提高搜索效率,但是提高多少还不知道。问题2:“rollout的走法质量变好可能会导致棋力下降。”这里要分两种情况,tree policy和default policy。在AlphaGo的文章里面已经说过了,tree policy的分布不能太尖,不然在搜索时太过重视一些看起来的好着,可能使得棋力下降。但是除了这种原因,一般来说tree policy变好棋力还是会变强的。default policy这边,即(半)随机走子到最后然后判分,就很复杂了,质量变好未必对局面能估得更准。default policy需要保证的是每块棋的死活大体正确,不要把死的棋下成活的或者反之,而对大局观的要求反而没有那么高。双方完全可以配合着把每块棋下完,然后转战另一块,而不是说抢在对方前去别处占先手。作者:田渊栋 来源:知乎链接:/yuandong/ 前面说到:不要一提到人工智能就想着机器人。机器人只是人工智能的容器。那么随着人工智能的临近,人工智能的容器――机器人备受好评的又有哪些呢,一起来看看:1、Atlas制造者:波士顿动力公司Atlas身高1.83米,体重为270斤,具备光线检测、距离检测、以及声音传感器功能。众多出色的功能,使得Atlas被誉为是世界上最先进的机器人。 2、个人机器人PR2制造者:美国佐治亚理工学院教授查理.坎普PR2(PersonalRobot2)是威楼加拉吉生产的机器人,在PR2的底部有两台8核的电脑作为机器人各硬件的控制和通讯中枢。PR2能够自己开门,找到插头并给自己充电,能打开冰箱取出啤酒,能打简单的台球等多种复杂的任务。 3、太空探索机器人Valkyrie制造者:约翰逊航天中心Valkyrie开发于约翰逊航天中心,其身高1.89米、重124.7公斤,探索太空将是Valkyrie的使命之一,比如执行火星殖民等任务时,Valkyrie将发挥巨大作用。 4、天后明星HRP-4C制造者:日本国立先进工业科学与技术研究所作为世界上最先进的人形机器人之,HRP-4C饱受好评,她不仅拥有美少女的外形,还能歌善舞。在今年10月的东京数字博览会上她的“惊艳”的舞技,引起了观众们的阵阵惊呼。 5、生化机器人BionicMan制造者:N/A(美国)据了解,生化电子人Bionicman配置的人工心脏能够利用电子工具跳动和促进血液循环,除此还植入了人工肾脏以及电子耳和视网膜等组件。Bionicman身高约1.98米,拥有大约六、七成真人的功能,能在Rex助步机协助下走动、坐下和站立。 6、机器人战士Portonman制造者:英国国防科技与技术实验室PortonMan有着一双会让人觉得不安的大眼睛,当它移动头与你目光相会时,空洞的眼神一定会吓着你。不过幸运的是,这个长得毛骨悚然的家伙目前暂时不会用在战场上,它的主要任务是帮助军队做一些危险的测试工作。 7、能人贾斯汀制造者:德国航空航天中心机器人和机电一体化研究所这款“贾斯汀”能用手臂和手指处理细微的任务。它不仅可以冲泡咖啡,还可以被用作远程操控机器人派到外太空执行复杂任务。“贾斯汀”的传感器和摄像头能将它的外部环境以3D效果呈现,这将有助于它执行一定程度的自主性任务。 8、意识控制机器人Morpheus制造者:NASAMorpheus是少数完全通过大脑思维进行控制的机器人之一。因此他将是NASA用于对外太空探索的专用机器人。尽管目前从人意念集中到该机器人的行动之间的平均时间差是5至10秒,不过相比于人类的思维速度,还要慢上一些。 9、战场救护机器人Bear制造者:NASA战场上寻找受伤的伤员并用将他们转移到安全的地方,这是Bear诞生的使命。它能够在具有核辐射、化学污染或地震后濒临倒塌的建筑物中执行搜救任务。 在许多方面,Bear都像是直接出自科幻小说。不过它的灵活性不依赖于滑动、门架或转盘,而是依靠腿,膝盖,肘以及面部。在不久的将来,它还可以蹲坐,举起一个250磅的人,并且可以把他从一段楼梯上抱下来。此外,即使是伤员在其两臂间活动,它仍可保持平衡。它坚固、灵巧、可移动,某些方面接近人的感觉。 10、波士顿机械狗制造者:谷歌机械狗不仅能够行走、下蹲,还能像人类一样举双手庆祝。作为美军的运输机器人,波士顿机械狗实用性极强。 11、木户小姐制造者:KOKORO公司木户小姐是由日本著名机器人研究所KOKORO公司研制的仿真机器人。截止2010年,木户小姐已经研制出了三代产品。 12、警察机器人Telebot制造者:佛罗理达州国际大学的探索实验室操控者只需戴着OculusRift虚拟头盔,穿一件用来跟踪运动的背心,胳膊上绑上手臂环,以及一个配置运动传感器的手套,就可以远程控制Telebot机器人了。日后在打击城市暴力等方面Telebot将帮上大忙。 13、机器人重金属乐队Compressorhead制造者:N/A(德国)这支机器人乐队共有三位成员:四条手臂的鼓手Stickboy、78根指头的吉他手Fingers、以及有史以来最精确的贝司手Bones。他们的表演惟妙惟肖,简直可以以假乱真。 14、会跳舞的机器人制造者:日本本田公司AsimoASIMO是由日本Honda(本田)工业技研公司研制的仿人机器人,是迄今为止最先进的仿人机器人。最新款的ASIMO不但可以快速行走、爬楼梯、跳舞、踢球,还可以进行单脚跳跃,甚至可以使用日本手语进行交流。 15、治愈系机器人Paro制造者:日本大和房屋工业公司Paro不仅拥有毛绒海豹的可爱外形,它周身还装有5种类型的传感器,可以感应光、触碰、声音、温度和姿势。因此它可以对人的触摸做出互动,当有人呼叫它的名字时,它也能做出相应的动作表示回应。 16、CrabsterCR200水下机器人制造者:韩国船舶及海洋工程研究院六足Crabster机器人重达680千克,能够帮助科学家探索之前从未到过的海床。这台机器人的潜深为200米,装备有11台摄像机、声呐及声学多普勒流速剖面仪。 17、战斗机器人Guardium制造者:以色列军方战斗机器人Guardium具备夜视能力、站岗不打瞌睡、负重300公斤毫不抱怨,和优秀的士兵简直毫无差别。如果投入现役,这种“士兵”可替代真人,执行危险任务,减少实战伤亡人数。 18、好奇漫游者制造者:美国国家航空航天局喷气推进实验室“好奇漫游者”用于探索火星,它可以抓取岩石并放入“身体”内进行检测。科学家们认为“好奇漫游者”是发现火星上存在有机物的最佳工具,而且它还可以在第一时间把现场的录像发回地球。 19、会话机器人AnyBotsQB制造者:鲍勃.克理斯托弗虽然我们已经有电话会议技术了,但有些时候你仍然会觉得分身乏术。Anybots的QB机器人可以帮你解决这个问题,其推销词为“你的化身”。QB是一个人类大小的装置,扬声器、麦克风、摄像头以及显示屏都装载在轮子上。用户可以通过使用浏览器和键盘来控制QB机器人,机器人所看到的即为操控者所见,使用者还可让机器人走动并与远在世界另一端的人互动。譬如,一个在美国加利福尼亚的工程师能用QB机器人检查其在马来西亚的生产线团队。 20、奥克塔维亚制造者:美国海军研究实验室智能系统部门“奥克塔维亚”装配了红外线、镭射传感器和微型摄像头,可以很好的与人类进行互动。回答问题时,它的眉毛会扬起,眼睛还会转向并跟随提问者;当它进行思考时就会眯上眼睛;而当她震惊的时候,她会张开嘴巴,同时皱起眉头。 21、村田女郎制造者:日本村田制作所“村田女郎”装备了陀螺传感器来控制移动和保持平衡。“村田女郎”上的传感器用于侦测障碍物,并配有传输实时画面的摄像头,所有功能可通过蓝牙控制。目前村田女郎已经进行了升级,新版本可以在一条S形的杆子上走动而不跌倒。 22、战场运输机器人LS3Quadruped制造者:谷歌LS3机器人能够在平坦的路上达到最高时速28.3英里每小时,比飞人博尔特20米冲刺时的最快速度更快。在最近的实验中,机器人在崎岖的山路上依然能够保持相当快的速度,并且随身携带了名为TacticalRobot控制器的触摸屏设备,如果不小心卡住的话能够自动调节其相关的移动关节继续前进。 23、比娜A48制造者:美国汉森机器人技术公司“比娜A48”可以进行智商大概在3岁至4岁水平的谈话。“比娜A48”的设计者介绍,制造它的想法是“为了探索人类实现技术上永生的可能性”。为此,比娜录制了超过20小时的谈话作为样本,以供“比娜A48”在回答问题时进行参照。 24、爱因斯坦机器人Einstein制造者:大卫.汉森Einstein是美国汉森机器人公司的机器人专家大卫?汉森设计的一款类人机器人。它不仅能识别喜怒哀乐、恐惧、迷茫等数以百计的面部表情,推断人的年龄和性别,还能做出相应表情回应,模拟点头、摇头、扬眉等简单动作。 25、游侠制造者:美国康奈尔大学的安迪.瑞那许多机器人专家都关心如何在不依赖能量的情况下最大限度地提升机器人性能,但安迪?瑞那关心的则是如果将能量运用到极致。“游侠”不会与人交流,它的“眼睛”只是弹簧,为的是在它不小心跌倒的时候能起到保护作用。 26、毛绒智能机器人Romibo制造者:Aubrey shickRomibo一改机器人的冰冷外形,拥有一双由iphone显示屏构造成的萌萌的大眼睛。通过修改源代码,你可以用ipad操控它的眼睛,从而表现它不同的的心情和状态。此外,Romibo还安装有众多传感器,包括光线传感器以及加速度传感器。未来这款机器人将拥有更多社会属性,如实现与残障人士互动,代替导盲犬或者家庭护理员等。 27、标准先进武装机器人MAARS制造者:英国国防科技公司奎奈蒂克北美分公司新款MAARS装配有40毫米的高爆榴弹和一挺装载450发子弹的M240B型机枪,它已经能很熟练的使用机器人手臂,并配备了额外的摄像头,这有助于增加士兵们通过视频操控机器人时对环境的感知能力。 28、EMIEW2制造者:日立公司EMIEW2能递送饮料或者文件,还能使用地图生成程序和扫描测距仪引导来访者到达正确的桌子、椅子和通道。向EMIEW2说话时,它能通过麦克风和声音识别系统分辨是命令还是谈话。EMIEW2依靠轮子转弯,在负重时通过跪着来保持稳定。 29、看护机器人制造者:日本丰田公司丰田的看护机器人于2005年首次亮相,它可以打鼓、吹小号、演奏小提琴,还能帮助人们做很多杂事。目前,这种机器人有5个版本,包括一个能攀爬的机器人。 30、黏黏虫三代制造者:美国斯坦福大学仿生操控实验室最新款的“黏黏虫”机器人拥有19个负责移动关节的微型处理器和一个大尾巴,这可以更好地保持平衡。马克?库特考斯基介绍,“黏黏虫”三代的设计借鉴了动物界最优秀的攀爬能手―――壁虎。 31、达芬奇外科手术系统制造者:美国直觉外科手术公司使用达芬奇外科手术系统进行手术的外科医生可以通过查看监视器来操控机械手臂,这可以最大限度的减低外科手术的风险。达芬奇外科手术系统的主要组成部分是4个机械手臂,目前该机器人已经运用于手术室。 32、抛式机器人ThrowbotXT制造者:美国陆军“ThrowbotXT”的大小和造型和一个啤酒罐差不多,可以扔进窗子里,可以隔着墙扔过去,也可以扔到房顶,然后遥控它四处滚动侦察情况。军警人员可以把ThrowbotXT投掷到危险的地方,让现场人员了解危急情况。 33、大狗BigDog制造者:美国陆军“大狗”有四条腿,类似于《星球大战》中的行走器,其设计目的是为了协助美国步兵在没有道路的地区搬运装备。“大狗”的第一个雏形还处于试验阶段,已经能够自行判断从左边还是右边绕过一棵树,不过装备枪支并自动开火这一功能暂时还不能实现。 34、HomeAssistantRobot制造者:日本丰田公司和东京大学联合研这是由日本丰田公司和东京大学联合研究开发的家庭机器人保姆(HomeAssistantRobot),她可以给您端茶倒水、为您抹桌扫地、该做的事情做、不该看的事情不看。 35、WowWeeMiP玩具机器人制造者:美国加州大学圣迭戈分校机器人实验室加州大学圣迭戈分校机器人实验室与厂商合作开发的MiP是第一台商业化自平衡玩具机器人。这台机器人在一系列多轴陀螺仪和加速度计的协助下能维持站立姿态,还能理解手势命令。 36、搜索者DASH制造者:美国加州大学伯克利分校毫系统防生实验室DASH机器人可谓机器人界的蟑螂,它只有16克重,每秒能移动15个体长,从高处落下也能毫发无损。DASH配置了一个无线电话摄影机和微型定制中央处理器陀螺仪,主要用于搜索灾难现场。 37、家务机器人制造者:英特尔公司和卡耐基梅隆大学目前家务机器人能做到扔垃圾、刷盘子,以及把盘子摆进洗碗机,不过它还存在一些小缺陷,离投放市场尚有一段距离。 38、机器苍蝇制造者:美国哈佛大学微型机器人实验室的罗伯特.伍德“机器苍蝇”拥有每秒可扇动120下的碳素纤维翅膀,是首个昆虫大小的飞行机器人。虽然它的首次飞行只有很短的距离,但罗伯特?伍德表示,完全有信心让“机器苍蝇”在将来携带摄像头飞行几公里远。 39、类人机器人RobotisMini制造者:Robotis公司RobotisMini是可编程的,而且可以对碰触、手势以及口头命令作出反应,而且反应很快,也很准确。一些用户抱怨说,组装这款机器人非常困难,而该公司也心照不宣地承认了这一点,因为其提供了教学视频来帮助用户完成耗时数小时的组装程序。 40、iCub机器人制造者:Bron研究所这是欧盟资助的机器人cub项目的一部分。这个iCub机器人和一个三岁小孩的身形差不多大,有着灵巧的双手,链接的头部和眼睛。他们有倾听和触摸的能力。这个机器人是匍匐而行的,同时还可以端坐。 41、AIBO制造者:SONYAIBO是SONY新力公司于1999年首次推出的电子机器宠物。AIBO的出现不仅代表了一具机器宠物的诞生,更重要的是AIBO配合了人工智能的科技,朝提供生活娱乐的方向发展。尽管已经停产,但是AIBO在日本仍有一大批忠实的粉丝。 42、Litter-Robot制造者:Litter robotLitter-Robot内置的传感器可以捕捉到猫咪在家活动过的地方,之后它就会像一个巨大的混凝土搅拌机一样旋转起来,把大块垃圾筛选出来,储存到一个垃圾盘里面。有了这个机器人就不怕猫咪自己在家“折腾”了。 43、LegoMindstormsEV3制造者:丹麦乐高公司和美国麻省理工学院的媒体实验室LegoMindstorms(乐高机器人)是集合了可编程主机、电动马达、传感器、LegoTechnic部分(齿轮、轮轴、横梁、插销)的统称。Mindstorms起源于益智玩具中可编程传感器模具。 44、小优机器人制造者:爱乐优小优机器人是一个具有生命特征的智能机器人,可以成为您温馨家庭的一名小成员。它上知天文下知地理,什么语文、数学、英语、科学、音乐、美术,全不在话下。孩子在家就可以轻松学习,有的家长开玩笑说,以后就不用送孩子去幼儿园了。 45、NAO机器人制造者:Aldebaran robotics 公司 NAO机器人是一款人工智能机器人。它拥有着讨人喜欢的外形,而且具备有一定水平的人工智能,能够与人亲切的互动。 46、学习机器人Kibo制造者:Kinderlab 机器公司Kibo是专门为4到7岁的儿童而设计的一款学习工具,儿童可以利用能够形成不同命令的木块来为这款机器人编程。Kibo可以扫描木块序列,然后执行命令,它也会对声音、光线以及障碍物作出反应。这款设备背后的想法并不主要是让孩子们理解编程,而且是在讲故事以及角色扮演等游戏活动之外,为孩子们添加新的乐趣。 47、AethonTUG制造者:AethonAethonTUG机器人可以通过系统设定进行送餐、送药、整理患者的床单和脏餐盘,收集医院的废物等活动。利用医院的WiFi信号与中央系统通信,TUG能躲避障碍,乘坐电梯。AethonTUG提高了医院的工作效率。 48、rockaRoo制造者:4mons美国4mons公司制造了这款全自动婴儿车rockaRoo。它每秒钟可以追踪婴儿的重心和睡姿好几百次,并且能用利用固定在婴儿车底部的活动椅来重复婴儿的摇晃动作。rockaRoo的马达发出的声音很小,不会打扰婴儿睡觉,也不会妨碍婴儿听到其父母通过这款设备的内部扬声器放出来的音乐。 49、地板擦拭机器Scooba450制造者:iRobotScooba450,它会将地板弄湿,撒上去污剂,然后擦拭地板并且吸走脏水,之后再用橡胶滚轴来一次最终清洁。 50、真空吸尘器NeatoBotvac制造者:Neato 真空吸尘器在消费市场上是一个规模最大也最具竞争性的消费机器人品类这款NeatoBotvac真空吸尘器需要人们对之做的清洁就更少了,而它的主要优点还包括良好的吸尘能力以及较低的厚度,这使得它能够钻到沙发底下去。 在未来,机器人或许可以像手机一样普及,甚至是成为人们的“伙伴”。因此对于机器人,我们更多的应该是向往而不是惧怕。 ITT 看点:1.谷歌人工智能系统全部开源;2.人是制造者,机器人是执行者,所以不用畏惧;3.最重要的人工智能将来自云端。 ITTBANK : 我们的世界因技术而改变! 云蛋(ittstore)IC银行:这个世界上没有库存,只是放错了地方! 全球创客会(ITTChina):如果你是创客就请进!
微信号:ittbank

我要回帖

更多关于 谷歌机器人围棋 的文章

 

随机推荐