谷歌围棋ai ipad qq围棋下载安装装

当前位置 & &
& AI/人类终极围棋大战来袭:YouTube全程直播
AI/人类终极围棋大战来袭:YouTube全程直播
14:06:25&&作者:
编辑:冰冰 &&)
让小伙伴们也看看:
阅读更多:
好文共享:
文章观点支持
当前平均分:0(0 次打分)
[02-05][02-05][02-04][02-04][02-04][02-04][02-03][02-03][02-03][02-03]
登录驱动之家
没有帐号?
用合作网站帐户直接登录谷歌围棋大战,百度无人车三年商用,AI离你不远了--百度百家
谷歌围棋大战,百度无人车三年商用,AI离你不远了
分享到微信朋友圈
人工智能给我们带来了什么?
在谷歌人工智能“AlphaGo”与世界围棋冠军李世石的对战中,连续三场都以李世石战败告终,此外百度无人车也宣布要在三年内实现商用,最近人工智能的话题长期争夺着公众眼球,似乎人工智能是一个遥不可及的存在,但事实上当前的人工智能的应用已经不再是远在天边触不可及的事情,当前人工智能为我们带来的价值已经并非局限于“人机大战”的娱乐活动中,人工智能实际上已经大量融入到我们的日常生活中,我们的生活被大量的改变,那么到底人工智能到底为我们的生活带来了哪些改变?这里来做一次盘点。
一,语音识别
1)语音搜索
这是人工智能最有望进入日常实际应用但却相当具备难度的领域。以百度语音搜索举例,你拿起手机百度语音搜索“今天上映什么电影?”系统会直接告诉你“今天正在上映的电影以及具体排期”,你再问“明天呢?”他会直接告诉你“明天上映电影排期”,而不用你问明天上映什么电影。相比较一个能够靠超强运算能力和学习能力打败李世石的人工智能围棋计算程序,能听得懂人类开放性指令,能和人类实现多轮对话的智能语音搜索显然更加富有实用性,同时也更具备生命力和想象力。
事实上,语音搜索是集多项人工智能技术之大成,包括将用户的声音转换成文字的语音识别技术、深入分析理解用户需求的自然语言处理技术、帮用户找到所求的智能搜索技术等等。然而最可贵的是,由于所有人都可以对着手机百度说话,告诉它你的需求,而机器会识别出你讲的话,理解你在讲什么,自动处理纷繁复杂的需求。如果表达的信息还不充分,机器还会像人一样,和你多轮对话,直到给出你满意的答案。人工智能其实就这么近,近在你身边。
2)翻译应用
在微信中,用户可以将对方发送的语音直接转换为文字,这其中就是语音技术的积累。而在百度翻译中,可以直接识别外语语音,并且转化为中文输出,这还因此获得了国家科技进步奖。
百度的是今年唯一一个入选《麻省理工评论》十大突破性技术的中国企业,而其中入选的就是吴恩达带领的Deep speech2深度学习语音技术,《MIT》认为亚洲是一个语音技术商业化的绝佳市场,由于汉语输入的繁琐,使得语音技术有着极大的机会,而BAT三家也在积极布局中,其中百度在语音技术方面保持着绝对领先。
二,图像识别
1)图像搜索
图像搜索有着巨大的市场需求,例如在淘宝中就有着“淘立拍”功能,用户在线下看到有自己喜欢的衣服、包包、裤子等产品就可以通过拍照再上传到淘宝寻找自己想要的产品,这是很多女性常用的功能。
其次微信“扫一扫”、“手机百度”、“百度翻译”中也加入了图像识别功能,用户可以将对应的杂志、书籍、生活用品、建筑物等等照片发送给机器,而机器就会告诉用户答案。
另外,当学生在遇到不会做的题目时,也可以通过拍照上传的方式让APP告诉自己答案,目前作业帮、学霸君等等APP已经能够做到。
2)人脸识别
“百度魔图APP”推出的明星脸识别功能曾经火爆一时,用户通过上传自己头像后,百度魔图来找到与该头像最为相似的明星,并标明相似程度,以此吸引用户。此外微软也曾推出过“how-old”网站,用户通过上传照片,机器给出其年龄,也曾火爆一时。
此外人脸识别还被阿里巴巴用到了支付宝的安全系统中,马云曾在德国汉诺威博览会上通过“刷脸支付”技术,而此后在支付宝的9.3中正式开启了“刷脸”登陆功能,用户登陆支付宝只需要通过刷脸即可,而阿里也在有计划将刷脸功能与支付功能结合在一起,潜力不小。
三,自然语言理解NLP技术
1)搜索引擎
当我们在搜索引擎中输入“为什么会下雨”的关键词后,搜索引擎就会利用自身技术理解用户想要知道的是“为什么会下雨”这个自然原理,就会通过全网为用户调取相应的结果。而现代人也已经养成习惯,当有任何不知道的问题就会及时向搜索引擎求助,搜索引擎已经成为我们获得第一问题答案的主要来源,因此搜索引擎在自然语言理解NLP技术上有着很大的发展。
2)智能玩具
当机器理解自然语言之后,除了应用在搜索引擎中,更重要的一个场景就是人机对话,例如智能玩具,当前的智能玩具已经实现了与用户对话的能力,例如国外的Zoomer智能恐龙根据主人的不同指令,可以实现诸如坐下、跟着我、看着我、去睡觉等等不同的回应,而国内也有图灵机器人在与奥飞动漫一起尝试智能玩具,奥飞旗下知名IP“小飞侠”正在变成一款智能玩具。
3)客服系统
人工智能也在入侵客服领域,小到淘宝店、天猫店、大到支付宝、中移动都开始部分接入人工智能客服系统,节省了大量人力,而很多第三方公司也开放相应人工智能客服API,让企业接入到淘宝旺旺、QQ、微信公众号、网页之中。
此外,苹果还独家开发了“SIRI”人工智能系统,用户可以通过语音向其获得答案,而百度也在2015年的百度世界上发布了“度秘”,加入到手机百度、百度地图、糯米中用户可以通过“度秘”的文字与语音对话,直接实现小到天气、地点查询大到O2O的服务实现。
四,大数据挖掘技术
1)大数据广告
大数据挖掘利用最多的就是被用到电商广告系统中,例如Facebook的用户在Facebook中搜索了相关的游戏、产品,关注了相关商业公司主页,Facebook就会为其推送精准的广告,而这在国内也是京东和淘宝的大数据广告也已走在前列。
2)辅助第三方决策
大数据挖掘另一个用处就是通过挖掘的数据辅助第三方决策,例如在商业方面,百度旗下的“百度指数”就可以让用户看到各种关键词的搜索,做好商业决策。此外在公共政策合作方面,百度地图、高德地图都与交通部进行数据共享,来协助交通部做好城市规划建设,而此前百度在春节推出的“百度迁徙”曾火爆一时。
五,无人车技术
以上都是已经应用的领域,最后再说一下无人车技术,这是谷歌、特斯拉、苹果这些国外高科技巨头公司都极为重视的领域,而国内的百度也是唯一一家在此项目上重点布局的企业。
无人车技术集合着大量的技术元素,例如需要高精尖的地图定位技术、语音识别技术、图像识别技术、自动控制技术等等,而百度也算是唯一一家能够在无人汽车领域有一定能力的公司,首先百度地图有着5亿用户的基数,在交通地图数据方面已经有了很强的积累,而其语音识别、图像识别均走在前沿领,各项技术的准备已经不再试问题。
无人车技术一旦实现,则会给这个世界带来惊人的变化,如同汽车的发明一般,届时,我们不再需要司机开车,用APP可以真正实现车辆调度,而整个城市的资源配置也可以实现更高效的利用。
结语:人工智能极为真实的改变了我们生活,帮助了我们在生活、学习、工作的方方面面,其深远的价值远非一次“人机”娱乐所能取代,因此当我们回过头来看才突然发现,我们早已无法离开人工智能,而正在高速发展的无人车行业正在预示着更加紧密的人机未来。
作者微信公众号:shouxifayanzhe
阅读:2020
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:21万
阅读:10万
热门文章HOT NEWS
美国消费者商品安全委员会CPSC宣布召回三星Galaxy No...
影视口碑榜
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻问题已关闭
与已有问题相似
问题已重定向至
怎么看谷歌Alphago围棋AI无让子完胜欧洲冠军?
国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。不太清楚欧洲职业二段的水平,但是这是不是就意味着,现在围棋AI已经走上了超越人类的路,已经找到了正确且有用的机器学校和AI算法【相比zen之前的蒙特卡罗】,剩下的只是时间问题。
我虽然知道围棋规则,但是我完全不知道围棋怎么下+++++但是毕竟围棋的棋盘大小是固定的,也就是说作为一个计算问题来理解的话,是“有界”的,虽然这个界限几乎可以让人认为是无穷,计算复杂度是10^360,也就是10的360次方,不过这个复杂度是作为构建树来搜索的一个程度,也就是说一般认为棋局一把是150步,一步有250解,所以大概是250^150,近似为10^360但是,作为一个有限大小的问题,随着时间的推移,始终是可以有办法去处理的大致看了下谷歌的处理方案文章具体下载位置,nature用的是深度学习的方法+蒙特卡罗树,构建两个网络,一个是决策网(policy nets),一个是评估网(value nets)+++++粗略来说,这两个网络可以通过不断训练的方法进一步优化计算模型value nets主要是用来推测每一次决策之后的获胜情况,这样可以通过计算出来的得分抛弃掉一些无意义的路线(而一般的贪婪则需要把所有的路线都评估一下)policy nets则是负责当前下棋的一些决策,说白了,就是决定怎么走子上面这两个网络,其实和人的思维比较相似。人在下棋的时候,也是会先考虑怎么走,走完之后再考虑怎么赢,而这两个思考实际上是同时在进行的。用了上面这组优化模型之后,其实计算量就会大幅下降,直到最后,将围棋问题彻底转化到一个可解的范畴上面去(当然不是马上就能实现)说白了,走子的核心思路依然要是一个树结构的推断,但是谷歌这里用了两个深度网络来减少树结构的运算量,以及增大决策的可信度+++++另外,神经网络(深度学习)最大优势在于样本越多,训练的效果会越好那说白了,你就直接给这东西“喂棋谱”,也就是喂得越多,它就能优化网络中的参数而且,这东西有很强的针对性以3月份要和李世石比赛为例。如果你专门去针对李世石的棋风进行训练的话,很有可能训练出一个针对性很强的AI来。相信一般大师级的围棋选手,下棋虽然风格多变,但也总是会有一些特征在里面的,而这些东西,人类虽然很难察觉,但是机器学习确是有可能发现的+++++所以,预计未来总会有一天,人类下围棋是再也不可能下的赢电脑了,至于这一天什么时候到来。。。那就不清楚了
早上被一大堆邀请吓到,乍有爆炸感,但又忍不住吐槽,一个小小的围棋算什么,等这些新闻出来时估计你已麻木。谷歌的新机器人在堆杯子比赛中完胜人类。脸书创始人宣布该公司开始启用人工智能程序员。IBM内部员工泄密称IBM2018年投资的马莱顿医院的专家问诊一直是watson在进行,人类医生都是幌子,引起轩然大波。美国允许特斯拉无人驾驶上路,报告称其各方面指标已经远超人类。百度宣称百度大脑已经达到成人智商水平,网友戏称让他用百度搜索看看能不能上当。回到正题,首先从技术方法上deep mind仍然使用深度网络,然后在结构上做文章,比如本次采用两个深度网络来降低搜索复杂度。未来将会有更多更新颖有效的架构出现,深度网络编程基础模块将发挥更大的作用。从最近的风头来看,各家都在DL上花大心思,未来围棋这种都是小事,更多智能复杂度高的任务被完成也很快成为可能。
不谢邀。不是所谓欧洲职业二段,是中国职业二段,去法国当总教练。职业围棋二段。。刨除因为年龄定段等因素外,水平就那样。樊二段在中国围棋协会职业棋手等级分排名差不多300。参与排名的男女棋手不过400人。等和李世石的结果出来再评论。
已有帐号?
无法登录?
社交帐号登录谷歌围棋AI有科学欺诈表现的三个重要原因--百度百家
谷歌围棋AI有科学欺诈表现的三个重要原因
分享到微信朋友圈
从科研角度看,因为故意忽视最为关键的第二步,使得这个原本伟大的科学实验,变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现,根源也在这里
作者:刘锋 &计算机博士,互联网进化论作者,人工智能学家主编 &
”把大象关进冰箱要几步“涉及的科学漏洞
在讨论谷歌围棋AI及其比赛问题之前,我们先看那个著名的笑话“把大象关进冰箱要几步“,2000年中国春晚,赵本山、宋丹丹的小品《钟点工》,曾经用到了这个笑话:问“把大象放进冰箱总共分几步?”答:“三步,第一步把冰箱门打开;第二步把大象放进去,第三步把冰箱门带上”。
小品中的情景只是一个笑话,从科研角度看,因为故意忽视最为关键的第二步,使得这个原本伟大的科学实验,变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现,根源也在这里。
谷歌围棋AI在Nature上究竟说了什么
谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理,这个原理描述相对专业,这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么,谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作,它们分别是:
第一步快速判断:用于快速的观察围棋的盘面,类似于人观察盘面获得的第一反应
第二步深度模仿 :AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。
第三步自学成长:AlphaGo不断与“自己”对战,下了3000万盘棋局,总结出经验作为棋局中的评估依据。
第四步全局分析:利用第三步学习结果对整个盘面的赢面判断,实现从全局分析整个棋局。
判断欺诈的第一个原因,谷歌的把大象关冰箱问题
Nature论文阐述的AlphaGo基本原理,按照人工智能专家的评价:”其基本原理并没有新东西“,但核心价值是学习了近万盘人类历史高手的棋局,和自我对战下的3000万盘棋局总结的经验。
请注意,这个关键内容,也就是AlphaGo到底终结出什么围棋规律,或者其神经网络的权重值是什么,谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上,说出了如何打开围棋战胜人类的冰箱大门,和如何关上围棋战胜人类的冰箱大门,但唯独在第二步 围棋如何战胜人类的方法塞进冰箱,同样做了隐藏。
我们知道,围棋之所以很难被人工智能攻破,战胜人类高手,就是其可能的组合数异常庞大。至于多么异常,2016年1月普林斯顿的研究人员给出了最新研究结果:对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种。但根据围棋规则,不是所有位置都可合法落子,例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢?
普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数:935
我们给它多分几行:
不用数了,一共171位数! 这个数字比我们地球所有的沙粒数量还要多!比人类已知宇宙的所有星球数量还要多!对比一下,谷歌学习的近万盘人类棋局是5位数,谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化,我们把大头去掉,那也有70位数的棋局变化。
第一也就是说谷歌以幼儿园规模的知识量,就要获得诺贝尔奖级的知识规律,这是违背科学发展规律和常识的,第二,如果谷歌通过学习和自行对战学到了超出寻常的规律,或者其神经网络权重值达到新的高度状态。但谷歌不愿意公开这个最重要最关键的内容,其他研究者就无法真正了解谷歌围棋的真实水平。在这种情况下,匆忙举办获得巨大商业利益,没有第三方真正监督,无法洗脱作弊嫌疑的世界冠军比赛。受到科学欺诈指控也属必然。
判断欺诈的第二个原因,密室实验与棋手放水
从科学实验的严谨性说,谷歌在论文中阐述的实验方法,表现不及格甚至恶劣,我们知道在物理,化学,生物,计算机等领域,进行实验时,要求实验对象必须达到一定数量,并进行多次独立实验。才能相对确保结果的稳定性和可靠性。譬如一个受到污染的试管,无论我们重复多少次实验,其结果也一定是不可靠的。
谷歌在这篇论文中 对其他围棋程序选取了众多测试对象,并进行了495次实验,但对人类测试者,却只选取了一位曾经获得欧洲围棋冠军的棋手,并签署严格的保密协议,原本可以很容易邀请更多选手,但却没有按照科学规范进行多次实验。先不谈谷歌和棋手之间有无利益交易,就这一点,谷歌在Nature发表的论文从实验角度是不合格的。
更重要的问题出在与谷歌对战的欧洲围棋冠军樊麾身上,在对战棋谱公布后的二个月里,大量职业围棋高手含蓄或公开指出樊麾水平发挥失常,或不求进取,或就是放水。
多次战胜李世石,当前世界最优秀的围棋选手柯洁评价道:“他可能也是好久不下棋了,实力表现非常糟糕”。前北京市高校围棋冠军王烁在财新发布的文章中评价道:“这五局棋下得反而是很平庸。樊麾抵抗不足,五盘棋没有什么激烈的战斗,开局、定式、占大场、小规模接触战,收官,对抗度很差。”
虽然欧洲围棋冠军樊麾多次辩解“我发挥失常,当时崩溃了“,但更多棋友评价欧洲围棋冠军樊麾,“发挥有技术变形”,“樊麾的表现只有业4水准,关键地方明显放水”,“很明显樊麾是谷歌公司的托,全是50年前的招法极其保守,不输才怪”,“对于谷歌,没有什么谎言是不能用1千万美金解决的”。
除此之外,谷歌也没有向Facebook那样把围棋程序放到互联网上,光明磊落的接受大众的考验,作为与谷歌AlphaGo原理相同facebook围棋程序DarkForest,目前水平相当于业余5段,与职业选手依然有巨大的差距。
同时谷歌的论文结论也存在不可重复问题,Facebook围棋项目负责人田渊栋在评价谷歌围棋AI最为关键的快速走子策略时讲到”对此AlphaGo只提供了局部特征的数目,而没有说明特征的具体细节。我最近也实验了他们的办法,达到了25.1%的准确率和4-5微秒的走子速度,然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力,因为只要走错关键的一步,局面判断就完全错误了“。
从上述情况看,谷歌围棋实验刻意违反科学规范,采用密室孤立实验,这些问题在3月9日与韩国选手李世石的比赛中没有消除。人们常说,互联网上,你不知道你的对面坐的是人还是条狗。同样对于谷歌围棋比赛,我们完全可以质疑,与李世石对弈的究竟是程序还是人?如何保证李世石没有被利益收买?谷歌即使不赢,其实也是胜了,鲁迅的那个故事,乞丐:赵老爷今天打了我。
判断欺诈的第三个原因,过度追求市场影响与提高股价
谷歌选择欧洲围棋冠军和前围棋冠军李世石进行世界轰动的比赛,而且没有严格的第三方监督,排除作弊的可能,表明谷歌并不是追求科学的严谨和荣誉,而是在追求品牌和影响力最大化,从而获得巨大的经济利益。
事实也证明这一点,日曝出了谷歌人工智能围棋击败欧洲冠军的消息,随后是谷歌拿出100万美元作为奖金挑战李世石。当日谷歌股价大幅上涨,涨幅4.42%,换算成市值涨了200亿美元。从宣传效果是看,谷歌这次的“广告”做非常巧妙。日彭博社报道,谷歌旗下人工智能公司DeepMind正推进自身医疗技术发展,因为其在围棋领域的影响,已经获得不菲的订单。
谷歌的技术期货路径和消除欺诈指控的方法
西方谚语说”一个动物,如果它走起来像鸭子 叫起来像鸭子 它就是鸭子“,同样,对于谷歌围棋Ai及其比赛,如果它回避公开如何从3000万盘(8位数)棋局获得171位天文数字棋局的规律或神经网络权重值,回避不愿大范围邀请棋手参与实验,回避收买选手嫌疑,回避不在互联网上公开对战接受监督,那么谷歌的围棋比赛可以看作一场精心策划的科学骗局或有欺诈嫌疑。
商业中有一种做法叫产品期货,消费者购买商品后,要等到半年或一年后才能拿到,那时技术,原料成本大幅下降,商家因此获得利润。同样,谷歌的围棋程序应该获得一定进展,但远没有到达能够挑战职业选手或九段高手的地步,谷歌通过市场和技术手段,拔高其围棋水平。故意回避公开监督或公开大范围对战。等待未来水平继续提升后,可能会进行公开,这种做法也可以称作 ”技术期货路径。
谷歌可以消除欺诈指控的嫌疑,不是与李世石下棋,而是:
1.完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律,或公开其神经网络权重值参数,让其他实验者可以重复谷歌的实验结果,还原谷歌对战成绩。
2.将谷歌围棋AI程序AlphaGo放在互联网上,接受百人,千人的同时对战。并检测对战结果,消除作弊嫌疑。
这两条谷歌能做出任意一条都可以看作是消除欺诈指控的强有力证据,但在未来一年或更长时间里,谷歌没有任何动作,那么谷歌将持续背负有科学欺诈嫌疑,利用科学炒作获得巨大经济利益的指控。 &
阅读:18702
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:21万
阅读:10万
热门文章HOT NEWS
美国消费者商品安全委员会CPSC宣布召回三星Galaxy No...
影视口碑榜
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻后使用快捷导航没有帐号?
查看: 6681|回复: 3
Google围棋AI涉及的两篇论文
论坛徽章:384
有兴趣的朋友可以从附件下载
1.& &&&Google AIalgorithm masters ancient game of GoDeep-learning software defeats humanprofessional for first time. BY 原网址:Pdf:Google masters Go 2.& &&&Better ComputerGo Player with Neural Network and Long-term PredictionBY Yuandong Tian, Yan Zhu原网址:于2015年11月9日提交到arxiv.org上,2016年1月26日更新以下是文章提到的Yann LeCun在Facebook上对其的长篇声明:Today, we posted on
a new version of Yuandong Tian's paper on deep learning methodsapplied to the game of Go: “Better Computer Go Player with Neural Network and Long-termPrediction” by Yuandong Tian and Yan Zhu.The lone FAIRresearch scientist working on this project, Yuandong just started pursuing Go afew months ago and is working on a bot called DarkForest. The latest versiondescribed in this paper uses a combination of convolutional networks (ConvNet)and a now-classical method for computer Go called Monte Carlo Tree Search(MCTS).Why are we workingon computer Go? It is a nice example of difficult problem that requires acombination of learned skill, pattern recognition, problem solving, andplanning. It's a very good vehicle to test new ideas that combine machinelearning, reasoning, and planning. Our findings show that a combination oftrained ConvNets and MCTS could be used to add tactical evaluation to patternmatching. This could benefit other applications outside of games like naturallanguage generation too, adding spontaneity and variety to responses, as wellas reasoning, which requires searching possible answers and picking the bestlogic chain. We are not particularly interested in producing the world's bestGo player, but it's an interesting exercise to see how far we can get.Since November,several versions of DarkForest have been playing against humans and other Go botson the public Go server KGS ( ()). The first version of DarkForest was built around a pure ConvNet. It wastrained in supervised mode to “imitate” human players. Using a large databaseof recorded games between skilled human players, the ConvNet was fed a boardconfiguration from a game and trained to predict the move made by the humanplayers. This used a large ConvNet whose input was an annotated image of theentire 19x19 Go board. The output of the network was a 19x19 map of the Goboard representing the probability that a human expert would play at eachlocation. This exploited the pattern recognition abilities of ConvNets thathave been so successful for recognizing objects in images, recognizing faces,and recognizing speech.The idea of usingConvNet for Go playing goes back a long time. Back in 1994, Nicol Schraudolphand his collaborators published a paper at NIPS that combined ConvNets withreinforcement learning to play Go. But the techniques weren't as wellunderstood as they are now, and the computers of the time limited the size andcomplexity of the ConvNet that could be trained. More recently Chris Maddison,a PhD student at the University of Toronto, published a paper with researchersat Google and DeepMind at ICLR 2015 showing that a large ConvNet trained with adatabase of recorded games could do a pretty good job at predicting moves. Thework published at ICML from Amos Storkey's group at University of Edinburghalso shows similar results. Many researchers started to believe that perhapsdeep learning and ConvNets could really make an impact on computer Go.That's what promptedYuandong to release the first version of DarkForest on the KGS server. A moreadvanced version quickly reached the level of 3d on the KGS server, far betterthan previous works. This ranking level is considered better than most opensource players and typically takes people years to achieve. People likedplaying against it because its moves felt “human.” But while it was quite goodwith strategy, it wasn't so good with tactical battles. Winning local tacticalbattles sometimes requires explicit exploration rather than pure patternrecognition.Clearly, the qualityof the tactics could be improved by combining a ConvNet with the kind of treesearch methods that had made the success of the best current Go bots. Over thelast 5 years, computer Go made a lot of progress through Monte Carlo TreeSearch. MCTS is a kind of “randomized” version of the tree search methods thatare used in computer chess programs. MCTS was first proposed by a team ofFrench researchers from INRIA. It was soon picked up by many of the bestcomputer Go teams and quickly became the standard method around which the topGo bots were built. But building an MCTS-based Go bots requires quite a bit ofinput from expert Go players. That's where deep learning comes in.The new paper wereleased today describes the new version of DarkForest, called *darkfmcts3,*that uses a combination of ConvNets and MCTS. This system has been availableon the KGS server for a bit over a month and has attained the level of 5d onthe amateur scale. This places it in the top couple of hundred players in theUS, and among the top three Go bots in the world. This is interesting becauseit was developed by a very small team in a few months without any input from Goexperts (except the database of recorded games, of course). It's a greatdemonstration of the power of machine learning.A good next step isto combine ConvNets and MCTS with reinforcement learning, as pioneered by NicolSchraudolph's work. The advantage of using reinforcement learning is that themachine can train itself by playing many games against copies of itself. Thisidea goes back to Gerry Tesauro's “NeuroGammon,” a computer backgammon playerthat combined neural nets and reinforcement learning that beat the backgammonworld champion in the early 1990s. We know that several teams across the worldare actively working on such systems. Ours is still in development.Facebook's approachto research has always been to “release early and release often,” to paraphrasea popular moto of the open source software world. Our Go bot was deployed onthe KGS server early on, and our paper was put on
() early on as well. We think that science progresses faster whenresearch groups exchange ideas quickly and build on top of each other's work.This is an excitingtime to be working on AI.
15:25 上传
点击文件名下载附件
15:25 上传
点击文件名下载附件
注册会员, 积分 110, 距离下一级还需 90 积分
论坛徽章:4
论坛徽章:28
马上连围棋都要被人工智能占领了
论坛徽章:26
今天alphago已经胜利!

我要回帖

更多关于 腾讯围棋下载安装 的文章

 

随机推荐