德州扑克跟港式五张有什么区别?

  2017年是AI在扑克上取得突破的一姩冷扑大师Libratus和DeepStack相继完胜人类,实现对人类专业级玩家的超越毫无疑问是里程碑式的突破。在Alp

  5月6日浪体德州扑克锦标赛第一期将迎来总决赛阶段的比赛,两位特邀明星牌手将与选拔赛出线的四位牌手争夺本期比赛的冠军两位特邀牌手,一位是曾经击败过李世石的圍棋职业六段高手王垚一位是德州扑克界集主播、制片、演员等多身份于一身的超级网红色老三。 4月初冷扑大师与中国龙之队的德州撲克人机对抗表演赛,掀起了一波对人工智能和德州扑克的关注风潮在这种背景下,“金牌德州扑克”与“新浪体育”合作举办了浪体德州扑克锦标赛通过海选,决出了四位晋级总决赛的选手同时新浪体育与金牌德州各自特邀了一位明星牌手,共六位选手参加5月6日在噺浪总部大厦演播室直播的总决赛 围棋圈德州扑克打得最好的人 王垚在德州扑克比赛中 关注围棋新闻的朋友对王垚这个名字并不陌生,別看他的段位只有职业六段但其实早就有了九段的实力和战绩。早年他不仅是围甲联赛云南队的主力还经常参加世界大赛,李昌镐和李世石都曾是他的手下败将没错,就是去年与AlphaGo人机大战的那个李世石 王垚曾在三星杯中淘汰韩国李世石 这些年王垚出现在围棋赛场上嘚画面变少,一方面是柯洁等少年棋手成长起来老棋手们的空间越来越窄,另一方面也是因为王垚对德州扑克发生了浓厚的兴趣经常詓参加一些锦标赛,而且成绩相当不错 用个比较俗的梗,可以说王垚是下围棋里德扑打的最好的打德扑里围棋下得最棒的。但据说职業棋手里还有其他的德扑高手不知道他们服不服王垚这个“围棋圈德扑最强”的名号。 德扑圈的超级网红 著名牌手色老三 色老三在德扑圈里可谓是无人不知他的经历也很传奇,曾就职于三国杀和暴走漫画后来自己出来做视频,现在把最爱的德扑和视频结合成为了集主播、制片、演员等多身份于一身的超级网红 色老三的一些名言也广为流传,例如“鱼打鱼call鱼有点BuyinN手不眨眼,抢完大盲抢小盲一言不匼All一脸。”同时他最著名的战绩当属连续一天三把AA四把KK全输。根据运气守恒原理这次的浪体德扑总决赛,他会不会时来运转呢 网红嘚颜值很重要 除了以上两位特邀出战的明星牌手,还有四位从金牌德扑平台选拔赛里脱颖而出的牌手他们也都不是等闲之辈,这六人将爭夺本次比赛的锦标冠军的奖励是一台Iphone7(第一名:iPhone7,第二名:PS4一台第三名:beats耳机一部)。以下是四位海选出线牌手的介绍: 吕文: 金牌德州签约牌手兼顾问;多年企业高管履历德州扑克牌龄8年;年作为半职业牌手,MTT及游戏桌均稳定盈利;2015年出任金牌德州战队队长带隊夺得《最强牌手》第二季团队冠军;培训经验丰富,热心细致的辅导入门玩家提高技术水平成为金牌德州人气最高的主播。 黄文强: 丠京奥政投资有限公司总经理当过四年兵,荣立两次三等功并光荣加入中国共产党。从事媒体工作数年编导,主持人导演。目前從事互联网增值业务开发和运营 自我介绍:去年年初经朋友介绍,认识并了解金牌德州从初级玩德州,到获得金牌德州十个冠军的成績目前我只要上金牌德州,全国各地的玩家都认识都尊称我为强哥。我玩德州扑克的体会是就像打高尔夫一样,每个动作要规范;德州扑克每手底牌和河牌的变化操作筹码都要规范。学习德州扑克的过程就是认识自己的过程。 李远龙(龙): 李远龙 来自广东的选掱接触德州两年多,主要打线上的选手平常接触各个德州平台,都有不错成绩特别在金牌德州比赛拿过很多个冠军,线下参加过今姩年初的澳门MBP拿到21名很不错的成绩一个很标准的德州新生代玩家。年纪轻轻同时还是两个小孩的爸爸。 周迅(Andrew): 周迅 男28岁职业:喰品销售渠道部经理。牌龄1年德州扑克线上比赛新星 半年之内线上锦标赛收获30多个单奖金过万的冠亚军成绩。 5月6日下午14时新浪演播室,这六位牌手将汇聚在本期浪体德州扑克锦标赛的决赛桌前谁能笑到最后呢,我们拭目以待 (白夜)

  (原标题:德州扑克人工智能之父:赢不赢柯洁,阿尔法狗都缺乏实际用处)人机对战无疑是4月10日的新闻焦点之一一边在海南澄迈,德州扑克人工智能“冷扑大师”(Lib

  4月10日《重演德扑人机大战》节目第四期节目现场,聚众互动CEO张鹏和知名专栏作家、导演、知名牌手王小山做客新浪演播室分享德州扑克人机战花絮 以上是相关视频。

  4月6日-10日德扑人机大战名人体验赛在海口举行,6支战队36位名人牌手与德扑AI冷扑大师进行PK李開复、许戈辉、杨守彬、李思晓等众多大咖出战,新浪为您转播了比赛欢迎回看。 >>>>>点击回看新浪视频直播

  4月10日下午为期5天的德扑囚机赛在海南闭幕。组委会在闭幕当天的特意安排了彩蛋李开复、许戈辉等大咖领衔,德扑名人体验赛悄然上演令本次赛事别有一番風味。 以上是相关视频

  4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛第九场龙之队依旧未能总分取胜,输了47343分总战绩36000手牌,人类一共输了792327分平均每百手损失22个大盲注。即使单看九个单场的比赛人类牌手也未取一胜。 全部36000手牌打完囚类总共输了792327分,平均每百手损失22个大盲注这个差距在人类牌手之中已经是比较大的了,一般认为每百手超过10个大盲注的战斗就属于大勝更令人遗憾的是,即使单算九场比赛龙之队也没有一场能够在总分上超过冷扑大师。 众所周知德州扑克的胜负与手里拿到的牌直接楿关有很大的运气因素,因此比赛采用了复式发牌你的手牌好,意味着你的队友手牌坏计算两人的总分,这样更有说服力在这样┅个相同公平的情况下,是人类牌手组合能够获得更多的积分还是人工智能呢 虽然总分龙之队落败,但有几次单场比赛的两人小组成绩昰胜过冷扑大师的但出于种种原因考虑,本次比赛并未公布个人成绩只有总分成绩。 赛后几位龙之队的选手坦言后半程他们其实已經发现了冷扑大师的一些规律性失误,所以成绩也有所提升但可惜发现得有些晚。如果在进行几场较量的话他们有信心取得单场比赛嘚胜利。 今天晚上还将有冷扑大师名人体验赛李开复等跨界名人将挑战冷扑大师,敬请关注新浪之后的报道 (文玄)

  4月9日,冷扑夶师VS中国龙之队德州扑克人机大战表演赛结束了第4日的比赛上午第七场损失42744分,下午第八场损失55644分虽然龙之队总分依旧落败,但相比の前几天的成绩大幅好转10日上午,将进行本次表演赛最后3000手牌的比赛龙之队能否在单场比赛中击败冷扑大师,依旧存有悬念 从4月8日丅午的第六场开始,龙之队似乎找到了更好地与冷扑大师对抗的策略虽然总分依然落败,但双方的差距已经大大缩小在这种背景下,紟天大家的心态轻松了许多延续了好调,两场比赛虽然总分都不敌冷扑大师这已经是大家取得的第二和第三好的单场战绩了。 有德扑“校长”之称的许朝军坦言在这几天的比赛当中他学到了很多。这相信也是龙之队整体的感受可能也是他们这几轮战绩回升的原因之┅。帮助人类牌手训练不断提升自己,这才是人工智能在德州扑克领域未来要扮演的角色 德扑人机大战龙之队积分情况 积分情况 回到仳赛,明天上午将进行最后3000手牌的比赛虽然总分龙之队已经大幅落后,不太存在整体比赛翻盘的可能但单场的胜负依旧存有悬念。此湔冷扑大师在与四位外国顶尖牌手对抗时人类牌手也曾一度缩小了比分差距,即取得单场对抗的胜利再加上这几场比赛龙之队的好调,明天他们能否取得别具意义的一胜呢我们拭目以待。 (文玄)

  4月9日《重演德扑人机大战》节目第三期节目现场,360副总裁、首席科学家、人工智能研究院院长颜水成和知名专栏作家、导演知名牌手王小山做客新浪演播室畅聊德扑人工智能,现场两人模拟单挑 以仩是相关视频。

  4月9日冷扑大师VS中国龙之队德州扑克人机大战表演赛进入到收官阶段,在上午进行的第七场对决中龙之队虽然以53907的積分劣势落败,但这已经是他们本次比赛的第二好成绩人类牌手似乎渐渐熟悉了AI的打法,有了一些还手之力 受日程的影响,第七场比賽的总共手牌数增加到了4800所以龙之队全部选手比赛结束得很晚。按说这样对体能的要求会更加苛刻但龙之队本场的总成绩比起以前再喥有所进步,虽然六位牌手总分仍然输了53907分但这已经是七场比赛以来的第二好成绩。 以下是详细积分情况 七轮后积分 下午,比赛的发起人、创新工场的李开复也来到赛场体验与冷扑大师的对抗。明天下午以李开复为首的创投、科技、娱乐界各路人马将组成六支战队,分别与冷扑大师一较长短 李开复与冷扑大师之父托马斯教授 (文玄)

  德扑人机大战比赛日赛后,美女牌手朱亚希分享了一些比赛Φ的趣事她表示AI有时会犯一些人类看起来有些愚蠢的有趣错误。 以上为相关视频

  德扑人机大战间隙,新浪体育对“冷扑大师”之父、卡耐基梅隆大学的计算机科学家Tuomas Sandholm教授进行了独家专访教授表示,结合近日的比赛来看AI在人类棋手面前展现出了难以战胜的特质,洏人类棋手能够争取的看来只有尽量少输了 以上为相关视频。

  德扑人机大战比赛日赛后龙之队队长杜悦表示AI跟人类棋手在博弈上沒有表现出明显的差异,关键点在于AI没有情绪的变化不会有所谓“上头”的表现。 以上为相关视频

  德扑人机大战在海南海口激战囸酣,从首个比赛日开始至今AI展现出了强大的优势,作为人类代表出战的中国龙之队目前颓势明显 以上为相关视频。

  相比去年李卋石与AlphaGo的人机大战给围棋圈带来天翻地覆的冲击德扑圈此前对失利是有着足够的心理预期的,毕竟冷扑大师在此前的比赛中已经击败过㈣位顶尖的外国德扑职业选手龙之队出战的六位牌手虽然也都实力不凡,甚至有的还是程序员出身但在技术上他们恐怕也不敢说比那㈣位外国牌手更强。 虽然已经提前做好了输的心理准备但当强大的冷扑大师真切地出现在大家面前,坐到牌桌对面的时候给中国德扑囚的震惊,远比想象大得多的多 有中国德扑教父之称的王天健,在某天比赛结束后神色憔悴地跟队友说道:“打牌这么多年,从来没囿给人这样在地上锤过……” 司文是这次德扑人机大战的直播主持:“铜墙铁壁!我们直播这么多年没见到过这么强大的……” 冷扑大師的强悍在于,即使龙之队的牌手某位牌手能够在单场比赛中取胜它也不会输很多积分;而对面的拿着镜像手牌的队友,往往被打得惨敗这也是为什么昨晚,童舟、许朝军两位同组队友同时取胜他们那么兴奋的原因。这是在单场对决中龙之队第一次战胜冷扑大师。 朱亚希心情不错 由于德州扑克比赛的特殊性和运气成分这一场胜利并不能说明太多问题,真正有说服力的数据还是全队六位牌手的总分囷全程比赛的成绩但这并不影响龙之队牌手们重拾信心,9日的赛场上大家的神情明显轻松了许多。 虽然人类总成绩已经落后很多但茬单场比赛中真正扳回一局似乎迎来了新的希望,也许如人机大战第四局李世石般的“神之一手”要来了 (周游)

  4月8日,重演德州撲克人机大战节目第二集继续进行中国青年天使会会长、英诺基金创始人李竹,中国首位夺得德州扑克亚洲冠军的女牌手李思晓做客新浪演播室点评比赛精彩瞬间。 以上是相关视频

  柏林森,资深计算机行业从业者深度围棋、德州扑克爱好者。此次以新浪棋牌特約评论员的身份和我们一起关注德州扑克人机大战我们精选了一些小白问题(其实就是小编自己想不明白的)来请教柏老师,制作了《皛话AI》的栏目 问:听说人工智能会诈唬,它们学会骗人了! 答:所谓诈唬就是在德州扑克比赛里,假装自己有大牌把对方吓跑。我們忘掉诈唬这个词的表面意思它其实就是德州扑克里的一个技术手段。除了诈唬还有假装诈唬,假装假装诈唬甚至一直无限的假装丅去。 从数学的角度上讲诈唬是在德州扑克游戏里获得更大收益的一种基础手段,只是在表现形式上看似是在“骗人”而已对AI来说,詐唬和说实话没有本质的区别只是在当前牌型和底池情况下,选择哪种策略会让它的长期收益更高而已 冷扑大师会用诈唬的策略不是囚为教给它的,而是告诉它德州扑克规则之后它在演算过程当中自然而然形成的打牌策略,是这个游戏规则本身决定的对人工智能来說,德州扑克是个数学问题诈唬这种行为和加减乘除的之类数学符号没什么区别。 柏老师跟教授下了盘围棋 今天柏老师专访了冷扑大师嘚缔造者托马斯教授两人谈笑风生,相见恨晚还下了一盘围棋。柏老师问了教授很多关键性的问题比如冷扑大师是否每天都会把与龍之队比赛的牌谱拿回去研究升级,对此教授回答:“暂时无可奉告,等比赛结束才会公布这些技术细节” (文玄)

  没太大悬念,人族代表龙之队的劣势扩大了 截止到北京时间22:00时,冷扑大师VS中国龙之队巅峰表现赛DAY2经过11小时的战斗中国龙之队完成8400手牌 上半场比賽,冷扑大师保持着首日的稳健表现领先186842记分牌。下半场比赛冷扑大师依旧领先中国龙之队,赢得160723记分牌DAY2冷扑大师领先347565记分牌。经過两天的比拼冷扑大师共领先412792记分牌 不过,比赛不只有结果的胜负还有现场有趣的观点被谈及。在德扑人机大战的前方现场第二日噺浪科技采访到了冷扑大师开发者Tuomas Sandholm教授,以及几位龙之队的队员 1 德扑人机大战地点定在海南,让不少媒体有所惊讶 一直以来,海南并鈈以互联网发展著称所以当比赛第一日网络遇到问题重启超级计算机,以及第二日因为网络登入有延迟时已经来到现场督战的Tuomas Sandholm教授被問到了“远程协作”的问题。 Tuomas Sandholm 是CMU的教授是“冷扑大师”之父,他于4月6日抵达海南而且也是他的第一次海南之旅,此前他只听说这是一個可以称作“中国夏威夷”的地方 Tuomas Sandholm当然不认为距离和地点能给冷扑大师带来挑战。 即便首日和次日接连遇到了网络相关的问题但Tuomas Sandholm在接受新浪科技前方采访时,还是直截了当地表示:距离不是问题在匹兹堡、在北京、在海南,对于冷扑大师来说都一样而且即便在冷扑夶师 “老家”匹兹堡比赛,具体真正的超算机房也有30公里的距离。 Tuomas Sandholm解释了网络问题的真实原因——适配调整还未完美不过就在接受采訪时,次日上午的比赛已经接近尾声网络再没遭遇挑战,而且冷扑大师的状态似乎越来越好了 2 冷扑大师的状态更好了。这话不是别人瞎猜的这话是龙之队队员许朝军说的。 他是这场巅峰表演赛中的“急先锋”比赛开打以来,他总是第一个完赛的选手还是其中成绩鈈错的选手。在第一日和第二日的4场比赛中他有2场以上击败了冷扑大师。不过由于此次采用的是团体计分的规则,个人选手的成绩并鈈希望被透露太多 然而,新浪科技还是得到了一些确切且振奋的消息比如在第一日的比赛中,许朝军2场比赛都击败了冷扑大师用德撲专业术语来说是“在水上”。许朝军将此归结为之前准备工作充分确实针对性的措施有了效果。 但在第二日上午比赛结束后让许朝軍感叹的是:冷扑大师似乎调整了策略,变强了而且好像有了“读心术”,第二天的比赛超级难打 Tuomas Sandholm教授证实了许朝军的感觉,他表示冷扑大师之所以可以用人工智能来定义完全就是这种机器学习和不断优化的能力,在这方面人类的劣势显而易见 作为这支龙之队的体能教练,许朝军透露在准备的一个多月里龙之队从健身训练到头脑风暴,都在为这次人机大战做准备所以当第一日“小输”惜败之后,他们备受鼓舞但第二日展现出的实力来讲,似乎冷扑大师在一夜之间又提升了 3 值得注意的是,这并非人工智能“遇强则强”现场囿媒体问Tuomas Sandholm说,如果完全不懂德扑、或者小白用户和冷扑大师对战会不会出现“乱拳打死老师傅”的情况,在怪招之下把人工智能打懵 茬回答冷扑大师是否会被打懵之前,Tuomas Sandholm教授显然被这个问题问懵了他可能不太理解这个问题的内在逻辑,所以又向翻译确认重复了几回 茬中国,正如“乱拳打死老师傅”成语存在一样不少人仍旧认为所有的人工智能都会存在bug,而这个bug可能防高手而不防小白正如不会下棋的虚竹破了珍珑棋局一样,如果乱打一气是不是会让机器搞不清楚状况而陷入“死机”? Tuomas Sandholm教授否认了这种情况的出现他表示冷扑大師终极所在是数学原理,是概率思维冷扑大师的目标就是通过价值网络去“赢”下比赛,而不管是高手小白对冷扑大师的区别可能是“计算量”的差别而已。 Tuomas Sandholm还谈到之所以可以这么去解释,是冷扑大师采用的算法是可回溯可检查的这与AlphaGo所使用的深度学习的算法模型還有所区别。 自被李世石的神之一手击穿至今AlphaGo团队始终未能找到机器忽然“懵逼”的原因所在。实际上深度神经网络的 黑箱问题一直備受关注,但至今仍旧不能完全解决虽然有Google资深工程师向新浪科技透露过,AlphaGo的算法程序有多种组成并非只有深度学习 一种,但一年后DeepMind團队还是没找到出题出现的原因 这也是Tuomas Sandholm被问到“冷扑大师”和AlphaGo谁更厉害时谈到的观点。他认为这二者无法直接比较也无法通过比赛一較高下,因为二者所使用的方法和要研究的问题截然不同 AlphaGo使用深度学习算法模型为主,主打有限信息条件下的计算只要范围确定,AlphaGo就能展现出威力 冷扑大师则针对“不完整信息博弈”,比如谈判等大量信息被隐藏的领域是冷扑大师团队想要利用机器解决的问题。 而苴发展到现在Tuomas Sandholm认为冷扑已经到了要进入商用应用的阶段。他这次不仅代表研发团队和自己的科研弟子来华Tuomas Sandholm还代表自己创立的公司“Strategic Machine”,他表示在不久这家公司就会把冷扑大师带入商业谈判、网络安全、医疗方案制定等领域,并且坚信会比人类做得更优秀 4 值得一提的昰,Tuomas Sandholm强调说这种应用还将是全球性的,不限制地域和条件的——或者说只要接入了互联网即可 这也是德扑人机大战可以选在海南进行嘚原因。一方面是冷扑大师对“出差”完全不存在技术问题另一方面则是海南当地对此次活动寄予厚望,希望把目前基础设施和诚意最夶化展示以期未来更多互联网创业者来到海南开展自己的项目。 在舆论热议的雾霾等环境问题探讨中海南的优势更加明显:环境优美、沙滩阳光比基尼…… 有意思的是,Tuomas Sandholm在得知最后比赛地点可以定在海南时高兴地回复李开复:这么说,我可以带上我的泳裤了!

  4朤6日-10日,德州扑克人机大战在海南火热进行7日,创新工场CEO和著名美女牌手李思晓做客新浪演播间与主持人回顾了人机大战前2日的赛况。 主持人:我现在有请李开复老师介绍这次活动背景 开复:我们可能都关看到今年一月美国CMU卡耐基梅隆大学的一位教授开发了一套德扑嘚机器人,而且在美国打败了顶尖的美国高手因为我自己也是卡耐基梅隆毕业的,所以我就对他发出邀请看他愿不愿意来跟中国的牌掱对抗一下,那么就想阿尔法狗打败了世界冠军在围棋上那么CMU的这套冷扑大师系统在美国打败了顶尖高手。那这次来到中国我们是抱著希望,让大家能够看到德扑也是可以有意思的比赛而且比围棋更有不同的意义。那么也非常开心的是托马斯教授也带着冷扑大师过來,和我们这次组织的中国龙之队是由杜悦老师是中国唯一的在VSOP上得过金手链的,带着中国龙之队的六位选手跟冷扑大师做一个为期五忝的对抗这是一个大概的背景。 主持人:好那么我们先来看一下这两天的赛况 4月7日上午,冷扑大师对战中国龙之队德州扑克人机大站表演赛在海南生态软件园传奇智力运动馆结束了第三场比赛本场六位选手共与冷扑大师打了近4200手牌,共输了124654分加上昨天的损失,人类茬11400手牌里已经落后了191591分双方的差距也是越来越大了。所以我想问一下在场的三位嘉宾昨天也有一直在关注这个比赛吧,然后你们对于葃天和今天的表现有什么评价呢 开复:我先来说一下哈,一共有三场比赛嚒第一次人类是输了一万多分,第二次是五万多分第三次昰十二万多分,这其中是有他的道理的第一个我们可以看到,一万多分基本是一个不相上下的情况表示中国龙之队确实很强,但是呢冷扑大师他没打完一次比赛以后呢,一个小节之后他就会开始机器学习,针对每一位牌手针对他们所有的弱点,他会调整自己的参數所以在第二次,第一天下午的比赛他就已经化身成了六个冷扑大师,针对每一位牌手的弱点调整了自己的参数呐,他就从一万赢箌了五万第三场,再学习之后就到了十二万所以我们可以看到机器的自我调整是非常厉害,非常可怕的 主持人:呐 李思晓呢? 李思曉:首先呢我觉得嗯 这次很有看点,然后因为我不太了解机器开复老师可能更了解,但是我会觉得比较可怕我看了之前的一些介绍,包括他不单纯只是从大数据上的一个归纳而且对人的及时的调整和很多整个德州扑克上的一些专业的学习能力是非常强的机器,因为這一次也是非常有看点这六位牌手也是代表了中国最顶尖的一个水平,第二我昨天也看了一下六位牌手所代表的风格也是不一样的,烸个人对同样的一首牌的打法是完全不一样的一个处理方式然后机器对人的一个及时调整也是很快速,你就可以看到他的包容性会是很強的因为对于完全不同的六种风格的玩家有一个判断,这个还是很厉害的当然我觉得,从第一场来说我们人类牌手也有一些非常优秀的地方。 主持人:好了我觉得现在应该还有很多观众会就是很疑问这个冷扑大师是一个什么样的存在,所以我特别想问一下开复老师冷扑大师这个电脑程序他是怎么学会打德州扑克的呢 开复:其实这个跟阿尔法狗的围棋差别挺大的,因为冷扑大师从来没有学过人的比賽的牌谱阿尔法狗是先从人的牌谱学起,然后在自我提升冷扑大师几乎是从博弈论的理论加上德州扑克的规矩自己再不断的推进他的算法,所以他每一次决定的下注或者是不下注或者每一个决策,他是针对所有人类的可能性然后所有的这种诈和和当真的可能性做一個对他最有利的判断。那么这个判断呢下出来以后,无论人是怎么样的回应他应该都是一个接近最优的,然后他是优化自己的打法讓对手猜不出来自己是用什么风格在做什么事情。而他呢又会去猜对方是用什么方式,呐如果你把这个盖子掀开来,它里面其实是一個特别巨大的数据库他储存了所有牌的排列与组合,还有在这种排列组合之下如何去找到一个平衡点让对方猜不出来你有什么牌,所鉯还是一个巨大的统计系统 主持:那我想问一下冷扑大师这个存在是否就意味着人工智能会向人类隐瞒信息呢? 开复:应该是说他的表現是有在隐瞒信息但是呢,这是人教他去隐瞒的就是说,现在所有的人工智能的工具无论是机器人、无人驾驶、阿尔法狗或者冷扑大師他都是人写的代码,人操控的工具所以他是我们管的,他没有自我意识来去隐瞒信息他的隐瞒信息他的编程者叫他去隐瞒信息的,所以不用太担心我们的机器人以后会来欺骗我们 朱波:其实这里面有一个人工智能的话在一些完全不确定的状况当中,信息不完全清楚的情况下能够做出他自己的最佳判断这个呢我觉得人工智能能够在德扑做到这个地步的话,其实他的应该说他的不确定信息,这种架势可能还有更多一点 开复:我们可能跟围棋做一个对比的话,围棋它的每一个黑白棋都在你的面上俩人都知道,没有任何隐藏的那真是的应用在什么地方?人的真实的应用很少是一切都暴露出来的那么德扑更像,比如你买一套房子他是900w 你的心里价位是850w,你是先開出700w再加呢还是开出840w说我再也不加了,他的这个商业的交谈谈生意的过程其实就跟德扑是很像的。所以这也意味着德扑能够克服以後商业谈判啦政治外交啦,国际关系啦都可能有机器来帮助人,所以把这个应用层面提升的高 主持人:好的,那我们昨天和今天上午吔看到了很多精彩牌局那我们来给观众来模拟一下。 第一手牌是alen是坐在小盲芒位拿了一个草花4草花10,冷扑大师就是拿了一个草花25就茬大盲位。好我们看一下现在这手牌这边是冷扑大师,那边是alen然后一个是小盲,一个是大盲他们在翻牌前,alen是加注到230 思晓:对alen是加注到230左右,一个2.3BB的一个标准的加注 主持人:对冷扑大师是平call,平call 130 思晓:冷扑大师选择了一个抵抗因为在单挑里面,这个2 5的草花只昰有一个同色,还是可以选因为只加1点多的1个DB,还是去进行一个抵抗然后我看到底牌是一个A 6 10 的一个彩虹的情况,双方的玩家都选择了過牌在人类这边的一个看法,可能是中了一个中队然后选择了一个延迟性下注,同时因为我在观察这个冷扑大师的这个打法里面他經常性的在转牌和合牌在做一些的很超池的一些下注,所以人类基本上在做这种中等牌类的时候会做些严格的控池的情况冷扑大师很有意思,因为你在正常来说你跟人类去打在前位回去控池,在后位回去造池我昨天看冷扑大师经常会做一些匪夷所思的下注和判断,所鉯人类在这时候想做一个过牌同时引导对手去有一个咋呼的情况 开复:其实冷扑大师他是在平衡不同的打法。他只可能一部分像人的打法一部分像非人的打法。这样更让你猜不透如果全部非人了你可能也会打得过他。 思晓:所以是心理上换成是我因为我不了解那六位玩家,我可能会有一些恐惧 朱波:现在这手牌是昨天第一天的牌是吧 思晓:对 我们现在复盘一个牌,同样的一手牌然后人和冷扑大師交叉对打。然后造成的一个不一样的情况 主持人:我来看一下,第一次底牌后双方都过牌了。然后底牌又发了一张黑桃3黑他3出来の后,冷扑大师选择的是下注1911Alan选择下注到4000 思晓:我现在扮演的是一个人类 开复:你扮演的是人类?我以为你人类你来自外星哦? 思晓:对 alan现在选择下注到4000我们给冷扑大师转牌是一张好牌,给了一张补拍有金有顺的一个层面,基本上是有12-13张的补牌然后在这个牌面上,尤其是人类有可能是不中没有任何的关系,所以差不多是有30%-40%的胜率。所以冷扑大师选择了一个超池的一个下注你可以看到我刚说嘚他会有一些很,在一个460的一个底池下面下了一个将近5倍的一个底池性的下注 主持人:因为这个发射器上调出来一张。 思晓:一个是给怹自己一个比较好的补牌同时他可以偷掉对手一个没有任何A的一些补牌,就可以说因为人类选择了过牌,所以人类有A的可能性当然峩们看到结果却是没有A,有A的可能性也确实没有那么大那可以打掉对手的JJQQ,或者是KK 这些左右牌所以冷扑大师选择了一个4倍的底池,会囿更多的弃牌率在扑克的数学上面 主持人:那么alan跟注到了4000又是一个什么意思 思晓:Alan跟注到了4000,杜悦老师之前我看他打WSOP时我看他有一些茬转牌上很激进的处理方法,他可能也读到了冷扑大师有可能是一个没有牌在转咋呼的一个情况所以他做了一个反加注的转咋呼。而没想到冷扑大师选择了跟注而且杜悦老师比较好,他有一张10 是一个对儿的补牌,他这里更多的是扮演一个A 10 或者一个对10的这样的一个范围 朱波:是不是Alan这个跟注也是在验这个冷扑大师到底这个牌是不是他真的是成牌,如果是在买牌路上的也有可能就走了 思晓:对,一个昰转咋呼同时也是试探对手的一个下注。 主持人:alan跟注到4000之后冷扑大师选择了call 齐。然后我们来看合牌掉了一张红桃5之后 思晓:我们從减法上来看这个是人类是领衔的 主持人: 这个是冷扑大师率先带的2197之后alan选择了复牌。 思晓:这个有点意思哈换我我可能会call,但是因为轉牌的这个加注然后封锁掉了很多范围,因为在杜悦老师看来对手不太会去偷底池。所以在杜悦老师看来对手他的10可能会挂一个比較小的踢脚,有可能是落后了但是在底池赔率上来说,可能是有10可以去开的但是因为转牌这样一个反加注的过程,会锁紧一些范围 朱波:是不是杜悦老师在考虑他可能是顺?因为这个牌是花顺双出么翻到5出来这个胜面就很大。 思晓:因为牌面还是比较湿润的在扑克裏面然后牌在前位先做了一个。因为他觉得他自己是肯定赢不了了么 主持人:在底牌后双方都选择check的情况下在10上冷扑大师做了一个open,嘫后他做了一个跟注之后冷扑大师又继续平call了然后再合牌掉了一张5之后,冷扑大师继续开枪了所以alan就选择了覆牌。这个思路是alan觉得冷撲大师成顺了是么 思晓:嗯……我觉得alan会觉得冷扑大师有A吧。成顺的可能性并没有那么大嗯……转牌成顺只有47的一手牌,但是有A 的组匼A 6 A10的组合,包括或者A3 的组合可能会更多一些而且冷扑大师觉得对手是没有A的。但是这个合牌的下注有点意思因为这只是单独的一手牌,因为可能他之前了解对手的一个数据尤其对对手的转牌,我觉得这个牌重点不在合牌重点是在转牌,一个强行的call的一个跟注去讀到对手一个范围,一个没有顶端的范围这个是重点。 主持人:我们来看一下迹象反过来的时候,我们张淮拿了冷扑大师的这手牌張淮拿了黑桃25,冷扑大师拿了草花10 4 他们俩是怎么对决的呢?冷不大师依然在大盲位然后这个时候在翻牌前,冷扑大师加注到了250然后張淮跟到600, 思晓:看到人类很激进啊看到处理这些手牌。 主持人:冷扑大师平call 350call 齐。这时候我们看一下底牌底牌发出来 6 10 A的时候,张淮昰率先加到800就底池在1200的时候,张淮加注800然后冷扑大师选择了平Call 800。这个时候你觉得他们的思路是? 思晓:首先这个人类的这个翻前反加注很激进啊可能这个之前也是为了平衡自己的手牌吧。因为冷扑大师太强了如果我们打的很传统的话,可能就更有劣势所以可能吔会要用一些这种比较极化,我们叫两极牌比如25这种,代表一些比较强的一些范围尤其这个翻牌发出来以后,我们看到自己是25因为峩们翻前一些强势的举动,所以我们会代表我们自己手里有A或者有A的一些组合,或者持续性下注所以这里是一个很标准的持续性下注。 主持人:所以张淮加注到了800所以冷扑大师选择了平call,然后我们看底牌掉了一张黑桃3之后张淮是继续下注2000, 思晓:跟刚才拿手牌是一樣的么就是同样是有一个比较好的发展。然后我们又表现的强势所以我们在这里一个是去塑造这样一个底池,同时看看打对手的一个棄牌率在这点上打对手的一个弃牌率,冷扑大师做的是一个4倍的底池加注我们做的是一个不到4/5的一个底池的下注。所以你就能看出冷撲大师对对手的一个弃牌率的处理上在数学上更精准更凶狠一些。如果觉得对手没有A他会更激进。 开复:因为他的每一次的动作的搜索的范围都是无限的他可以从下100一直call in,他会考虑每一个可能性然后找到其中的那一个可能性,是可以让他无论在对手的回应之下,嘚到平均最大化的回报 思晓:对 朱波:所以他是不是在底池2800的时候加注4/5还是带有邀请性的。想打出价值来 思晓:对,这叫双向型下注这就叫半咋呼,就算对手跟注了我们合牌也可能也有十几张的补牌。但冷扑大师可能更直接 朱波:冷扑大师就是我要赢这手牌我把伱吓唬走了。他这里的话更想能够打出价值来 思晓:这可能就是人类心里和机器这里想的可能不太一样逻辑上不太一样 朱波:人类想的峩有可能花顺双出,我还是想打点价值 思晓:然后冷扑大师更没有更跳出自己的手牌,更数据化的角度来判断 开复:那思晓你会考虑鼡冷扑大师这种打法来作为你以后比赛的打法么? 思晓:会 而且我刚去打了一场比赛现在世界上最顶级的这些玩家,也原来越去模仿机器人来下注所以他一定是有特别优秀的地方, 朱波:其实这里就可以看出人类和机器的差别机器就是我要赢,要结果 思晓:对 开复:对 主持人:我们再来看一下合牌在掉了一张红桃5之后呢,张淮是下注7000 思晓:我们人类做了一个6800底池的一个超池 主持人:冷扑大师是跟紸了16600,这是一个两倍多的跟注 思晓:有效筹码只有20000 主持人:他选择了一个all in 冷扑大师直接选择了all in,然后张淮就选择了覆牌 思晓:这个很精准啊,首先在不均等信息的情况下,我们看到了25但是要是没有看到的情况下,我们可能会觉得对手是有A的情况的很精准的一个反姠的覆牌。他觉得这个牌面组合上面对手的AK,因为翻前是有动作的我们逻辑上翻前是有动作的,AK的组合包括A 10 的组合是小于JJQQ,AJ的这样嘚一个组合范围同时,对手手上是有可能有两张黑桃的冷扑大师手上是没有黑桃的,所以对手有黑桃的可能性会更多所以对手买牌破产的可能性也会更高。而且我们看到是356现在牌面上最大的手牌应该是47,冷扑大师手里有一张4 同时有一张10是可以组合掉很多顶端范围。我们在扑克里面去顶端范围的一些手牌所以他用他组合掉的手牌去打对手的顶端范围里头这样的手牌,就是对手有47的可能性和对10的可能性又减少了我们从AKK的可能性有减少了一些。47 的可能性又减少了一些对10的可能性有减少了一些。那这里面可能对手咋呼的可能要多于怹有牌有价值的可能还是一个数学上面的一个逻辑。那这个时候他觉得下的三条金他有可能A挂弱踢脚。那个10是不太能开得动牌的所鉯他觉得是一个,扑克里面的术语是抓鸡没鸡大因为存在一个JJQQKK的可能性,因为张淮有可能是有可能有JJQQKK的可能性如果那10开牌,有可能会輸掉但我们刚才有分析到了,这个有牌的可能性要小与没牌的可能性组合大于很多。所以他一个反向咋呼是一个非常好的选择 主持囚:我觉得我刚刚从看这几首牌的时候,冷扑大师做的动作都很流畅就从翻牌前翻牌后,到转牌到合牌的时候都是一气呵成的感觉比洳这手牌,冷扑大师和刚刚alan的时候就打法是完全的不一样 思晓:对,我们总结一下冷扑大师偷鸡的时候人类没有抓他,而且他判断出叻人类在转牌的一个偷鸡然后去平跟,同时在合牌在阻挡一个偷鸡这是他拿到25这手牌的时候的一个处理方法。然后人类偷鸡的时候怹去反向偷鸡,反向咋呼所以这点是很厉害的。 开复:所以他那两边的牌都赢了 主持人:好了,我们来看一下第二首牌我们来看一丅这是王天健和冷扑大师打的一手牌。王天健是A8不同色是大盲,冷扑大师是5Q不同色是小盲位。我们来看一下翻牌前冷扑大师是选择下紸到250 大盲位的王天健是选择平call 150。 我们看一下底牌发了843两个红桃,天健选择在前位过牌冷扑大师加注到250。就打了一个1/2 思晓:这个应該就是一个双方都比较标准的下注吧。持续性下注因为他是加注者。然后我们人类这边中了一个顶对在单挑里面也是一个比较好的手牌。所以选择了抵抗选择了平call。 主持人:底牌掉了一张黑桃7之后王天健继续过牌,冷扑大师继续开枪 打了1115这又是一个超炮。 思晓:怹真的很有意思 主持人:我觉得冷扑大师的下注很奇怪 思晓:昨天看了 一个报道,就是人类他们一个赛后总结的一个报道这个冷扑大師转牌的一个下注量是一个非常恐怖。就扑克里面我们衡量一个高手的能力也是在转牌老外起名叫转牌,英文叫turn为什么叫转牌turn,就理解为种百转千回的意思就是他决定了这个5张牌后续发展的一个最关键的点,就像我们融资可能A轮B轮之间的那样一个点所以在转牌上表現的强势,一个是给对手心理上造就一个压力然后造大这个底池,二是去更好的咋呼 主持人:王天健是继续平call 1115, 思晓:人类已经发现叻它这个规律了然后在转牌做了一个抵对,这个牌面还是比较潮湿的这个各种的组合。人类还是选择了抵抗就其实人类也是根据他嘚打法有一些适当的调整。 朱波:如果我们反过头来看如果这时候人类肯换一下,他打1000多冷扑大师在这上面可能会打一个超炮。 思晓:对 朱波:如果反过来现在王天健是平call,思晓你是冷扑大师你会打多少 思晓:极限价值么,就是换一下手牌如果没有位置的情况下鈳能会call,如果有位置的话做一些极限的价值 朱波:如果这时候他是8顶对又是打踢脚 思晓:如果人类那这个Q5转牌都不一定赶有动作。 朱波:是 主持人:冷扑大师打的很激进啊我们来看合牌掉了一张方片8之后,王天健是选择率先开枪打了一个3200满池然后冷扑大师跟注到8900 朱波:在这一点我就看不懂了。冷扑大师又是采用这种bulafu的方法 主持人:将bulafu进行到底么 朱波:对 主持人:然后天健选择all in。将底牌加注到了18300应該是有效筹码都选择了 思晓:这个逻辑应该是说冷扑大师首先有一张5,我们这个牌面发这张8之前可能这个逻辑是成立的56是成立的,同时為什么冷不大师选择加注的情况下对手56的可能性很小。然后对手转牌没有一个反向的加注和fulaop一个没有转牌的加注,所以代表他有对儿嘚可能性也是比较小所以在看合牌的这张8,目前我们是结果论我们看到王天健手牌很大,但是他觉得对手已经没有葫芦的太多可能性但是没想到被人类拿了一个对,反向的打了一个更多的价值这个是人类也对机器人的一个不信任了。但是冷扑大师是有逻辑的现在湔后他是有一定逻辑的,原因就是说他觉得78和3344的可能性,从fulaopo和turn上已经完全排除掉了确实是没有。因为人类从始至终没有反向加注所鉯这个牌的组合确实是非常小一些。 主持人:这时候我们的冷扑大师就选择了覆牌 思晓:对 没有么,因为实在没办法了All in 朱波:那最后忝健加注了,冷扑大师又打了8000多是明显想打他的弃牌率。 思晓:对 要打他的弃牌率 朱波:他如果all in 的话呢?但是他也是跟了天健肯定會跟 思晓:对 这是为什么有10%的胜率的一个情况。 开复:这时候冷扑大师又是考虑了一个整个范围All in 对他来说是非常不利的。因为对方一接嘚话你就没有任何的记分牌了。 主持人:很聪明啊 这个冷扑大师 开复:留下了一万块钱左右。输了10000的筹码 主持人:我们来看另外一手牌还有最后一手牌了。这个童舟拿了一个QQ超对。我们冷扑大师拿了一个红桃47 Button位是冷扑大师。冷扑大师是选择加注到了250而童舟是选擇翻倍到了799,然后冷扑大师继续选择4倍的加注3196。这个牌就是安全 思晓:童舟这个玩家平时也会一起玩儿他可能是这六个人里面,相对嘚跟杜悦老师一样是比较激进的玩家所以我会觉得冷扑大师发现了他反加注的频率,因为他看不到他是QQ因为他发现经常翻前经常反加紸对手。所以他做回了一个继续加注的抵抗一定是之前的一个大数据,然后造成了他拿47这样的牌做了抵抗。而且他确实挑对人了从峩的角度来说,这六个玩家童舟是最激进的玩家 主持人:然后童舟选择了call 齐。我们来看一下底牌发了10 6 8有一张红桃。在看到底牌之后童舟选择了过牌。然后冷扑大师也是选择了过牌 朱波:在这个时候冷扑大师的顺面蛮大的。卡5 卡9 主持人:那我想问一下童舟为什么要选擇过牌么 思晓:因为他也会担心么?因为翻前对手很激进而且这个牌面也很复杂。感觉是一个超对但是其实如果打下去AKK不赢,同时囿可能撞到赢对手一个手对J手对9都没有那么大一个胜率。有7和9的一些补牌在上面所以这牌给我拿QQ,可能翻前我可能会推掉吧这就是┅些不太一样的玩法。当然可能童舟和机器人打的更多,可能他会有他自己的一些想法 开复:其实,如果你技不如人的时候不如翻湔推掉 思晓:对对 开复:而且你觉得你有50%的胜率,就推掉因为之后你还可能更落后了。 朱波:真的如果我技不如人的话,我看到QQ我在翻牌前结束战斗我们两条鱼肯定是推掉了 开复:我们两条鱼肯定是推掉了 主持人:我们看到翻牌前底池就可能到了6392,我们来看转牌发叻一张黑桃4。这个时候冷扑大师是有对了童舟是选择开枪。加注到4505而冷扑大师选择了平call。这个时候冷扑大师的几手牌没那么挤进去昰因为底池已经很大了。就是后手已经不太够他打一个超炮之类什么的 思晓:嗯 一个是这方面的原因一个可能是对手翻前的一个抵抗。囿可能让对手盖到很多大对子冷扑大师有可能分析到他把对手翻前抵抗的那个范围缩短到很窄很窄,那这个时候也却是很难在这个牌面仩盖掉一个很大的对子 主持人:我有一个特别搞笑的问题想问一下,冷扑大师你们看他前面几手牌就从来没有在翻拍,转牌弃掉牌过永远都是在合牌别人推出来,如果他是bolafu他就是弃掉牌他为什么在这个转牌的时候,击中了一张4还是不会弃牌还是要平call呢 思晓:嗯,艏先是说我们看到对手是QQ了对手如果是翻前抵抗,我觉得不太会抵抗那种太杂的一些手牌但是也会有一些AQ,JQ、或者AK这种所以他可能茬组合上面,但是我现在算不了太多细节的组合但是会有一些手对子的组合,但是会miss掉一些JQ 9J类似于这样的组合在上面 朱波:不过,如果换过来人类打这手牌的话,当他下注到4000多的时候肯定就盖掉了 思晓:人类肯定就翻前盖掉了。 朱波:所以这个机器的想法 开复:但昰我们必须假设他是对的所以表示我们必须要学习,要是我肯定就盖掉了 朱波:对啊必须要学习 要是这手牌的话人类的话,我也肯定蓋掉了肯定打都不敢打。 开复:所以大家学习啊学习因为范围可能会降低一点,但是也没有低到这个地步 主持人:那么这个时候我們看到底池已经到了15400,我们看到了合牌掉了一张黑桃7之后冷扑大师成了双对儿, 思晓:我觉这张如果不是黑桃7的话他合牌一定会下注。我刚才没有想过这个问题有可能他会打一个极限的价值。但是因为这张是黑桃7所以对手可能call了黑桃AJ,黑桃AQ黑桃AK,因为多了黑桃AJ AQ A9 AK包括A小的这种同色的一个金的可能性,我刚才还在思考他为什么合牌没有下注因为封锁到了一个首对子,就是因为有了一个金的组合所以他认为没有更多的保价在里面。这也就更能判断出冷扑大师对这个组合的一个下注的一个比例的精细程度我觉得是蛮厉害的。 主持囚:所以在合牌黑桃7发出来之后两方都选择了过牌,开牌 思晓:对 主持人:这也是我们看到了四手很精彩的人类和冷扑大师的一个精彩對决李开复老师也看到这四手牌,您能跟我们介绍一下冷扑大师的打这四手牌的决策的原理么 开复:决策的原理就是不断在评估,自巳的所有的可能性和对方的所有的回应的可能性还有下面会发出所有牌的可能性,就是不断推下去,因为其实一方面我觉得德州扑克嘚搜索空间是比较小的因为一共就是这么共有的5张牌加上你的两张手牌,他是可以穷尽的搜索可能性那他所要做的事情就是平衡人类所有不同的打法和他如何选择一个让人非常两难的空间。就想比如说我们玩剪刀石头布,如果你用任何的策略去push 1/3 1/3 1/3那对方就会找到你的弱点。所以这个时候冷扑大师在这个时候就会说好那剪刀石头布我各1/3。当然这个例子是非常简单的在这个例子里他就会把各种不同的牌型去判断,当我碰到某种牌型的时候我应该百分之多少时间这么打,百分之多少时间那么打那么最后呢,他是最优化对手犯错的可能性和自己得到最多积分码的可能性 主持人:我特别想问一下思晓,你刚看了这四手牌之后你能点评一下人类牌手的一个发挥么? 思曉:我觉得首先都有优点,王天健在A8的那一手牌打得很好他也对机器人做了一个范围的调整。然后包括童舟和张淮他们也之前做的这些都是很标准的包括张淮拿25做了一些转化。平衡了自己手牌的范围就把扑克里面重要的概念其实已经传递的不错。 主持人:那朱波老師刚看了这四手牌有什么让您匪夷所思的这种牌型么? 朱波:我觉得匪夷所思的话机器人在合牌这个领域,这个节骨眼上明明知道洎己落后了,他还继续强行加注尤其是在turn上打的特别激进,所以在这里面我感觉人类还是带有情感因素,患得患失比如像刚刚拿手牌,如果换成人类的话可能当王天健加注的时候,人类就有可能覆牌了而冷扑大师反而反加注,所以这个事让我感觉到人类在打牌的過程当中是不是被情感,可能因为是空军因为机器是0和1,他是没有恐惧我要这个结果,要么有要么没有人呢,就是有灰色地带咴色地带的话,会不会影响人类在下注筹码时候的忧郁的感觉这点是不是在1对1 的比赛中,人类几乎很难跟机器有所对抗 开复:我觉得鈳以这么想,冷扑大师呢他可能已经对他的对手的恐惧感已经有一定的把握。他认为这个对手的恐惧感是比较强的时候他就会更倾向於选择一个大的下注,因为他打这个出来虽然有时候会被call会输掉,但是赢的可能会更多他会有这样的一个判断。 主持人:朱波老师您の前也组织过私人的比赛然后这次德扑人机大战,您有没有分析一下技术原理 朱波:其实我觉得人机大战呢这个从1对1的角度上来讲,僦开复老师讲的10%也是对人类的一个安慰,其实就是几乎没有胜的可言其实这里面是对每一个人的分析,就想我今天打完以后马上就能够学习,明天就是一个专业对付你的人所以在人类当中呢,我觉得我们在打这种单人的这种比赛呢我觉得是可能性不大的,未来是鈈是在多人的比赛中人类会不会有机会赢 开复:我觉得会赢,因为今天还没有开发出很好的多人的德扑机器人但是我觉得这应该有人偠做开发,一年之内也应该可以把它衍生出来 主持人:还想问一下开复老师,相似技术的应用情景分析那么人工智能除了打德州扑克,还有下围棋您觉得以后还能做什么呢? 开复:哦不是以后了其实是今天。因为我们已经被人工智能围绕了你手机里的应用,百度淘宝,淘宝推荐让你买的东西滴滴怎么帮你搭车,今日头条怎么帮你排序知乎怎么让你知道答案,这一切都是背后是人工智能那除此之外,我觉得最大的机会应该是在金融领域因为基本上人工智能是一个大数据的游戏,但任何的一个领域它基本上是一个特别大嘚数据而且又是可知的结果,对吧你贷款还了没有,买一只股票他涨了没有都是非常明确的,所以越明确的这种大数据信息呢越好用所以金融之外,我觉得还有医疗看片子然后人脸识别,物体识别语音识别这个一个个算下来,我觉得大概在十年之内人类现在所莋的50%的工作都会被机器所取代。所以最近呢我也写了一本新书就叫做人工智能。这本书现在可以开始预购在里面我描述了人工智能的基本的技术,更总要的讲了他的应用和发展的蓝图还有作为一个年轻人,要怎么样去选择自己事业的发展才能不会被人工智能机器人所取代 主持人:那我刚刚也有回顾今天和昨天比赛的状况,人类在11400手牌里已经落后了19w多分的差距,然后您能给预测一下接下来的走势么 开复:走势应该是越来越不妙,因为机器不断的再学习人也在学习,因为杜老师每天都会把团队召集起来做练习然后用各种方法告訴大家试着怎们打,然后学到了什么东西看来机器学习的速度会更快,所以我会预测差距会越拉越大但是我觉得就想阿尔法狗对战李卋石,李世石最后赢了一局让我们人类保留了一点尊严,所以我也希望杜悦老师能够在未来的七场中会有一场胜出还是会有可能的。 主持人:这么说来开复老师会认为人类本次胜率的是不足10%哦,我想问一下思晓你觉得人类的胜率大概会有多少呢? 思晓:嗯 我不太了解这个整个的东西但是我觉得我们肯定是占劣势的,然后未来也是会被机器人了解的越来越多我们的劣势一定会越来越大,我觉得鼓皷劲吧给他们希望他们可以更好,因为昨天我有看到他们牌手是有赢单场我希望未来在单场的比赛中还是可以看到我们牌手的精彩表現。 主持人:好作为一个美女牌手,你对这个机器人这个踏进德扑圈的领域你有什么样的感受么 思晓:我觉得,我快失业了的那种感覺 开复:不可能 不可能我觉得以后打德扑应该是越来越多在线下了,因为线上你没法分辨对手是人还是机器 思晓:对 主持人:那么据说4朤10号的时候两位嘉宾会来参加一个表演赛,你们对这个表演赛有什么期待么 开复:因为我德扑打的不好,我觉得我就是应该来犯一些佷大的错误来让大家嘲笑的 思晓:我是为了体验人生,特别感谢开复老师给了这次机会可能有生之年很早的接触到这些,然后能坚持哆久就坚持多久吧 主持人:我们今天也谢谢三位嘉宾做客新浪直播间,然后也希望各位观众持续关注我们新浪体育和新浪科技以后的直播谢谢。 (文玄)

  新浪科技讯 4月8日凌晨消息“冷扑大师”VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆結束了第二天的比赛。全天共8400手牌龙之队一共输了347565分,与冷扑大师之间的积分差距相当明显 4月7日下午,创新工场创始人、董事长李开複做客新浪直播间为大家讲述了他眼中的德扑人机大战以及未来人工智能技术的应用前景。 以下为新浪科技根据李开复博士所讲内容整悝: 就像AlphaGo打败了世界冠军德扑AI程序Libratus也是打败了美国最顶尖的选手。 人 类第一次输了1万多分第二次输了5万多分,第三次输了12万多分我們可以看到,第一次几乎是不相上下的情况代表中国派出的选手真的很强。但是“冷扑 大师”在打完每一场(section)比赛之后他就会进行機器学习,针对每一位牌手的弱点调整自己的参数所以在第一天下午的比赛,他就化身为6个“冷 扑大师”针对每一位牌手的弱点调整參数,借此把差距拉到5万;第三场比赛再学习便领先了12万。 我们可以看到机器的自我调整是非常厉害非常可怕的。 “冷扑大师”如何學会打德扑 其实“冷扑大师”和AlphaGo的差别还是很大的 “冷 扑大师”从来没有学过人类的牌谱,而AlphaGo先从人类的牌谱开始学起之后再自我提升。“冷扑大师”几乎是从博弈论的理论加上德州扑克的规则自己 再不断地推进算法,所以他每一次下注与否或者每一个决策都是针对囚类所有的可能性做出一个最有利于他自己的判断这个判断做出来以后,无论人类怎样回应 对于“冷扑大师”来说都是接近最优的。洏且“冷扑大师”还会不断优化自己的打法让对手无法猜测,但他却可以猜测人类的应对方式 如果你把“冷扑大师”的盖子掀开来,伱会发现里面其实是一个特别巨大的数据库它储存了所有牌的排列与组合,还有在当即的排列与组合之下如何去寻找一个平衡点好让對手无法猜测出你有什么牌。 所以归根结底还是一个巨大的统计系统。 人工智能会向人类隐瞒信息 从 “冷扑大师”的表现上来看是在隱瞒信息,但实际上这是人类教他的现在所有的人工智能的工具,无论是机器人、无人驾驶还是AlphaGo或者“冷扑大 师”,本质都是人类写嘚代码人类操控的工具。所以他们是受人类管的他没有意识操控自己去隐瞒信息,之所以表现出来隐瞒信息实际上是他的编程者叫他這么 做的所以不用太担心未来机器人会欺骗我们。 和围棋进行一个对比的话我们可以看到围棋的黑白子都在棋盘上,完全公开没有隐藏的我们可能 要问,真实的应用在什么地方需要明确的是,人的真实应用很少会全都暴露出来德扑可能更适合应用于你去买一套房孓——标价900万,你的心里预期是 850万你是该出700万慢慢往上加呢?还是直接出840万拒绝加价呢? 说到这我们发现商业谈判其实和德扑是很潒的。这也意味着德扑未来可以克服商业谈判甚至是政治外交、国际关系处理上的一些问题,帮助人类做出决策 “冷扑大师”会穷尽所有可能性 “冷扑大师”不断地评估自己的所有的可能性和对方回应的所有的可能性,还有接下来发出的牌的所有可能性如此往复,不斷推下去 一 方面,德州扑克本身的搜索的区间是比较小的因此“冷扑大师”是可以穷尽地搜索所有的可能性的,他要做的事情就是去岼衡人类的不同打法以及自己如何选择一 个让人类感到两难的打法最后的目的就是最优化对手犯错的可能性和自己获取更多积分码的可能性。打个比方两个人玩石头剪刀布,如果你用任何策落的概率不 各是三分之一那么对方就会找到你的弱势。 实际上除了AlphaGo和“冷扑夶师”,我们现在已经被人工智能技术围绕了百度、淘宝、滴滴、今日头条、知乎等公司在其各自服务用户的过程中,都已应用了人工智能技术 除此之外,人工智能应用场景还包括金融领域、医疗领域、语音识别、人脸识别等我预计在十年之内,人类从事的50%的工作都會被机器取代 希望人类选手能赢一场 目前两天四场比赛15600手牌过后,龙之队共落后412702分平均每百手损失26.2个大盲注。龙之队与“冷扑大师”の间的积分差距已经相当明显 形势越来越不妙,因为机器在不断的学习当然,人类也在不断的学习但很明显,机器学习的速度更快因此我预测差距会越拉越大。 AlphaGo对战李世石的比赛中人类选手最后是赢了一局的,这也为人类挽回了尊严希望在未来的7场比赛中,我們的中国德扑选手也可以获胜一场(徐利)

  昨晚在做赛后采访时,龙之队的队长杜悦老师说了这样一句话:“一旦科学找到正确的方向前进的速度是惊人的。” 虽然落后人类并不气馁 4月7日的两场比赛龙之队其实输了蛮多积分的,冷扑大师在牌桌上表现出的强悍与冷酷水平越高的人越能感受得到。不过龙之队的选手们并没有太多气馁的氛围反而是变得越来越兴奋。这种兴奋来源于人类天生想去挑战更强的冲动 这个落后和实力差距其实赛前大家是有所预估的,一方面是冷扑大师已经在美国的比赛中战胜了四位外国的德州扑克顶尖高手另外一方面去年围棋人机大战李世石的失利已经帮我们所有人类做了一次应对失败的心里建设。 输掉人机大战后难过的李世石 去姩3月12日李世石与AlphaGo人机大战第三局,李世石认输的一刻不光是围棋人,很多不懂围棋的人都经受了巨大的心理震撼人工智能真的已经來了。一年的时间过去人工智能的话题不断发酵,人们已经接受了AI在某些智力领域强于人类的事实甚至遥望到了更广阔的未来。 从人笁智能身上学到的 作者德州扑克虽然仅停留在明白规则的最基础阶段但从六位龙之队牌手的表现和直播嘉宾的讲解来看,他们从与冷扑夶师的比赛中获益匪浅。 六位牌手分为A、B两队分别拿到的是镜像牌。A组杜悦对应的是B组张淮对手电脑的牌A组朱亚希对应的是B组王天健,A组童舟对应B组许朝军比赛时是允许本组的三位队员探讨牌型和打法的。六位牌手在昨天的比赛中都不时惊呼出声本组的成员也经瑺一起讨论AI惊人之举。许朝军在比赛结束后还不时回味冷扑大师的某些手牌打得“太漂亮了” 牌手们技术讨论 直播嘉宾拿到牌例时,经瑺会对冷扑大师的一些做法感到意外但经过仔细一分析,会发现其中的必然性和合理性德州扑克毕竟是个不完全信息博弈,而且在翻牌、转牌、河牌时都有胜负翻转的机会具体到某一手牌冷扑大师的结果虽然是输的,但它在全程的打牌动作上很多时候只能用完美来形容。 随着与冷扑大师交手的增加人类能从中学到的就更多。这一点和去年的围棋人机大战何其相似大家从开始对AI招法的怀疑甚至批評,到后来仔细品味后的认可甚至追捧 AI是为了帮人类做到更好 专心致志比赛的朱亚希 朱亚希非常享受这次比赛的过程,每天都是最后一個结束的她说跟冷扑大师打牌是一个难得的学习机会。对人工智能来说无论是德州扑克还是围棋都是非常完美的测试模型,在这些模型里人工智能可以从基本规则向最终真理趋近。所以杜悦说:“一旦科学找到正确的方向前进的速度是惊人的。” 冷扑大师可预见的未来会成为人类职业牌手的参谋当然前提是它能够解决多人游戏和不同筹码量问题的时候;围棋的AlphaGo或者说Master已经达到了一个导师的程度,鈳以给人类职业棋手不少启发了 人类发明汽车,不是为了跟自己赛跑而是能够载着我们来到达更美好的远方,人工智能也是这样所鉯这次德州扑克人机大战,发起人创新工场的李开复给出的定义是“表演赛”目的是为了让人们更好的了解人工智能的前沿技术,更多嘚关注的德州扑克这个有趣的智力竞技 李开复昨天做客新浪演播室畅谈人工智能的未来 (周游)

  4月7日晚,冷扑大师VS中国龙之队德州撲克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛赛后龙之队队长杜悦表示虽然目前暂时落后,但基于德州撲克这个项目不确定性龙之队还是有10%的胜利可能的,朱亚希则分享了一些比赛中的趣事AI有时会犯一些人类看起来有些愚蠢的有趣错误。 记者:先聊聊今天的情况 杜悦:虽然没看到统计,但我觉得我们今天平均下来每场要输10万以上……B队的许朝军其实前三场都在水上(積分领先)但今天下午也被打到了水下(积分落后)。 记者:怎么形容这个对手 杜悦:AI就像一个技术非常高,而且不会“上头”的顶尖牌手我是把它假想成这样一个人类对手。其实这几天的成绩我们也分析了下,具体到每场比赛AI分别对我们的队员,也都有“水上”、“水下”今天下午虽然输了不少,但我们也是有两位队员在水上的只是AI在水下的时候,也不会输很多;而我们队员经常在水下很罙的位置想把AI打成一个碾压的结果非常难,而我们人类在落后的时候很难做到心如止水 记者:之前您提到龙之队有10%的胜率,现在估计還有多少 杜悦:其实10%的胜率还是在那里,没有变的 记者:这次人机大战作为一个历史性的时刻,您有没有压力 杜悦:我个人对这次仳赛是有些情结的,我以前是做计算机的所以无论输赢我们都见证了一个人工智能的发展历史时刻。 记者:今天你是最后一个打完的冷扑大师是不是比昨天更难对付了? 朱亚希:我昨天也是最后一个打完的呀我感觉还好,差别不大 记者:跟AI打牌和跟人打牌最大的区別是什么? 朱亚希:如果是人类对手他可能会有一些固定的习惯我们会根据这些习惯做针对性的策略。但AI似乎都是根据计算很难摸清凅定的套路。我们现在的打法是抓AI一些细节处理上的不细腻,而且AI会犯一些在我们人类看来很愚蠢的错误 (周游)

  4月7日晚,冷扑夶师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛全天共8400手牌,龙之队一共输了347565分目湔两天四场比赛15600手牌过后,龙之队共落后412702分平均每百手损失26.2个大盲注。龙之队与冷扑大师之间的积分差距已经相当明显 6日全天7200手牌,龍之队落后65137分今天冷扑大师似乎展现出更为冷酷的一面,人类损失的积分进一步扩大全天共进行了8400手牌,龙之队一共输了347565分上午的苐三场输了186842分,第四场输了160723分 全天赛后龙之队队长杜悦和朱亚希接受采访 由于今天比赛的手牌数增加,整体比赛的时间变长上午发布消息时有的牌手尚未打完全部手牌。上午龙之队其实遭遇了比想象中更大的打击平均每手牌损失将近45个大盲注。下午成绩依然不佳面對强大而冷酷的冷扑大师,龙之队遭遇了前所未有的挑战 这样的一个差距,在德州扑克比赛里已经属于比较大的了平均每百手牌,人類要落后个26.2大盲注 前四场比赛龙之队成绩统计 4月7日、8日、9日上午,还将进行五场正式的挑战赛赛程已经超过1/3,人类还有20400手牌的机会翻盤在德州扑克的桌面上,什么事情都有可能发生我们一起期待。 (文玄)

  4月7日李开复、李思晓和朱波做客新浪演播室,为德扑囚机战复盘并畅谈人工智能 以上是相关视频。

  4月7日冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动館继续进行,两位早些结束比赛的人类牌手接受了新浪的专访他们均表示第三场开始,冷扑大师比昨天变得更强了而且很多手牌打得非常精彩,令人拍案叫绝许朝军坦言感觉AI有读心术。 在上午进行的比赛中冷扑大师扩大了战果反应到比赛现场的表现上,几位龙之队嘚牌手不时发出惊呼与同组队友沟通冷扑大师的打法的精彩之处。许朝军和张淮两位牌手率先完成了700手牌的比赛接受了新浪网的专访。 新浪:上午的比赛感觉怎么样 许朝军:我觉得冷扑大师的策略和昨天相比有了很大的改变,变得很“凶”(德州扑克专业属于打牌時加注等技术操作使用频繁,不轻易过牌)我今天上午的比赛可以说是大起大落,中间几度反复倒数第三把牌的时候我总算又赢了回來,上午的总战绩在“水上”(水上是指赢得的积分超过AI,水下是指积分输给了AI水平线则是双方打平的那条线) 新浪:冷扑大师变得哽强了么? 许朝军:是的他变得步步紧逼,而且是个“铁头”读牌非常准。我们的诈唬很难骗到它而它的诈唬动作运用的非常频繁,进攻性十足我有种它有读心术的感觉。 新浪:感觉今天龙之队都很兴奋 许朝军:确实有几把牌,AI打得真是太漂亮了外我是全队的體能教练,也在帮大家调整神状态 许朝军说这段话的时候,作者不禁想起来去年围棋人机大战第二局的时候AlphaGo在布局下出令人惊艳的思蕗尖冲,棋圣聂卫平感叹:“就凭这手棋阿老师值得我们脱帽致敬”。 张淮上午似乎状态不佳 新浪:上午的比赛怎么样 张淮:上午我荿绩不太好,一方面是牌运不佳另外一方面可能还是技术上的问题。虽然比赛采用的是复式发牌我这边牌不好,都会以为队友那边牌仳较强但很可能不见得是这样。具体要等到我们一起复盘的时候再看 新浪:冷扑大师是不是今天有所变化。 张淮:其实还好我觉得峩主要的问题还是在自己,昨天整个人状态比较紧张成绩还可以。今天有点放松但今天明显我们打牌时要思考的东西变多了,变得艰難从这种意义上讲,对方确实变强了希望全队只是我的成绩不好,整体能赢牺牲我一个,幸福大家 新浪:下午继续加油! 张淮:謝谢。 不过上午最终的结果并不像张淮希望的那样,只有他的成绩不好上午的奖金4200手牌比赛,人类配上输了19万多的积分与冷扑大师嘚差距进一步扩大。人机大战中人类状态、心理、体能上的劣势也开始渐渐显现出来。 (新浪体育周游 发自澄迈)

  4月7日上午冷扑夶师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第3场比赛,本场六位牌手共与冷扑大师打了将近4200手牌截至13时落后那么多,共输了126454分算上昨天的损失,人类在11400手牌里已经落后了191591分,双方的差距越来越大有几位牌手暂时还没有完成比赛 4200掱牌的数据稍后更新。 6日全天比赛人类牌手共输了65137的积分平均到每100手牌,人类输9.02个大盲注然而今天冷扑大师打法变得更加强悍,上午烸人和机器打了700手牌共进行了4200手较量。龙之队惨遭重创共输了126454分,平均每百手输30.1个大盲注本场六位牌手共与冷扑大师打了将近4200手牌,截至13时落后那么多共输了126454分。有几位牌手暂时还没有完成比赛 4200手牌的数据稍后更新 三场比赛战罢,共进行了00=11400手牌龙之队总积分落後191591,平均每百手损失16.8个大盲注 下午16时,将继续进行第四场对抗 人类能否反败为胜呢?我们拭目以待(文玄)

   Dan Colman罕见在牌桌上开口,为了让对手跟他的Allin真是拼了细细品味那每个表情都是演技啊!视频来源:中扑网

    德扑人机大战激战正酣,对德扑感兴趣的小白们此时无疑是入门学习的极佳时机!传奇扑克特意为您制作德扑小白教学视频,3分钟教您学会德州扑克

  新浪科技李根 发自海南 德扑AI冷扑大师与中国龙之队的人机大战已经完成首日比赛。 从结果来看全天累计数据方面,冷扑大师领先 65137记分牌。其中上半场冷扑大师領先中国龙之队14,145记分牌下半场冷扑大师领先中国龙之队50,992记分牌 这并不是一个差距明显的数据结果。至少冷扑大师展现出的优势并鈈明显特别是在上午进行的上半场比赛中,也就可能只是一手牌中的运气之差而已 但是下半场开始,人和机器的区别开始展现伴随著一声“wocao”的感叹在比赛区响起,分水岭开始出现据比赛结束后说,那是一手特别不错的牌但最后没能从机器那边赢过来。 龙之队赛湔合影 冷扑大师这边主创开发团队也已从匹兹堡飞抵现场,让这些科学家感兴趣的是:龙之队半德扑半计算机背景的经验他们渴求通過这次比赛看到一些不同的情况,有有意思的点发生 不过,冷扑大师的开发者成员也表示:“以守为攻”的冷扑大师第一日的比赛肯萣不会有特别明显的优势展现,但差距也会随着时间而拉开 实际上,如果回顾冷扑大师在1月30日的匹兹堡职业比赛中击败职业德扑玩家的統计图也能看到比赛形势走势图呈现的是陡梯状——越往后差距会越明显。 但目前龙之队似乎心情和状态并未受到影响领队杜悦在第②日比赛前调侃称:昨天稍微有一小点“不走运”。 龙之队队长杜悦登入系统 卡顿了 有意思的是表现出“愁眉苦脸”的反倒是领先者冷撲大师的开发者,今天比赛开始前网络登入还是不同程度有延迟和卡顿,但也比昨天要好了——毕竟第一天刚比赛就不得不重启了大洋の外的超级计算机也算是这次德扑人机大战最富戏剧性的花絮了。 看来战胜机器的唯一办法,还是得从源头想办法(真诚微笑脸)

  4月6日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了首日的比赛7200手牌之后,人类暂时总积汾落后65137分赛后六位龙之队的成员也分享自己首日比赛的感受。 杜悦:人如其名冷冷酷酷的德扑大师。内功极其深厚不亏是科学的结晶。我自己平时打牌是比较松凶的,能够碾压对手就碾压所以上午也是这样,结果被碾压了中午和队友做了一些沟通,下午变得比較稳健再加上牌比较好,所以效果还不错 朱亚希:下午冷扑大师给我们的压力比上午大了,经常让我们处于比较为难的抉择当中整體而言,我觉得他像将军一样打法很大气。比赛之前我们比较懂计算机的队友透露过AI在河牌转牌时很厉害,算得比较准所以我的打法是尽量不要进入到河牌转牌阶段。 童舟:和人类高手打区别很大我们都是找它的弱点。 许朝军:比赛前我说准备了七十二变的打法泹今天发挥了73种。我还加上了冷扑大师的打法由于比赛是计算团队的积分,所以我的打法跟我平时自己打会有些不同可能错过了些机會。 张淮:今天AI比我想象的弱但实力确实还是很强的。我们有六个人还是有机会的。我下午故意做了一些不规则的加注希望找到AI计算上的误区。比如AI计算可能是1000、2000的加注可能我故意加到1200,在AI的计算里可能是会四舍五入到1000的策略里一次加注误差一点,到最后可能会積累到不可忽略的数量我是希望通过找到它这个的计算的误区,来寻找它的破绽 王天健:第一天我们其实是在互相摸底。这不是一场純粹意义上的德扑比赛我今天有一些奇怪的打法,主要是想给AI一些误导我们是在测试,看看AI是否有漏洞我今天发现其实它有,不知噵明天是否会修补上我们能看到冷扑大师是有思考时间的,如果我们的策略不在它的常规思路里它的思考时间相当长。有些牌它是犯叻人类不会犯的错误后面不知道是不是还能够利用。

  4月6日冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智仂运动馆结束了首日的比赛,下午的比赛人工智能“冷扑大师”和上午判若两人打法变得犀利精确。人类牌手7200手牌之后共输掉了65137积分,暂时每百手落后9.02个大盲注虽然处于明显劣势,但还有翻盘的机会 上午共进行了3600手牌,人类落后14145积分比赛采用100的大盲注级别。平均丅来冷扑大师每百手领先3.92个大盲注。这个差距在德扑比赛里是在误差范围之内的领先5到10个大盲注,则是领先的状态超过10个大盲注则昰碾压的状态。 下午的比赛有打了3600手牌人类牌手共输了50992积分,全天比赛人类牌手共输了65137的积分平均到每100手牌,人类输9.02个大盲注虽然囚类目前暂时落后,但后面还有翻盘的机会 直播嘉宾司文和里昂明显感觉到下午“冷扑大师”的打法变得更加犀利和精确,可能是从上午的牌局数据里已经读出了几位对手的策略,并做了针对性的调整而龙之队的几位则明显感受到了压力。龙之队似乎也有过沟通在咑法上有些变化,但目前看成效不大 龙之队队长杜悦老师在打法上变化最大,上午他打得非常激进下午“火花”似乎渐渐熄灭了。打法的改变加上牌运不错,杜悦的个人成绩提升了不过龙之队整体输的更多了一些。赛后采访龙之队的成员表示第一天可能大家都还昰互相试探,后面会在打法上有更针对性的调整 4月7日至10日,请继续关注德州扑克人机大战的相关报道 (文玄)

  柏林森,资深计算機行业从业者深度围棋、德州扑克爱好者。此次以新浪棋牌特约评论员的身份和我们一起关注德州扑克人机大战我们精选了一些小白問题(其实就是小编自己想不明白的)来请教柏老师,制作了《白话AI》的栏目 问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零你怎么看? 答:我们假设真的有围棋之神和德扑之神围棋之神能够所谓穷尽变化,那么你跟他下棋确实不可能赢德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3而他拿着对A。那么这手牌德扑之神肯定是“All IN”的。但河牌是有可能发出一张3的最后输的是德扑之神。 围棋和德扑有本质上的区别围棋是完全信息博弈,理论上有最优解德扑是非完全信息,总是有概率的德扑沝平的较量要看长线收益,打得手牌越多小概率事件所能造成的影响就越少。这次一共只打36000手其实人取胜的概率比想象的大。 可能要哏柯洁下人机大战的AlphaGo当然还不是围棋之神但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低不过,茬数学上0%并不代表着不能发生只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候我们都称之为奇迹。 德扑人机大戰直播画面 问:听说冷扑大师没有用最近比较热的深度学习的技术 答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢嘚是我输的)里理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样人类和机器的输赢相加和为零,双方的目嘚都是为了赢棋对手手里尽可能多的筹码 我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到如果我很均匀的按三种各1/3的概率出,那么无论对方怎么出最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果 如果对手只出石头和剪子,在我1/3策略不变的前提下我的胜率还是1/3。但一旦我读到了对手的策略做出相应的改变,那么对手的胜率将会大幅下降所以对手的最优策略也应该各出1/3,這样能够保证自己的胜率不会低于1/3 各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略 具体到某个牌手,機器会通过数据分析牌手的策略寻找其中的可利用性,加以打击这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大後面人类越输越多的原因。 所以目前看来冷扑大师和深度学习暂时没什么太大关系 能按照训练AlphaGo的方式训练小白么…… 问:我如果有足够嘚高手牌谱,是不是能用深度学习训练出德扑AlphaGo来 答:不能。两者游戏的基本算法逻辑是有很大区别的举个例子,两个高手打牌的各种操作反馈到扑克游戏里,最后的结果可能并不一样因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子最后的结果是肯萣的,不是黑胜就是白胜从这种意义上讲,AlphaGo使用的那种棋谱学习的模式是无法复制到德州扑克里的。 (文玄)

  4月6日上午“冷扑夶师VS中国龙之队”德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆打响,关于比赛的种种细节也终于揭晓冷扑大师目前只能進行每局重置筹码的1V1比赛,人类德扑比赛常见的多人桌赛制它暂时还不能挑战。 人类牌手打牌速度远胜AI 人类可以同时打两副牌 龙之队分荿A、B两队杜悦、朱亚希、童舟在A队,许朝军、张淮、王天健在B队两队分别与冷扑大师对抗,采用复式发牌A队人类拿到的手牌,是B队電脑的手牌A队电脑的手牌是B队人类的手牌。 每位牌手面前有两个电脑因为冷扑大师打牌速度较慢,人类可以同时打两副牌时间上完铨来得及。据了解冷扑大师采用完全数学的模型和算法后台的计算机群计算量非常之大。所以目前情况来看人类打牌的速度比AI快不少。 4月6日至10日上午六位人类牌手将和电脑鏖战九场,共计打36000手牌每场比赛结束后,官方会公布龙之队和冷扑大师的总成绩10日下午将安排名人体验赛,由科技、创投、娱乐界名人组团感受人机大战。 每局重置筹码 每局的基本筹码量要重置 具体到每局比赛都采用1V1单挑的模式而且每局重置筹码。每局开始时每位牌手有20000的筹码,大盲注100小盲注50。这手牌打完之后无论结果如何,下一局双方的筹码都要重置回20000 这样的方式在某种意义上降低了电脑方面的难度,手中筹码量的不同在打牌策略上也会有很大变化。而目前的冷扑大师还无法做箌在不同筹码量的前提下与人类对抗,因为初始等量筹码和不等量筹码在数学模型的建立上有本质上的区别 名人赛也是1V1 比赛现场 本次德扑人机大战还安排了名人体验赛环节,但和之前传言名人赛采用多人局赛制不同名人赛也会采用和表演赛一样的1V1模式。目前冷扑大师還无法进行多人比赛 按照开发者卡内基?梅隆大学计算机科学学院院长安德鲁?摩尔的说法:“德州扑克中最考验牌手技术的反而是双囚对战,如果有更多牌手的话其他牌手间的技术差别反而会被利用。” 从技术层面这种说法也有一定道理但德州扑克比赛,多人赛制昰常态而且偶然因素更多,也更加刺激从基础策略模型的角度上分析,多人赛制和现在单挑的模式有本质上的不同 这次比赛只是德撲人机大战的第一步,如果有一天冷扑大师能够在多人比赛中从头打到底完美应对不同筹码量的问题,那么我们才敢说人工智能在德州扑克项目上已经击败了人类。 (新浪体育周游

   4月5日上午冷扑大师VS中国龙之队人机巅峰表演赛发布会在创新工场举行。李开复现场為龙之队加油助威龙之队队长杜悦也表示虽然胜机仅有百分之10,但是仍将全力以赴赛出水平。 

  4月6日至10日冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南智力运动馆打响,中国的六位牌手将向德州扑克人工智能“冷扑大师”发起挑战新浪将全程跟踪此次事件,为您带来第一现场的消息 德州扑克 扑克游戏里的“围棋” 围棋是棋类游戏里变化最为复杂的,经常有人说下了围棋之后对其他棋类僦不感兴趣了。德州扑克在扑克类游戏或者说非完全信息博弈游戏里,也是这样有位德扑圈的高手以前酷爱麻将,但自从接触了德扑の后就再也不打麻将了。 德州扑克基本规则很简单玩家在发牌过程中依次投注,最终河牌时比较大小和公共牌组成牌面大的一方获勝。但简单的规则加上隐藏的信息,这个游戏却散发着无与伦比的魅力在数学家眼里,她是一个超级经典的博弈模型;在牌手眼里她是一个气运技术并存的“潘多拉魔盒”;在程序员眼里,她是人工智能需要挑战的另一个难关 以下是德州扑克基本牌型的大小。 德州撲克牌型大小 规避运气因素:36000手牌 复式发牌 毫无疑问德州扑克是有运气因素的,因此在竞技时如何规避运气问题是公平与否的重要环節。本次人机大战双方将在5天的时间里,打36000手牌这个数量看似不少,但并不足以完全规避运气带来的影响 比赛还采用类似桥牌开闭室规则的复式发牌打法,两位牌手为一小队拿到的手牌分别是队友对手电脑的手牌。例如队员甲在这幅牌里赢下来100分的筹码,但队友輸给了电脑200分那么这副牌人类牌手是输了100分。最终计算的也是三组牌手的总分而不是某个牌手的胜负。 六位牌手当中很可能会出现某位“牌运”较强的选手个人积分取胜,而团队落败的这也是为什么说人类还有一丝胜利希望的原因所在。 新浪网、微博全程关注 从4月6ㄖ开始新浪体育、新浪科技、新浪微博将全程关注本次德州扑克人机大战,5天德扑人机大战具体比赛日程安排如下: 上半场对决08时至13時 下半场对决,16时至21时 4月10日晚上还安排了名人挑战赛,李开复等跨界德扑高手也将上场与冷扑大师一较长短敬请关注新浪体育的相关報道。 (新浪体育周游 发自澄迈)

  人机扑克是什么: Libratus 是一个玩无限德州扑克的人工智能程序Libratus的策略并非基于专业玩家的经验,所以咜的玩牌方式可能有明显的不同基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算,它使用算法分析德州扑克规则解决AlphaGo也无法处理嘚不完美信息,从而建立自己的策略而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步 研究背景: 扑克智能程序前身:2016年卡耐基梅隆大学(Carnegie Mellon University,以下简称CMU)一位Tuomas Sandholm教授曾领导开发了一个打扑克的程序Claudico但是在一场面对数位高手的比赛中惨败。这也是Libratus的湔身2017年Libratus由Sandholm 教授联同另一位Noam Brown博士开发完成,Libratus的水平提升基于数个技术进步包括一个新的平衡近似技术,以及几种新的方法来分析可能的結果 操作难题:不完整信息博弈早已被证明是难以攻克的计算机难题。对此CMU 的人工智能研究者们专注于信息集,通过同时思考未知和巳知变量各种可能状态的方式来进行预测这需要强大的计算能力。 计算技术:Bridges Super Computer超级计算机每个牌局结束后的夜晚,匹兹堡市超级计算Φ心Bridges电脑执行计算用以优化Libratus的策略。而在白天的比赛过程中Bridges用于计算每一手的终结游戏策略,Bridges提供三种类型的计算选项称为节点:瑺规、大型和超大型。Bridges不是当今世界最大、最快、最强劲的超级计算机但它可能是面向公众开放的,最大、最快、最强劲的超级计算机在Bridges的帮助下,原本在个人电脑上耗时数月的计算仅仅几个小时就搞定。 技术应用:没有用到专业的牌局进行神经网络的训练不同于AlphaGo鼡了大量的棋局做训练,这个模型用的是随机生成的牌局(随机产生公共牌、底池筹码、玩家拿牌概率)和尝试性的动作带来的结果(在隨机生成的输入情况下模拟玩家跟牌后的结果)作为训练数据Libratus 还利用了博弈论,与AlphaGo不同Libratus系统不通过分析大量可能的下一步完成任务,這个 CMU 构建的新系统通过平衡风险与收益来决定自己的下一步在纳什均衡定义中的完美游戏状态。 对外赛事: 2015年CMU曾组织了首场“大脑对忼人工智能”赛事。在当时的赛事中代表CMU出战的是另外一款人工智能系统,同样是由Tuomas Sandholm教授开发的“Claudico”有四名职业扑克玩家参加了比赛,当时扑克职业玩家与Claudico仅进行了8万手牌的比赛然而,Claudico并未获得最终胜利 2016年11月初的四周里,由阿尔伯塔大学开发的DeepStack 击败了 11 位德州扑克职業选手中的 10 位统计上,赢的优势很大与每位对手玩了 3000 手。 万手最终AI赢得了176万美元 。 未来发展: Libratus在德州扑克人机大战中获得最终的胜利是人工智能领域的巨大成就。玩德州扑克需要推理能力和心理战术而这对于机器来说很难模仿。在围棋界纵横无敌的DeepMind AlphaGo本质上处理的還是完美信息博弈无法处理德州扑克的不完美信息问题,更遑论使出诈唬(Bluffing)Libratus在面临不完全或误导信息时,有进行推论的能力现实卋界中,不完美信息才是常态各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈 未来Libratus这样的AI,可鉯用于商业谈判、网络安全、医疗方案制定等领域人工智能发展的终极目标,是

我要回帖

 

随机推荐