无限6人桌高级技巧:读牌与诈唬(爬坑的误区)

作者:Lee Davy

20万年前,智人被进化出来,散落在东非的大地上。

尽管处于食物链的底端,智人却成功跨越了整个地球,杀光了能找到的一切,并发展出了动物界无法企及的认知能力。

今天,我们统治了地球。但是如果智人的对手是老虎、鲨鱼或金刚的话,你仍然不会赌智人赢。我们能统治是因为智慧。但是当一个更加智能的物种诞生时,会发生什么事呢?

如果智人的出现让世界发生了如此巨大的动荡,直接改变了我们的星球、其他的物种以及我们自己,那么这个新的上帝意味着什么呢?Sam Harris在他的Ted演讲中说到了这个新的上帝,它就是AI(人工智能)。演讲的标题是,我们是否能在建造AI的同时不失去对它的控制?

当谈到人工智能(AI)发展的迅猛节奏时,人们对于这个问题感到惊慌失措。因为Nick Bostrom提出了一个观点,当我们的电脑比我们更聪明时,会发生什么事?

毕竟,没人会说我们星球的下一位领导者必须是有血有肉的生物。

为什么我们无法阻止AI的发展

根据Tim Urban的文章《AI的变革:走向超级智能之路》,AI的发展分为三个阶段。目前我们正处于第一个阶段,称为弱人工智能(ANI)。

ANI技术在我们身边比比皆是,比如SIRI、 Amazon Echo和GPS设备。这些AI非常擅长处理一个特定的任务。

下一个阶段是超人工智能(AGI)。这个阶段的AI在处理多项任务时会比人类做得更好。

最后一个阶段是超人工智能(ASI)。AI的智能会达到一个我们无法理解的水平。

你要明白的很重要的一点是,我们是无法阻止这种技术进步的。只要有人或国家因为控制问题的固有风险而决定停止研究AI,就会有其他人或国家不顾一切利用这一点。

人类相信AI的发展有内在的好处。假设我们已经进入了超人工智能阶段,世界上将不再有疾病,死亡不再成为问题,在整个银河系散播人类的基因会变得更加容易。

比如美国卡内基梅隆大学的Tuomas Sandholm和 Noam Brown团队。他们创造出了Claudico, Libratus和Lengpudashi三个扑克弱人工智能,在单挑无限注德州扑克中跟人类竞技。

我怀疑Sandholm或 Brown想把他们的弱人工智能发展为强人工智能,进而占领世界。所以我们不如像他们一样,把重心放在扑克AI积极的一面吧,哪怕一次也好。

AlphaGo的玩法让我们感觉到自由

几年前,谷歌的AI团队深蓝创造出了一款弱人工智能,在古老的围棋游戏中击败了人类。 AlphaGo对战韩国的围棋传奇李世石,结果 AlphaGo 赢了。

AlphaGo的胜利最让人惊讶的地方在于,根据20万年前智人的出现,我们预测了AI的发展,AlphaGo的胜利比预测提前了十年(这再一次重申了我们所经历的发展是呈指数进行的)。

那事情就这样了吗?一项人类统治了3千多年的游戏就因为AI证明它比人类强就要因此消亡了吗?

并不是的。深蓝最近宣布要在中国举办围棋未来峰会,让AI专家和世界上几位最优秀的围棋选手齐聚一堂,讨论AI在游戏的学习领域的未来。

作为峰会内容的一部分, AlphaGo会跟世界排名第一的柯洁进行三局两胜的比赛。自从一年前李世石被打败后,职业围棋选手周睿羊的一句话对峰会做出了总结,非常有意思:AlphaG的玩法让我们感觉到了自由,没有什么走法是不可能的。现在每个人都在尝试从未玩过的走法。

Libratus会让我们自由吗?

许多的扑克作家,包括我在内,都在Libratus年初战胜Jason Les, Dong Kim, Daniel McAuley和 Jimmy Chou后,写了不少世界末日论调的文章。

就在上个月,另一个弱人工智能Lengpudashi在中国海南一场表演赛中全面击败了中国玩家的团队。

但是除了写写卡耐基梅隆大学的弱人工智能对扑克存在的威胁,我们还能从中得到什么启示呢?如果周睿羊认为从AlphaGo身上,他学到了任何走法都是可能的,Les对 Libratus是否会有同样的感觉呢?我联系了 Libratus的两位对手,Les和 Dong Kim(两人还在2015年跟弱人工智能Claudico对战过),想知道人类是否能从AI的对手那里学到什么。

Libratus的厉害之处在于,它的策略非常的复杂和多样。Les在用Skype跟我通话时说。

在相同类型的牌面,它会用不同的方式来玩非常特定的手牌组合。这能让他的范围内永远都有牌。这使得它不会因为牌面排除而受到负面影响,并且能比人类更好地利用牌面排除效应。

人类在跟AI对战时,感受到底是在跟牌神交手,还是跟Doug Polk或Ben Sulsky玩了12万手牌呢?

感觉非常好,这种感觉绝对是跟人类交手感受不到的。Les说,这种混合多样的策略和很大的下注量 - 这种风格跟我见过的任何人都是不一样的。它的打法并未考虑任何人类的偏见或观察。这是一种独特的玩牌风格。

Libratus在拉丁语中是平衡的意思

Libratus在拉丁语中的意思,我记得好像是平衡。Les说,我们看到的确实是这样。在每种情况下,他都会有诈唬。

大部分人都不是这样的。人类总会在有些时候觉得,‘我在这种时候绝对不会诈唬,’Libratus知道它必须诈唬,所以他在每种情况下都有诈唬。

另外,它是很难被诈唬的。人类可能会想,‘他总是有牌。’Libratus是没有这种偏见的。他知道自己必须有一定的比例来跟注,所以它就跟注了。

我问了Kim和Les认为人类能从Libratus身上学到什么,然后改变自己的游戏,从而使自己的打法更加贴近AI的对手。两人都表达了人类尝试从AI身上学习时会遭遇很大的困难,但他们还是得到了一些有用的建议。

五个办法教你玩得更像超级电脑

1、不把底池大小作为下注量的标准

AI真正把无限注发挥到了极致。Kim在推特上解释,大部分玩家不会太经常全下,除非底池真的很大,但是这是Libratus的招牌动作。

对这一点,Les做出了解释:在无限注德州扑克和底池限注德州扑克中,翻牌后的游戏你很少会看到区别。大多数人不要下注超过一个底池。他们这么做非常罕见。当玩无限注德州扑克时,人们的下注量似乎局限于一个很小的范围 - 四分之一的底池、半个底池、四份之三的底池。Libratus并没有这个问题。

当我找教练学习打牌时,我的教练总是问我为什么要下注某个量。作为一名娱乐型玩家,而且研究游戏的时间不多,我总是觉得这个问题很难回答。

对我来说,总是固定的一个下注量就是一个底池。这是我看遍了世界上最优秀的玩家的培训视频后得到的发现。

像Les所说的那样,人类的下注量有明显的规律,超过一个底池的下注非常少见。就好像底池是一个标准,阻止出现太多的变化。

人们应该更开放地使用更多变化的大于底池的下注量。Les说,底池并不是极限,而是一个参考值。我知道人们也会超额下注,但跟Libratus相比,人类这样做的次数太少了。

我询问了Les AI在做了很大的超额下注后会亮出什么类型的手牌。它亮出牌范围非常广泛。他说,你会看到一些完全搞不懂的牌。他会用第二大对子持续下注两倍的底池。

在真空的条件下,这样根本没什么道理,但是作为更广泛的策略的一部分,这意味着当他超额下注底池,而转牌出现第二张对子牌时,他有时是可能完成了三条的。

2、理解牌面排除的力量

Kim和Les认为Libratus表现特别好的另一个地方是,能把牌面排除效应作为整体策略的一部分。

牌面排除效应就是明白你手里持有的牌会减少对手拿到相同牌的概率。反过来,这会影响你范围的计算和下注策略。

它考虑了牌面排除然后再创建范围,使得它非常难对付。Les说,它非常明白手里的牌会影响对手的范围。人类能从中学到什么呢?

人类只要思考自己手里的牌会对对手有什么牌造成影响,就能得到提高了。Les说,他们在跟注和下注时都应该思考这一点。我是能阻隔诈唬,还是能阻隔他的弃牌呢?

3、平衡、平衡、平衡

AI和人类最重大的区别在于Libratus策略上的平衡。人类要像AI那样定义一个范围是相当相当困难的。

Libratus会根据每种类型的行动来分配手牌。Les说,这事人类做得没那么好。

它在玩同一手牌时,有时会下注,有时会过牌-跟注,有时会过牌-弃牌。这不会受到对手可能有什么牌的牌面排除的影响。它会平均所有的概率,达到更好的平衡。

人类平均来说在每个方向都会有不平衡存在。在某些情况下,他们的阻隔牌太多了,价值牌又不够。在其他情况下,他们的阻隔牌不够,价值牌又太多了。还有时候你会看到人们弃牌太多了或是下注不够。

我询问了Les如果人们的策略不平衡的话,该如何开始学习。你唯一能做的就是坐下来,在玩牌之余进行学习。你看到一种情况要思考,‘我这时能下注的所有牌有哪些?有多少是诈唬牌,多少是价值牌?’

人们计算过就会发现,‘天哪,我在这里的诈唬好少。’这是很耗时间的练习,但有时你需要一次又一次来做这个练习才能雕琢出策略,成为更好的扑克玩家。

4、不要害怕尝试新事物

Kim一开始就指出的是Libratus学习玩牌的方式。它直到挑战开始时才跟人类玩家对战。之前它自己跟自己玩了几十亿手牌。

当线上扑克的出现让扑克玩家一个月内玩的手牌数目比Doyle Brunson一生玩的还要多时,线上的天才们改变了游戏的面貌。那么你来想想AI的能力有多强,它本身就是打造为一名扑克玩家。

Libratus通过跟自己玩了几十亿手牌进行学习。人类做不到这一点。Les说,但是你不应该害怕尝试新事物,可以客观分析事物是如何运作的。

你有可能尝试新事物,运气不好输牌然后放弃了。这是不应该的,你应该更加客观。

5、在转牌和河牌重新校准游戏

Kim指出人类可以学到的另外一个方面是,Libratus在转牌后做决策所花的时间。用Les的话来说,这好像是设计的结果。

Libratus在更短的时间内做出的决策显然会比人类更准确,但它在转牌会放慢速度,因为它就是这样设计的。Les解释说:当Libratus进入转牌时,它会重新校准策略,用的是一种叫做‘The End Game Solver’的程序。我对这种技术并不了解,但它会在转牌和河牌重新计算策略,使其更接近这个阶段的完美策略。

Libratus会停下来思考30到40秒,考虑从转牌后该怎么打。人类应该想清楚他们在做什么。我不希望扑克变成大家都要在转牌思考45秒;这样的日子我过不下去一个月。但是不要变成自动玩牌模式。想清楚自己在做什么。

也许转牌时手牌刚好进行到一半,很适合思考到底发生了什么,以及你接下来的计划。

人类和AI未来有机会进行合作吗?

这些就是人类从Libratus身上可以学到的东西。但是,对人类和AI来说,前面的问题在于计算能力。

如果Sandholm和Brown这些人想把弱人工智能变成超人工智能,他们必须等到计算能力达到一定程度才能实现。

根据我所做的研究,这要等到下个十年才有可能实现。人类有个类似的问题,叫做头盖骨。所以往前看,好像人类需要AI的协助才能实现智力的进化。

以Libratus和人类的对战为例,Les和Kim都指出人类可以从中学到很不错的东西。但是在没有技术加持的情况下,吸收这些知识会很难。

我认为,以后我们会看到更多使用更好的AI的培训工具。Les说,这个技术在不断进步,当我们能用合理的价钱买到这种电脑时,人类就能使用这个技术作为学习的工具了。

人们问我从Libratus身上学到了什么用于自己的游戏。这个我们已经说过了,但是它的策略太复杂了,需要花很长时间的思考才能融合到策略中。AI技术这时就可以派上用场了。

最后,我问了Les他是否相信人类有一天能击败AI。扑克和AI未来能合作的机会有多大?

我们是否还会看到让这个世界为之尖叫的单挑专家来对战Libratus?我们是否会看到AI和人类像在围棋圈那样共同携手?

人类也许永远都无法击败它。Les说,我喜欢人类和机器竞技的创意。如果围棋中可以,扑克为什么不可以?在象棋中,虽然AI压制了人类,但最好的象棋团队是AI和人类合作的团队。也许扑克中也可以实现这一点,两者合作,形成更全面的策略。

也许有一天,Libratus变得太智能了,而且觉得好无聊。跟人类比扑克让它非常不爽,他觉得实现目标的最好办法就是杀掉所有的人类。

抱歉,我忍不住发挥了一下暗黑的想象。你对扑克和AI的未来有什么看法呢?欢迎在评论区跟大家讨论。

网络讯息

哪个品牌的新风系统好(需要安装家用新风系统吗?

2022-12-25 22:43:16

网络讯息

七虞全文有拼音(七虞怎么读)

2022-12-25 22:43:56

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索