Facebook的AI击败人类扑克冠军

Facebook人工智能研究和卡内基梅隆大学今天详细介绍了Pluribus的创建,这是一款扑克玩家AI,Facebook称其是第一个击败德州扑克专业人士的人工智能。扑克是一种游戏,有时用来衡量人工智能或游戏理论的表现。

该机器人击败了15名专业人士,他们都赢得了至少100万美元的扑克玩家,例如2000年世界扑克锦标赛冠军克里斯“耶稣”弗格森和4次世界扑克巡回赛冠军达伦埃利亚斯。

Facebook AI声称Pluribus是第一个在基准游戏中持续击败2个以上人类玩家的人工智能。《科学》杂志上发表的一篇论文详细介绍了AI的构建方式。研究人员说,在20个小时的训练中,它能超越人类的顶级表现。

Pluribus通过价值150美元的云计算进行培训,实现了其目标。

就像Pluribus之前的AI 训练玩的围棋,Dota II和星际争霸II等游戏一样, Pluribus通过对自己的比赛进行训练来实现其成果。研究人员表示,训练超过20小时可以产生比顶级人类玩家更好的AI玩家。

“Pluribus战略的核心是通过自我游戏来计算的,其中AI与其自身的副本进行比赛,而没有任何人类或先前AI游戏的数据用作输入。人工智能通过随机播放从头开始,并逐渐改进,因为它确定哪些动作,以及哪些动作的概率分布,导致更好的结果对其早期版本的策略,“科学论文写道。

此AI 是卡内基梅隆大学计算机科学系与 Facebook AI 研究部以及战略机器、战略机器人和优化市场等公司合作举办的。

在研究人员的测试中,Pluribus赢得了5场人类和1场AI比赛,以及5场AI和1场人类比赛。 Facebook AI表示,如果每个芯片价值1美元,那么Pluribus每只手的价格大约为5美元,每小时可以赢得大约1000美元的奖金。

“根据情况,它所考虑的确切投注数量在1到14之间变化。尽管Pluribus可以将自己限制为只投注100到10,000美元之间的几个不同大小中的一个,但实际上玩无限制扑克时,对手并不局限于那些少数选项,“科学论文写道。

Puribus 建立在 2017 年卡内基梅隆大学制作的 AI 扑克玩家 Libratus 之上,但它附带了一些附加功能,如一种搜索算法,用于评估未来几步的结果。

发表评论

电子邮件地址不会被公开。 必填项已用*标注