集微网(文/Jimmy),继Alpha GO击败人类围棋冠军,Open AI战队击败DOTA冠军战队OG后,人工智能又在一项新的娱乐项目上击败人类。
据the verge宣布,由Facebook人工智能实验室和卡内基梅隆大学的研究职员设计的一个程序,在一系列六人无极限德州扑克游戏中击败了一些天下顶级的扑克玩家。

在超过12天的韶光里,这个名为Pluribus的人工智能系统在两种不同的环境下与12名专业选手对决。
在个中一个场景中,人工智能与五名人类玩家一起玩。
在另一个场景中,五种版本的人工智能与一个人类玩家玩(在这个场景中,打算机程序无法协作)。
研究职员称,Pluribus均匀每手赢得5美元,每小时的奖金约为1000美元。

“Pluribus是一个很难对付的对手。
”曾六次得到天下扑克系列赛冠军的克里斯·弗格森(Chris Ferguson) 在一份新闻声明中说。

Pluribus背后的科学家表示,这一胜利是人工智能研究的一个主要里程碑。
只管机器学习已经在国际象棋和围棋等棋类游戏、星际争霸2和Dota等电脑游戏中达到了超人的水平,但从某种程度上来说,六人无限德州扑克代表着更高的难度基准。

Facebook和CMU的AI打败了人类扑克职业选手

早在2015年,一个机器学习系统就在双人德州扑克比赛中击败了人类职业选手,但将对手数量增加到5个时,其繁芜性也就大大增加。
为了创建一个能够应对这一寻衅的程序,布朗和他的同事、CMU教授图马斯•桑德霍尔姆(Tuomas Sandholm)支配了一些关键策略。

首先,他们教Pluribus玩扑克,让它和自己的复制品对弈,这一过程被称为“自我游戏”。
这是一种常用的人工智能演习技能,系统能够通过反复试验来学习游戏。
用成千上万的对手来对抗自己。
这个培训过程也非常高效,Pluribus只用了8天就创建完成,利用的是64查究事器,配置的RAM不敷512GB。
在云做事器上培训这个程序只须要150美元,与其他前辈系统的10万美元比较,这是一笔便宜的交易。

然后,为理解决六名玩家的额外繁芜性,Brown和Sandholm提出了一种有效的方法,让AI能够在游戏中向前看并决定下一步该做什么,这种机制被称为搜索功能。
Pluribus并没有试图预测对手将如何一贯玩到游戏结束(这个打算过程只需几步就会变得非常繁芜),而是被设计成只看前面两三步棋。
布朗说,这种截断的方法是“真正的打破”。

可以预见,未来在单一项目上人工智能降服人类将会变得越来越普遍,而这是花了大量韶光和数据去学习才成的,俗话说磨刀不误砍柴工,现有演习AI的办法也颇有应试教诲下那些学生的样子,而人类高度的环境自适应性及学习能力或许是AI目前所无法企及的。
(校正/Jurnan)