AI 要打败人类,就须要在这种双玩家扑克游戏中的每个阶段都预测出所有可能的走法,这一总数为 10160——这样算下来,这乃至超过了宇宙中原子数目的总和。
要想在普通的条记本电脑上完成所有的下法险些是不可能。
于是来自 DeepStack 的研究职员开拓了一种基于深度学习系统、类似于人类直觉的“打算机直觉”算法,将每一阶段须要打算的下法数量减少到 107。
因此,即便是在普通的条记本电脑芯片上,DeepStack AI 也可以在五秒钟之内就找出每场比赛中最佳的下法,轻松击败来自天下各地的扑克专业选手。

“为了让这种德州扑克 AI 变得更加实用,我们所做的也只是向前看了几步而已。
比较于打算出所有的可能算法,我们依赖的是‘直觉’来进行更加高效的决策。
”来自加拿大埃德蒙顿阿尔伯塔大学打算机扑克研究小组的卖力人 Michael Bowling 表示。

“AI 打败人类”,虽然这听起来像是个险些没有实用性的“噱头”,但是 DeepStack 这种“直觉”AI 的涌现是其在人类生活实用性上的一大进步,恰好补充了以往由于只能依赖超级打算机运行而无法进入大众生活的抵牾处境,让 AI 变得更加实用。
其余,它还能更好地应对信息不充分时的决策情形,包括在设计商业会谈、医疗诊断和军事机器人巡逻等运用中。

在此之前,为了减少芯片的运算负荷,一些人采取了将相似游戏和结果结合的方法。
这虽然能够在一定程度山减少打算量,但是代价便是当游戏的数量开始多起来时,AI 非常随意马虎被人类玩家利用。

即运用通俗电脑驱动这款德州扑克AI依然完虐人类

而 DeepStack 则采取了由艾伯塔大学研究职员开拓的 CFR +算法。
这种算法利用游戏理论来比较不同的可能结果,从而得出在特定情形下最优化的可能选择。
“Deepstack 供应了不完善的信息解算器和深层学习之间的精确的结合,”Bowling 表示。

目前,DeepStack 已经在来自 17 个国家的扑克国际联合会招募的 33 个扑克职业玩家中进行了 44852 场比赛,并且已经充分证明了它的扑克实力。
常日,研究职员须要让他们的打算机算法玩大量的扑克牌,以确保结果具有统计显著性,而不仅仅是由于有时性。
但 DeepStack 团队利用了一种称为 AIVAT 的低方差技能,可以过滤掉了大部分的“机会成分”,让他们只用 3000 场比赛就能够得到统计显著的结果。

DeepStack 的方法适用于游戏条记本电脑的硬件及其他性能相称的设备,这意味着未来我们将看到许多更有能力的 AI 机器人的兴起,在不久的将来,AI 不仅能够够玩扑克,而且还能应对更多的寻衅。