在上篇文章《AI大模型实战篇:Basic Reflection,AI Agent的旁边互搏之术》中,风叔结合事理和详细源代码,详细先容了第一种侧重反思的AI Agent设计模式,即Basic Reflection。

Basic Reflection 的思路非常朴素,利用本钱较低,但是在实际运用中,Basic Reflection面对一些比较繁芜的问题时,须要Generator具备更强大的推理能力。

在这篇文章中,沿着“更强大的推理能力”这条优化路线,风叔将先容Self-discover设计模式。
这个设计模式非常故意思,相信看到末了,大家会创造令人惊奇的结果。

一、Self Discover的观点

Self-Discover 是由Google的研究职员提出的一种AI Agent框架,可实现自动创造和构建推理构造,以办理各种推理任务。
这种方法的核心是一个自发现过程,它许可大型措辞模型在没有明确标签的情形下,自主地从多个原子推理模块(如批驳性思维和逐步思考)中选择,并将其组合成一个推理构造。

Self Discover框架切切想不到AI Agent还能这样推理

Self-Discover框架包含两个紧张阶段,自发现特界说务的推理构造、运用推理构造办理问题。
如下图所示:

阶段一:自发现特界说务的推理构造

紧张包含三个紧张动作:选择(SELECT)、适应(ADAPT)和履行(IMPLEMENT)。

选择:在这个阶段,模型从一组原子推理模块(例如“批驳性思维”和“逐步思考”)中选择对付办理特界说务有用的模块。
模型通过一个元提示来勾引选择过程,这个元提示结合了任务示例和原子模块描述。
选择过程的目标是确定哪些推理模块对付办理任务是有助的。

适应:一旦选定了干系的推理模块,下一步是调度这些模块的描述使其更适宜当前任务。
这个过程将一样平常性的推理模块描述,转化为更详细的任务干系描述。
例如对付算术问题,“分解问题”的模块可能被调度为“按顺序打算每个算术操作”。
同样,这个过程利用元提示和模型来天生适应任务的推理模块描述。

履行:在适应了推理模块之后,Self-Discover框架将这些适应后的推理模块描述转化为一个构造化的可实行操持。
这个操持以键值对的形式呈现,类似于JSON,以便于模型理解和实行。
这个过程不仅包括元提示,还包括一个人类编写的推理构造示例,帮助模型更好地将自然措辞转化为构造化的推理操持。

阶段二:运用推理构造

完成阶段一之后,模型将拥有一个专门为当前任务定制的推理构造。
在办理问题的实例时,模型只需遵照这个构造,逐步添补JSON中的值,直到得出终极答案。

二、Self Discover的实现过程

下面,风叔通过实际的源码,详细先容Self Discover模式的实现方法,详细的源代码地址可以在文章结尾处获取。
在手机端阅读源码的体验不太好,建议大家在PC端打开。

第一步 定义Select、Adapt和Implement

第一步要做的事情,是前面所讲的阶段一,定义好select、adapt和implement这三个过程。

首先,定义select。
给Select的prompt是,“对付给定的任务,找出最干系的reasoning module,即确定通过什么方法来办理任务”

然后,定义adapt。
给Adapt的prompt是,“在不须要给出完全办理方案的情形下,让大模型调度上一步得到的reasoning module,以更好地适应任务。

接下来,定义implement。
给Implement的prompt是,“在不须要给出完全办理方案的情形下,利用上一步得到的优化后的reasoning module,创建一个可实行的推理构造。

第二步 实行推理构造

第二步要做的事情,便是前面所讲的阶段二,运用这个推理构造得到终极答案

第三步 提出问题,开始推理

第三步便是将这个过程进行推理实现,如下面的代码所示,这一步非常关键,大家可以逐条仔细看:

这段代码非常大略。
首先,我们提出了39种reasoning modules,即推理的详细方法,大家也可以自己提炼出一些推理方法,通过prompt奉告给Agent。

然后,我们提出一个详细的推理任务:“Lisa 有 10 个苹果。
她给了朋友 3 个苹果,然后从商店买了 5 个苹果。
Lisa 现在有多少个苹果?”

然后大模型会自动选出最得当的推理方法。
实践中创造,大模型选择了方法9和10。

接下来,针对目标任务,大模型自动优化推理方法的描述。

然后,大模型自动给出了详细的推理构造。

至此,Self Discover的事理和流程就先容完了。

风叔在考试测验这个case之前,完备没想到大模型还能在给定的推理方法中,自主选择最得当特定的问题的推理方法,并完成推理构造和推理措辞的输出,这项能力确实是让风叔面前一亮。
通过这种推理办法,未来Agent就能办理更加多样化的问题,由于任何类型的问题,总能有其对应的推理和思考办法。

总结

全体Self-Discover的关键在于,它许可模型在没有人类干预的情形下,自主地天生适宜特界说务的推理构造。
这样不仅提高了模型的推理能力,而且提高了推理过程的可阐明性。
通过这种办法,模型能够更有效地处理繁芜和多样化的任务。

本篇文章提到的例子,虽然构造很清晰,但不敷之处在于没有利用Tools。
对付须要利用搜索工具、数学工具等外部工具的场景,我们也可以让大模型在adapt环节给出适宜办理目标任务的外部工具,然后在后续过程中实行。

不才一篇文章中,风叔将先容另一种优化Basic Reflection的办法,增加强化学习,Reflexion。

本文由大家都是产品经理作者【风叔】,微信"大众年夜众号:【风叔云】,原创/授权 发布于大家都是产品经理,未经容许,禁止转载。

题图来自Unsplash,基于 CC0 协议。