Self Discover框架切切想不到AI Agent还能这样推理

在上篇文章《AI大模型实战篇：Basic Reflection，AI Agent的旁边互搏之术》中，风叔结合事理和详细源代码，详细先容了第一种侧重反思的AI Agent设计模式，即Basic Reflection。

Basic Reflection 的思路非常朴素，利用本钱较低，但是在实际运用中，Basic Reflection面对一些比较繁芜的问题时，须要Generator具备更强大的推理能力。

在这篇文章中，沿着“更强大的推理能力”这条优化路线，风叔将先容Self-discover设计模式。
这个设计模式非常故意思，相信看到末了，大家会创造令人惊奇的结果。

一、Self Discover的观点

Self-Discover 是由Google的研究职员提出的一种AI Agent框架，可实现自动创造和构建推理构造，以办理各种推理任务。
这种方法的核心是一个自发现过程，它许可大型措辞模型在没有明确标签的情形下，自主地从多个原子推理模块（如批驳性思维和逐步思考）中选择，并将其组合成一个推理构造。

Self Discover框架切切想不到AI Agent还能这样推理

Self-Discover框架包含两个紧张阶段，自发现特界说务的推理构造、运用推理构造办理问题。
如下图所示：

阶段一：自发现特界说务的推理构造

紧张包含三个紧张动作：选择（SELECT）、适应（ADAPT）和履行（IMPLEMENT）。

选择：在这个阶段，模型从一组原子推理模块（例如“批驳性思维”和“逐步思考”）中选择对付办理特界说务有用的模块。
模型通过一个元提示来勾引选择过程，这个元提示结合了任务示例和原子模块描述。
选择过程的目标是确定哪些推理模块对付办理任务是有助的。

适应：一旦选定了干系的推理模块，下一步是调度这些模块的描述使其更适宜当前任务。
这个过程将一样平常性的推理模块描述，转化为更详细的任务干系描述。
例如对付算术问题，“分解问题”的模块可能被调度为“按顺序打算每个算术操作”。
同样，这个过程利用元提示和模型来天生适应任务的推理模块描述。

履行：在适应了推理模块之后，Self-Discover框架将这些适应后的推理模块描述转化为一个构造化的可实行操持。
这个操持以键值对的形式呈现，类似于JSON，以便于模型理解和实行。
这个过程不仅包括元提示，还包括一个人类编写的推理构造示例，帮助模型更好地将自然措辞转化为构造化的推理操持。

阶段二：运用推理构造

完成阶段一之后，模型将拥有一个专门为当前任务定制的推理构造。
在办理问题的实例时，模型只需遵照这个构造，逐步添补JSON中的值，直到得出终极答案。

二、Self Discover的实现过程

下面，风叔通过实际的源码，详细先容Self Discover模式的实现方法，详细的源代码地址可以在文章结尾处获取。
在手机端阅读源码的体验不太好，建议大家在PC端打开。

第一步定义Select、Adapt和Implement

第一步要做的事情，是前面所讲的阶段一，定义好select、adapt和implement这三个过程。

首先，定义select。
给Select的prompt是，“对付给定的任务，找出最干系的reasoning module，即确定通过什么方法来办理任务”

然后，定义adapt。
给Adapt的prompt是，“在不须要给出完全办理方案的情形下，让大模型调度上一步得到的reasoning module，以更好地适应任务。
”

接下来，定义implement。
给Implement的prompt是，“在不须要给出完全办理方案的情形下，利用上一步得到的优化后的reasoning module，创建一个可实行的推理构造。
”

第二步实行推理构造

第二步要做的事情，便是前面所讲的阶段二，运用这个推理构造得到终极答案

第三步提出问题，开始推理

第三步便是将这个过程进行推理实现，如下面的代码所示，这一步非常关键，大家可以逐条仔细看：

这段代码非常大略。
首先，我们提出了39种reasoning modules，即推理的详细方法，大家也可以自己提炼出一些推理方法，通过prompt奉告给Agent。

然后，我们提出一个详细的推理任务：“Lisa 有 10 个苹果。
她给了朋友 3 个苹果，然后从商店买了 5 个苹果。
Lisa 现在有多少个苹果？”

然后大模型会自动选出最得当的推理方法。
实践中创造，大模型选择了方法9和10。

接下来，针对目标任务，大模型自动优化推理方法的描述。

然后，大模型自动给出了详细的推理构造。

至此，Self Discover的事理和流程就先容完了。

风叔在考试测验这个case之前，完备没想到大模型还能在给定的推理方法中，自主选择最得当特定的问题的推理方法，并完成推理构造和推理措辞的输出，这项能力确实是让风叔面前一亮。
通过这种推理办法，未来Agent就能办理更加多样化的问题，由于任何类型的问题，总能有其对应的推理和思考办法。

总结

全体Self-Discover的关键在于，它许可模型在没有人类干预的情形下，自主地天生适宜特界说务的推理构造。
这样不仅提高了模型的推理能力，而且提高了推理过程的可阐明性。
通过这种办法，模型能够更有效地处理繁芜和多样化的任务。

本篇文章提到的例子，虽然构造很清晰，但不敷之处在于没有利用Tools。
对付须要利用搜索工具、数学工具等外部工具的场景，我们也可以让大模型在adapt环节给出适宜办理目标任务的外部工具，然后在后续过程中实行。

不才一篇文章中，风叔将先容另一种优化Basic Reflection的办法，增加强化学习，Reflexion。

本文由大家都是产品经理作者【风叔】，微信"大众年夜众号：【风叔云】，原创/授权发布于大家都是产品经理，未经容许，禁止转载。

题图来自Unsplash，基于 CC0 协议。

每期AI知识网