随着大模型能力的不断增强,产学研各界越来越多的开拓者开始利用大模型来赞助编程以提升开拓效率。
对付利用常见编程措辞(如:Python、C++、Java 等)的开拓者们,基于大模型的交互式编程能力已逐步开释出更多的增益,深受开拓者欢迎。

当前已经有相称数量的开拓者在利用飞桨接口进行深度学习领域的编程,以完成演习和支配大模型等开拓事情。
如果飞桨的开拓者们也可以利用大模型赞助编程,既能提升大家的开拓效率,也能在利用过程中加速大模型的开拓迭代,形成正反馈。
知识增强大模型——文心大模型的持续快速进化,得益于百度在芯片、框架、模型和运用上的布局,尤其是飞桨深度学习平台和文心的联合优化,包括演习吞吐、分布式扩展、多模型构造稠浊并行和硬件通信层的联合优化。
我们的前几场分享已经先容过这个过程。

利用大模型提升飞桨编程效率,形成正反馈

与此同时,随着大模型能力不断增强,业界也呈现出了一些利用大模型加速编程的系统或工具帮助开拓者。
因此,飞桨也希望我们的开拓者们能用上大模型来提升利用飞桨框架进行开拓的效率,并加速大模型的开拓迭代,即上图中顺时针这条线,本文我将紧张展开分享这个部分。

基于大年夜模型的交互式编程提升飞桨开拓者编程效率

01

利用飞桨框架编程的常用场景

在先容大模型加速飞桨编程详细的技能和实现之前,在此简要解释利用飞桨框架进行编程的常用场景,以帮助大家直不雅观理解可以利用大模型去办理哪些编程问题,以及办理后可以产生的效果。
这里列出了目前需求较大的5类场景及这些场景中的范例问题:

常用场景

02

利用大模型加速飞桨编程的事理和技能架构

虽然利用飞桨编程的详细场景很多,但我们希望只管即便用一套系统来办理各个场景的问题,下图展示了系统的紧张部分。

用户(开拓者)利用的流程为绿色线,飞桨知识集增强用户的提示词,增强后的提示词能够让大模型返回较好的效果;系统优化为橙色线,根据用户反馈不断增强大模型的能力。

系统设计中考虑了2个关键点:

1. 在用户和大模型间建立了飞桨知识集。
这样可以担保效果和时效性,不依赖于大模型的更新周期。

2. 系统后台定期将飞桨知识集中的高质量数据通过 SFT 的办法更新到大模型中,可以不断增强大模型的能力。

整体流程和架构

03

动手实践

▎安装文心快码及加载飞桨编程插件

首先须要安装文心快码及加载飞桨编程插件,安装方法如下,也可参考视频演示:(推举在 VS code 中进行安装和利用,VS code 须要1.69及以上版本)

视频加载中...

1. 安装文心快码:点击插件 tab,搜索 Baidu comate,点击 install 进行安装,安装并登录后可以直策应用文心快码进行通用编程加速,如 C++、Java 等。

2. 加载飞桨编程插件。
如果要利用飞桨接口编程,我们推举加载飞桨编程插件,飞桨编程插件进行了针对性的优化,比直策应用 Comate 效果更好。
写下 import paddle 等关键字,界面左下角将会自动推举加载飞桨编程插件,点击蓝色字的示例提问,或在输入框里按下 Tab 键,即可加载飞桨编程插件。
显示飞桨图标,则表示加载成功,之后就可以利用飞桨编程插件天生、补全和转换飞桨代码

▎利用飞桨编程插件进行代码天生

在安装完文心快码及加载飞桨编程插件后,就可以在输入框中描述想要的代码功能,以天生对应的飞桨代码。

例如输入 prompt“实现1个 coo 矩阵和普通矩阵的矩阵乘”,几秒后可以得到飞桨编程插件自动输出的代码,如果以为不错,点击“采纳”按钮就可以一键插入到当前编辑的文件中。

输入的 prompt 可以支持很长的描述,越详细则天生的代码更能符合需求,加快编程效率。

视频加载中...

▎利用飞桨编程插件进行代码补全

如果编辑的文件中有 import paddle 或 form paddle import 等字样,飞桨编程插件就会自动利用飞桨代码补全功能,该功能能够补全飞桨 API 的拼写、参数、默认值等,可以节省查询文档的韶光。

视频加载中...

当你只记得 randn 接口可以天生数据,但是不太记得 API 详细的路径、参数等,可以在打开的文件中输入 randn,飞桨编程插件就会自动推举此 API 的用法。

如果还想要设置 randn 中的更多参数,如指定结果的数据类型等,可以将光标调度到代码的得当位置,飞桨编程插件将自动推举可以设置的其它参数。

同样,可以利用此数据进行后续的数学打算,如只大概记得接口名称,如 abs、fft、matmul 等,飞桨编程插件会推举干系 API 的用法,而不须要去查询飞桨 API 的拼写、参数、默认值等。

▎利用飞桨编程插件进行代码转换

飞桨编程插件可以将 pytorch、tensorflow 等深度学习框架代码转换代码为飞桨代码,个中对付 pytorch 支持会更多,且有转换统计功能。

视频加载中...

转换 pytorch 代码:

1.编辑的文件中如果有 import torch 或 form torch import 等字样就会提示可以进行自动代码转换,点击“代码转换”后,会在左边栏中显示转换后的代码,不会修合法前文件中的代码。

2.左边栏会在转换出来的代码后面显示“转换统计”,显示有多少行 pytorch 的代码须要转换,以及转换成功多少。

3.如果想要采纳转换后的飞桨代码,可以点击“新建文件”,这样转换后的代码就自动放入这个文件中,然后可以指定目录和文件名以保存转换的飞桨代码文件。

4.可以选择转换前后的文件,利用文件比较的功能查看 diff,也更好能看出转换的效果,以及 pytorch 和飞桨接口的差异。

转换其它深度学习框架(如 tensorflow 等)的代码:

1.先将飞桨编程插件设置为代码转换模式,即在左下的输入框中输入 /,然后选择“代码转换”。

2.打开要转换的代码文件,点击左下输入框下面的蓝色箭头,即可开始转换。

3.转换后的代码采纳及转换前后的文件比较同转换 pytorch 代码第3/4点同等。

▎在星河社区中利用

在星河社区中利用文心快码和飞桨编程插件

在 Jupyter 模式下:

a. 利用回车键,可触发文心快码根据注释天生代码,利用 tab 键采纳代码。

b. 在编码过程中,利用回车键触发文心快码自动推举后续代码,利用 tab 键采纳代码

在 VS Code 开拓环境下(AIStudio 右上角蓝色浮窗,可一键切换 Jupyter、VS Code 开拓环境):

a. 点击“代码阐明”可一键天生函数注释。

b. 通过@调用更多官方插件,通过智能问答办理开拓问题。

也可在星河社区学习文心快码的利用:

https://aistudio.baidu.com/practical/introduce/549084312059973

04

总结

通过本文先容的基于大模型赞助编程的方法,可以高效地天生代码、补全代码和转换用其它深度学习框架编写的代码,直不雅观提升广大飞桨用户的编程效率。
后续我们将着重优化飞桨代码转换、模型注释与文档天生、以及飞桨代码改写等关键场景的效果,帮助开拓者进一步提升效率。

官方开放课程

7月至10月特设《飞桨框架3.0全面解析》直播课程,技能解析加代码实战,带大家节制核心框架、分布式打算、家当级大模型套件及低代码工具、前沿科学打算技能案例等多个方面的框架技能及大模型训推优化履历,实打实地帮助大家用飞桨框架3.0在实际开拓事情中提效创新!

飞桨动态早知道

为了让精良的飞桨开拓者们节制第一手技能动态、让企业落地更加高效,根据大家的呼声安排史上最强飞桨技能大餐!
涵盖飞桨框架3.0、低代码开拓工具 PaddleX、大措辞模型开拓套件 PaddleNLP、多模态大模型开拓套件 PaddleMIX、范例家就地景下硬件适配技能等多个方向,一起来看吧!

温馨提示:以上仅为当前预备中的部分课程,如有变动,敬请包涵。

拓展阅读

【飞桨官网】

https://www.paddlepaddle.org.cn/

【企业互助入口】

https://paddle.wjx.cn/vm/m3sxpfF.aspx#