不再重复造轮子AI 给你推荐更好的代码还没bug

编辑 | 丛末

程序员的的代码大部分都不是犹如写书法那般一挥而就，而须要反复地抠bug，抠到疑惑人生。

剑桥大学法官商学院揭橥的一项研究显示，程序员将50.1％的事情韶光用于编程，而将一半的韶光用于debug。
估计每年的debug总用度为3120亿美元。

当代软件系统越来越繁芜，很多时候一个小小的缺点就可能让系统崩溃，带来巨大丢失。
以是不仅是程序员，企业也在为debug付出巨大代价。
但现在，AI带来了福音。

不再重复造轮子AI 给你推荐更好的代码还没bug

英特尔、麻省理工学院、佐治亚理工学院的研究职员互助开拓了自动化代码相似性检测系统MISIM，该系统可以判断两段代码的相似性，即便这两段代码利用的是不同的构造和算法，也可以依据它们是否实行相似的任务、是否有相似的代码特色加以判断。

代码相似性检测可以运用在代码推举、自动修复bug中。
在代码推举的运用过程有点像输入法的词推举，由于MISIM可以对不完全的代码片段进行评估，当它检测到不完全的、有bug的代码时，就会从其它地方选出功能一样的、没有bug的代码，来更换原来的代码。

并且，MISIM 还会将代码转换为统一的形式，确定代码功能，从而在不受编写办法的影响下进行代码片段的比拟。
由于MISIM不受编程措辞限定，它还可以用于代码措辞转换。

在45,780个程序的实验评估中，MISIM识别C和C ++程序中的代码，这些程序是由学生编写的，旨在办理104个编码问题。
如果一对程序都办理了相同的问题，则它们在数据集中被标记为相似。
MISIM的表现始终好于三个当前最前辈系统，最高达到40.6倍。

自动代码天生一贯是一个研究热点，家当界和学术界都在此方向上努力着。
OpenAI的GPT-3措辞模型乃至可以根据自然措辞描述天生网页布局的代码。
而代码相似性检测则可以复用已有代码，使质量高的代码得到更有效的利用。

输入“创建一个长得像西瓜的按钮”，GPT-3就天生了上图中绿皮红瓢的原型按钮。
或者输入“welcome to my newsletter的大号字体”，GPT-3就天生了上图中的赤色大号字体。

当然，代码相似性检测也可以用于代码查重。
以是，打算机系的同学们，把稳自己写作业！
虽然现在已有非AI的代码查重系统，但谁知道AI什么时候会后来居上呢？

MISIM架构

MISIM架构概览

MISIM由两个核心组件组成。
首先，MISIM具有新型的高下文感知语义构造（CASS），该构造通过捕获描述代码高下文的信息，利用机器学习算法来确定给定源代码的目的（例如，代码是一个函数调用、一个操作等）。
其次，MISIM还具有基于神经网络的代码相似性评估算法，该算法可通过各种神经网络架构来实现。

一旦构建了CASS，就将其向量化并用作神经网络的输入，神经网络会天生特色向量。
天生特色向量后，就可以进行代码相似度评估（例如，向量点积、余弦相似度等）。

对付MISIM的相似性评估算法，研究职员研究了三种神经网络方法：GNN、RNN和BoF神经网络。
个中，利用GNN的 MISM 总体表现最好，能够以超过75%的准确率识别出两个程序的相似程度。

将代码的构造与CASS集成在一起后，算法就会根据代码要实行的事情打算相似性分数。
纵然两段代码表面上不同，如果实行相同的功能，模型就会将它们评估为相似。

CASS可以配置特定的高下文，从而能够捕获描述代码的更高等别信息。
而且CASS可以在不该用编译器的情形下对代码进行评级（编译器将人类可读的源代码转换为打算机可实行的机器代码），乃至可以对不完全的代码片段进行评估。

MISIM-GNN的架构如下图所示。
对付这种方法，输入代码的CASS表征被转换为图。
然后，将图中的每个节点嵌入一个可演习的向量，作为该节点的初始状态。
接下来，利用GNN迭代更新每个节点的状态。
末了，运用全局读取函数从节点的终极状态提取全体图的向量表征。

MISIM-GNN 架构

不再重复造轮子

研究职员仍旧在扩展MISIM的特色集，目的是创建一个代码推举引擎，它能够识别算法背后的意图，并供应语义上相似但性能有所提高的候选代码。
系统可以指示程序员利用库函数，而不用再重复造轮子。

像MISIM这样的以AI为动力的代码建媾和审核对象有望大幅减少开拓本钱，同时使编码职员能够专注于更具创造性、减少重复性的任务。

英特尔实验室首席科学家兼机器编程研究总监Justin Gottschlich表示：“如果该系统能取获胜利，我们的终极目标之一便是实现全民编程。
”

或许有一天，代码相似性检测可以扩展到自然措辞中，到时候要实现全民编程，就不再是难事。

干系论文

论文地址：https://arxiv.org/pdf/2006.05265.pdf

代码相似检测系统的准确率比较，结果是运行3次的均匀值和相对付均匀值的最小/最大值。

code2vec、NCC、Aroma、MISIM在POJ-104测试集上的准确率结果。
条形高度表示运行3次丈量值的均匀值，偏差条由丈量值的最小值和最大值确定。

参考资料：https://venturebeat.com/2020/07/29/intel-researchers-create-ai-system-that-rates-similarity-of-two-pieces-of-code/https://www.theregister.com/2020/07/31/intel_wants_to_build_an/雷锋网雷锋网雷锋网

每期AI知识网

不再重复造轮子AI 给你推荐更好的代码还没bug

魅族做AI时代树莓派100万元奖金开拓大年夜模型应用可拿

侠客行清风瘦马一壶酒铁剑赤心满江湖