专利择要显示,本申请供应一种算子编译方法及装置,该方法包括:第一设备获取第一实行文件,并向第二设备发送第一实行文件,该第一实行文件是编译第一算子得到的二进制文件;以及,第一设备获取模型文件,并向第二设备发送模型文件,该模型文件是编译AI模型得到的二进制文件,该模型文件中包括第一实行文件的实行逻辑。如此,第一设备将算子的可实行文件设置于AI模型的模型文件之外,可以有效降落AI模型的模型文件大小,便于对算子和AI模型进行更新管理,避免了大量重复编译,减少了资源摧残浪费蹂躏,且有助于提高AI模型的实行速率。
本文源自金融界