概述

随着企业规模的不断扩大,越来越多的文档材料等须要人工进行审核,尤其银行、金融机构、审计机构等文本相关岗位审核事情尤为繁重。
随着人工智能技能不断积累及成熟,越来越多的人工智能技能被落地赋能于各行业的智能化系统设计,智能赞助人类办公,个中OCR(光学字符识别)、NLP(自然措辞处理)等技能运用的尤为广泛。

接下来本文以之前所做的条约审核项目为例,讲述如何利用人工智能技能实现文档智能审阅,同时利用RPA技能实现文档审阅智能化、批量化,从而打造智能文档审阅系统。

一、条约审核中存在的问题

条约作为一类审核项繁多、审核困难且随意马虎带来较大风险的文档,对付一家企业来说须要花费极大的韶光、精力进行审核和校正,尤其是对付集团性企业来说,须要耗费大量的财务、法务职员的韶光精力。
条约审核紧张存下如下问题:

运用AIRPA设计智能合同审阅系统

1)条约数量弘大,人工审核事情量巨大。

2)审核细节多,审核速率较慢,事情内容较为重复且呆板。

3)失落误无法避免,会带来巨大风险点。

4)可能涉及到各种扫描件、证照等,难以至于获取信息。

二、构建智能条约审阅系统改变传统事情办法

智能条约审核系统是紧张基于NLP、OCR、机器学习等技能完成对各种条约文档的关键要素抽取,例如条约甲方、乙方、金额,币种、标的物、地点、韶光等构造化的信息,并基于一定的规则设置帮助条约审计职员完成自动审核事情的一体化办理方案。
下面我们来讲讲智能条约审阅系统的几大核心步骤或功能模块:

1. 条约附件OCR识别

随着条约审核的阶段或业务流程的不同,不同阶段可能有不同格式的文件,如WORD、PDF、JPG等。
对付电子版的Word、PDF等格式我们可以采取一些第三方的库或者转Htm等办法直接提取个中的文本及构造信息。

对付扫描件或者照片等格式的附件我们须要利用OCR技能将其转化成电子文本,在这里我们可以直策应用一些第三方的OCR能力(例如阿里云、百度、腾讯优图等),我们可以根据详细的样本或者文本须要选择不同的OCR做事。
当然并非所有的OCR需求均可以利用通用能力完成,部门分外样本或证照的识别可能须要根据详细需求及样本进行模型。

阿里读光

2. 条约信息智能抽取

将条约各种附件从纸质文件转化成可以进行处理的电子化文本之后,我们须要根据不同的审核需求进行识项的抽取。
比如对付条约整本我们可能须要抽取个中的甲方、乙方、标的物、金额、韶光、地点、主要条款等。

我们可以基于规则+模型结合的办法实现问文本信息智能抽取。
对付条约模板十分固定或者高下文明确的条约模板,我们可以直接通过规则提取:对付并非十分固定的条约模板我们则须要利用NLP的一些算法演习抽取模型。

(1)模型提取

利用NLP技能中的分词、命名实体识别等技能直接抽取条约中涉及到甲方、乙方、地名、金额、标的物、实体信息。
但是对付一些比较分外的实体,比如详细的标的物、付款办法、违约条款等我们须要根据实际需求进行数据标注及模型演习。
开始中文档上传输出熟机质核规则制订模型训验化模型.

(2)规则提取

可以通过正则表达式或者通过系统前段实现一些文本锚点配置工具,便于利用者快速的进行提取。

(3)基于位置信息的模板抽

对付条约审核中所涉及到的格式规范的文件,例如表格或者业务执照、资质附件等构造化的文件,我们可以直接采取在附件中的相对位置或者基于某一参照点的相对位置来获取详细信息。

3. 条约智能审核

我们可以在通过系统中通过模型或者配置各种审核规则去进行智能审核,审核包括以下维度:

(1)要素审核

紧张对条约中的甲方、乙方、风险条款、违约条款等要素是否存在进行审核。

(2)同等性审核

紧张审核条约中的关键信息是否精确,例如甲方、乙方等信息与业务执照、各种资质证书上的名称是否同等。

(3)风险审核

比如金额、利息、条约标的物、付款办法等是否知足企业的法务、财务等规定。

(4)文档智能纠错

自动纠正条约中的笔墨缺点及与语法缺点,目前我们常见的各种输入法以及文本办公软件都具有文本纠错功能或做事,但是其大多是针对通用场景,如果我们须要其针对某一分外领域的条约进行智能纠错,还须要根据特定的条约预见进行演习。

(5)版本智能比拟

在条约审核的过程中,每每涉及到版本的不断修正,那么如果避免某次修正内容未被创造而带来的风险呢,通过版本智能比拟功能,我们可以轻松创造条约前后变革。

三 、通过RPA实现文档审核自动化

RPA紧张指机器人流程自动化,通过仿照人工键盘、鼠标操作实现点击、输入、复制、粘贴等操作。
通过预设固定规则及流程,可以帮忙人工完成大量固定及重复性较高的事情。

在合同等文档进行审阅的过程中,可能存在巨大数量的条约进行审阅,及时利用A技能也须要耗费极大的人力本钱。

那么利用RPA技能我们可以很好与文档智能审阅系统或现有的条约、ERP系统很好的结合起来比如我们利用PA技能实现文档的批量下载、上传、识别以及对识别结果进行导出,也可以利用RPA技能定期去将所有审核非常的结果进行汇总,发送给干系职员进行校验。

前国外比较有名PRA做事上例如Uipath、Automation Anywhere等,海内则有云扩、来也、弘玑等。

未来展望

随着人工智能技能的不断成熟,以及日益增长的文档信息抽取、审核、流转的干系需求,我相信会有更多的AI技能会进行落地,尤其是随着PRA技能的广泛落地,RPA+AI将会具有更广阔的运用处景。

本文由 @淡写 原创发布于大家都是产品经理,未经容许,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。