本次飞桨家当实践范例库开源保险智能问答金融行业范例场景运用,供应了从数据准备、模型演习及优化的全流程可复用方案,降落家当落地门槛。
⭐项目链接⭐
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications
所有源码及教程均已开源,欢迎大家利用,star 鼓励~
在保险领域,用户常见的问题占了60%~70%,这部分重复性事情费时费力,须要更有效率的处理办法。智能问答能够准确理解用户的意图,并直接给出精确的答案,极大节省了用户及事情职员的韶光。本次飞桨家当实践范例,基于 PaddleNLP 实现智能问答方案,在没有标注数据的情形下,也可以得到一个效果不错的智能问答模型。
保险智能问答展示
【场景难点】
专业性强:基于保险关键字的问答匹配的方法优化起来繁琐,不能很好的对句子级别的语义信息进行建模,无法超过句子级别的语义鸿沟。
无标注数据:在系统搭建初期或者数据体量比较小的场景,并没有很多标注好的问句对,并且标注的本钱很高。
【方案设计】
针对上述难点,经由对模型性能精度和速率的考虑,终极选用了 RocketQA[1]+SimCSE。
技能方案利用飞桨做事化支配框架 Paddle Serving 进行做事化支配。该方案从实际的痛点出发,然后涉及网络选择和调度、策略增强、超参数调节、预演习模型利用5个方面,对各个模块的模型进行优化,利用少量的领域数据集做微调,终极在小本钱代价下能够得到效果不错的模型。
项目方案解释
【模型优化策略和效果】
在 RocketQA 和 SimCSE 的根本上,连续采取同义词更换、WR 策略、R-DROP 策略进行模型调优,终极可以达到96.433%的 Recall@10。
【支配方案】
支配方面利用飞桨做事化支配框架 Paddle Serving 进行支配,终极达到向量检索7ms,模型推理 12.7ms 的实际效果,本次范例包含模型转换配置到支配要求的全流程讲解,欢迎小伙伴们关注直播。
【范例利用工具先容】
PaddleNLP 是百度飞桨自然措辞处理模型库,具备易用的文本领域 API、丰富的预演习模型、多场景的运用示例、以及依托飞桨框架底层算子优化的高性能推理能力,旨在提升开拓者在文本领域的开拓效率。PaddleNLP 供应了从 NLP 数据处理、模型准备、模型优化、到预测支配的全流程工具。个中的检索问答系统方案综合了领域预演习、无监督 SimCSE、高性能 ANN 引擎、预测支配等多重技能,能够完美办理无标注数据等家当落地难点,而且十分大略易用,极大地降落开拓门槛。