如今的电商评论区,大量刷单行为淹没了主要的产品评价,有的被淹没在了追评区,有的乃至已经不分好评/中评/差评区了,而是“一眼望去好评如潮”。
▲某净水器评论区
比如某净水器的评论区,看似只有200条差评,但在1.3w条追评、10w条好评中实在隐蔽着数不清的差评,这些差评每每可信度极高。
对电商平台来说,通过剖析评论区中用户对商品的情绪方向,从评论中挖掘产品优缺陷,能够快速理解消费者的心声,以便对产品进行针对性的优化,提升产品体验,知足用户需求。
然而,由于热门商批驳论量极大,人工审核从精力、本钱还是效率上都无法知足需求,而且热门商品浩瀚,显然是无法通过人工的办法来挖掘数以亿计的评论。
但AI模型一秒看100条乃至1000条评论是不成问题的(只要有好显卡支配做事)。为了验证AI模型做这个事情的可行性,我准备亲自打造一个“差评挖掘AI”!
说!
干!
就!
干!
工欲善其事必先利其器
首先我将这个“找差评”的问题抽象成NLP中的“情绪极性分类”问题,进而我们的任务就变成了四步:
富集评论情绪极性分类数据集 —> 演习调优情绪分类模型 —> 支配模型得到API —> 调用API办理问题
富集评论情绪极性数据还好说,中文社区有不少公开数据集。但AI模型的演习和支配就麻烦多了。如果基于传统的深度学习框架从头折腾,无论代码量还是调试调优本钱都不低。
这对付只想快速实现情绪挖掘功能的我来说无疑效率太低了。
这时大佬给我推举了一个高效低本钱的平台——EasyDL,不到一天就能完成从数据集到支配API。
AI开拓可以如此大略?
半信半疑的我开始了试用之路…
打开EasyDL官网后,首先要选择做什么任务:
▲EasyDL任务支持
好家伙,我开始以为是个high-level深度学习框架,看到上图才意识到原来这是个更上层的AI运用开拓平台,涵盖了图像、文本、语音、OCR、视频、构造化数据等各种任务场景和数据场景。
这里我们关注的是里面的EasyDL-文本任务。针对本次的任务目标,我们可以选择文本分类-单标签,但我创造还有更加详细的“情绪方向剖析”任务,于是直接选择了后者(上图红框部分)。
完成任务选择后,平台给到了开拓任务的流程提示:
这个流程对付一个久经疆场的算法工程师来说已经非常熟习了,于是我跳过辅导,开始了开拓。
零代码也能完成AI开拓?
随着开拓的进行,我逐步创造不对劲了。
▲数据载入与处理完成
数据载入处理完了,我没写代码?
▲模型演习完成
模型演习&效果调优完了,我依然没写代码?
▲支配完成,拿到API
支配完成,做事的远端API我也拿到了,我终极一行代码都没写??
乃至,就连调用API的client端脚本,平台都给出来了,也不用自己写。
我进而将某商批驳论区爬下来的数万条评论存到文件comments.txt中,调用我们已经支配完成的API来挖掘负面评论:
负面评论被源源不断的挖掘出来了!
末了创造某净水器商品的差评区只管只有200条差评,但通过我们的脚本过全部的数万条评论,却挖掘出来了3300多条差评。
此时我陷入了深深的思考——
“做了这么多年的AI算法工程师,到头来,却创造AI的演习和支配已经不须要写代码了?”
初次跑通以上全流程,本着把3天开拓韶光降落到1天的心态试用,结果没想到3小时就办理了,个中还包括了1个多小时的模型演习与自动调优的韶光。
入群福利
参与「新闻资讯分类」「电商评论不雅观点剖析」实战营,15分钟轻松演习高精度的NLP模型,更有精美礼品与证书免费发放
获取理论+实操课程视频链接
好效果来源大揭秘:文心大模型
我还有一点不解,从终极的负面评论挖掘效果来看,是非常精准、惊艳的。但是我却只丢了1万条标注样本给平台,是什么撑起来了模型效果呢?
我在配置模型演习环节时,把稳到了EasyDL平台有这么一个选项:
如果演习阶段是选择了高精度,那就会调用文心大模型作为backbone并完成参数热启。
关注NLP预演习进展的小伙伴对文心大模型“ERNIE”一定不陌生了。
2019年12月,文心ERNIE 2.0登顶GLUE:
2021年7月,百亿参数规模的文心ERNIE 3.0霸榜SuperGLUE:
在中文任务上,文心ERNIE 3.0更是实现了全面屠榜:
而在EasyDL文本任务中内置了文心大模型ERNIE 3.0系列模型,除了通用大模型外,还包括了抽取、匹配等专属任务模型和金融、法律、医疗等领域模型。
正是文心大模型的赋能,EasyDL文本才得以在实现极大略单纯用性的同时,做到超高精度的模型产出。
绝不夸年夜的说,这个写了0行代码、花了3个小时支配得到的评论极性判别的API,可能比许多专业的算法工程师折腾数天搞出来的API都好用。
至此,作为一个AI算法工程师,我深深的感慨:
我们开拓了AI,但AI开拓可能不再须要我们了。
福利韶光到: