在AI技能中,基于AI能力的营销、客服系统算是比较能落地的运用处景。从调研到项目落地,本人也是有幸完全参与了一个智能外呼的项目,当然期间也踩了不少坑。
本文将考试测验着用自己的理解,对系统重新梳理一遍,也算是对这段经历的复盘和总结。若是写得浅薄,还看见谅~
一、AI外呼系统的构成
智能外呼业务流程图(PS:客服系统也类似,只是由用户主动呼入)
智能外呼、智能客服功能繁多,系统设计繁芜,这里也只能是想到哪,写到哪。大略地将系统归类一下,全体系统环绕着通话的三条线展开(两个终端和一个通信过程)。
终端中用户真个核心是对用户的管理,也便是常用的CRM系统。而AI端,则是环绕着AI机器人的设计、优化去设计。
通信过程,由呼叫系统实现,包括通话的拨打、接听、挂机、转接等,也包括通话线路的管理、配置。
1. 呼叫系统
呼叫系统是一种针对电话的软交流办理方案,通过呼叫系统,电话机器人才能与用户通信设备进行通话。
机器人、呼叫中央、终端间大略的关系图
呼叫系统由来已久,经由这么多年的发展,其功能已经十分完善和稳定。
在AI驱动的公司里,也会采取FreeSwitch之类的开源系统进行自研。但是这个只有在有相应技能栈(C++),对呼叫系统有开拓履历积累时可以去考试测验。
由于,对付呼叫系统的租户来说,呼叫系统最关键的便是高效和稳定。要想进行商业化,就必须担保呼叫系统的高并发和稳定,这是统统的条件条件。
撤除FreeSwitch之外,也可以购买第三方成熟的呼叫系统,例如国外比较有名的Genesys等。
购买成熟的呼叫系统,一个是系统本身已经比较稳定、功能完好,该踩的坑古人已经帮忙全部踩过。还有便是减少研发本钱,尤其是对付AI型公司来说,无需为呼叫系统再摧残浪费蹂躏研发资源和韶光。
在呼叫系统中,会有一些专用名称,不是这个圈子的一样平常很难明得,例如坐席、线路、并发等。
坐席:
紧张是软电话,一样平常也叫SIP电话。每个客服职员的账号会绑定一个坐席,拥有坐席之后,即可通过电脑在线进行拨打、接听电话。
线路:
可以理解为外呼时用到的主叫号码,常日为一批号码的凑集,号码的类型很多,手机卡、中继线等等,有不同的接入办法。
线路资源会根据运营商时常变动,以是常日由专门的线路商去掩护和运营。线路会被很多业务共用,只能外呼,不能呼入。为便于区分,这条线路下的所有号码会有相同的归属地,拨打的是类似的业务。
例如:北京教诲线,便表示外显是北京,紧张拨打教诲营销干系的业务。
当然上述紧张针对的是外呼场景,呼入场景只须要向运营商购买稳定的线路即可。
并发:
指同韶光可以进行几路通话。并发受限的成分较多:呼叫系统性能、机器人配置数量、线路资源。
呼叫系统性能:这是个技能问题,当高并发时,做事端无法处理,随意马虎造成漏接、无相应等各种问题,并影响接听率。机器人配置数量:这个紧张是种收费模式,按机器人并发量进行收费。线路资源限定:大略理解为线路中实际可外呼的sim卡限定(实际上很多种类型),算是种物理限定,只能多找一些线路,没有其他办法。2. AI机器人严格地来说,AI机器人便是一整套回应的话术,内容包括核心的对话流程和知识库。根据业务的不同,采取不同的技能方案。
1)两类业务场景
在业务上粗略地可分为两种场景:呼出场景、呼入场景。
呼出场景:
紧张是电话营销、关照等业务。
大部分的呼出电话都是陌拜电话,例如教诲培训、股票投资、医疗保险,都是广撒网的办法大量外呼。这些电话本身便是对用户韶光的一种侵略,对用户来说没故意愿来合营进行问答,随时都可能被用户提前挂机。
总的来说,呼出场景的特点是:话术大略,单通代价低,用户不合营。针对此类场景,机器人采取的堆关键词的办法即可实现。
呼入场景:
紧张是业务查询、预订等业务。
常见的呼入场景,例如有10086。之前拨打10086,利用的是IVR模式,须要按键操作,现在已经可以语音直接查询话费信息。由于是用户主动呼入,带有明确的目的,对电话机器人的容忍度相对较高。而机器人核心代价是帮助用户完成任务,在无法识别等情形下,可与用户确认,方便明确意图。
总结一下,呼入场景的特点是:业务稳定,单通代价高,用户合营。此类场景,就须要用到Rasa之类的谈天机器人框架,利用意图识别、实体提取完成任务。PS:呼入场景,类似于智能音箱。
2)电话机器人和在线机器人比拟
实质上电话机器人与在线客服机器人相同。差异在于输入端一个是语音,一个是文本。
语音信息包含着更多无用的信息,文本要比语音更加精准和高效。当然语音中包含的语气、语速、感情等也有部分代价,例如可以用来判断男女。
电话机器人由于须要先ASR(语音识别),转成文本之后,再NLP(语义理解),而在线机器人是直接进行NLP处理。因此,在终极的理解效果上,电话机器人的准确性会差一些。
3)语音输入的难点与方案
语音输入的难题,便是上文中所罗列的,这里不再赘述。这些难题不是目前技能可以办理的,或者说办理本钱很高。这里就简要列举一些方案,详细须要在实际场景中多次考试测验,才能得出最优方案。
方言问题:
最直接的方案是采取方言的ASR识别引擎。针对方言的ASR识别,在科大讯飞、阿里云等根本做事商都有供应。
问题是:第一,方言种类多,而一样平常识别引擎只能识别部分利用范围广的方言,如四川话、粤语;第二,不知道该用哪套识别引擎,用户范围广,在接通前都是未知的;第三,比较贵,商用本钱高。
另一种是笨办法,但是也有效。通过人工巡检,将ASR识别结果中的拟声词、错别字、近似词都作为关键词积累起来,积累越多,越随意马虎被识别。
噪音识别问题:
噪音可分为人声噪音和环境噪音。
常见的人声噪音例如:周围有人在说话、电视剧的声音等。由于设备的限定,没办法利用麦克风阵列等硬件去判断远近场,因此没有什么特殊好的办理方案,毕竟电话的音频就只有8000Hz、单声道、16位。
环境噪音,在呼叫系统中就可以用滤波器、谱减法等办法降噪,还可以声音切片的长度。
例如:正常说话单个字的时长都大于200ms,过滤掉短匆匆的噪音。此外,在送往ASR之前,还可以利用AI进行一次噪音识别,过滤之后再送往ASR识别。而ASR识别引擎本身也具备过滤噪音的功能。详细的履行方案可根据实际效果、商业化角度去搭配组合。
语气词、口头禅:
例如:嗯——这可能只是在组织措辞时的停顿或者是谛听时礼貌性的反应,但会被识别成肯定的意思。
此类情形比较常见,在人工巡检过一批录音后,创造作为语气词的情景次数要大于作为肯定的情景次数。
因此,第一步是将单字的“嗯”、“哦”等词从意图中剔除,保留“嗯好的…”等更明确表达该意图的词。
第二步则是在AI对话时候,只管即便不要让用户开放式回答,而是勾引用户回答,比如用“是不是”、“可以吗”等结尾,潜移默化地影响用户回答“是”、“不是”、“可以”等指令明确的词。
打断、表达不清:
这个问题比较难表述,连续举个栗子:
假设AI讯问儿童年事,用户回答:“噢……我小孩4岁”,中间停顿了一下。在正常逻辑中,为让AI快速相应,在用户回答停顿的时候,已经实行下一流程。因此,这时AI可能会忽略用户后半句有代价的对话。
该问题每每随意马虎使AI漏掉关键信息,同时也影响通话体验,给人生硬的觉得。针对该问题,目前是通过规则去掌握,通过人工对通话记录的总结,订定处理规则。如什么情形下许可打断、什么条件下更换为上节点意图,这些都须要在实际场景中不断总结优化。
4)话术设计
机器人的对话设计有很多配置办法。底层基本都是Taskflow的模式,是类似于流程图,将多个节点连接起来。这种办法能够逐渐让问题的范围收敛,处理繁芜的业务对话。
节点:
节点紧张是针对输入的内容进行意图判断,末了根据判断分流给下一个节点。
在智能设备中常常会提及一个词叫“技能”,通过技能,可以完成特定的指令。节点也类似于技能,不过在通话场景下,范围会比技能还要大一点。
针对语音进行判断,即“技能”,可通过关键词、实体提取等办法判断意图。针对按键进行判断,也便是IVR,这是电话独占的功能,用户可以准确地输入数字,不用担心ASR识别缺点,在核对用户身份证信息等场景下特殊有用。针对系统数据进行判断,此时不须要用户输入,是由系统根据已有信息直接给出判断结果,如上一条中的身份证信息判断。流程组:
在常见的发卖、客服话术中,常日可以分为开场白、业务先容、业务处理、结束语几个阶段。为了方便话术设计和后期优化,也会根据此类分发去设计节点流程,并用流程组作为阶段进行分隔。
5)AI效果优化
衡量一个AI机器人的好坏,要看它终极带来的收益和本钱。
在呼出场景中,须要让AI终极意向率到达或者略小于人工水平,毕竟每一通电话、每一个号码都是本钱的。
在呼入场景中,则须要关注问题办理率、客户满意度等。必要时候还是得利用人工坐席兜底,因此还须要关注人工参与情形。
优化话术效果,紧张通过录音巡检和剖析每个节点的识别率、挂机率,为节点补充关键词、说法集,也会考试测验不同的说话办法,详细的有韶光再细讲。
就目前而言,纯AI接听的完成率与人工接听比拟,还是有一定差距。因此真正适宜纯AI的运用处景还是比较少,适宜用在呼叫量大、内容单一的场景,如:电话关照、催收M0。
在其他场景下,还是以AI+人工合营更为得当。AI卖力前期大略的对答,过滤和分流部分用户,再由人工更灵巧地办理问题。等到网络足够多的说法集,归纳完善的话术之后,由 AI逐步接手,将人工后撤到下一节点,层层后撤,减少人工投入。
3. CRM系统
每一通电话记录都会经由CRM剖析用户意向、终极通话结果。CRM系统基于业务,紧张卖力对客户的管理和跟进,全体CRM系统紧张可分为3个方向:
对职员的管理:包括发卖、客服坐席的增编削查和业务报表。对客户的管理:涉及到客户信息、通话的意向度、完全跟进记录、状态的流转。对资源的管理:这里的资源可以包括线路的管理运营、话术设计和优化。CRM系统较为常见,这里就不再多说,根据实际需求,进行调度和功能扩充即可。二、紧张竞争对手图为当时做竞品剖析时,归纳的竞品公司
在智能外呼这个赛道,直接竞争的是两类企业:传统的软件供应商和以AI为核心的科技公司。
客服软件供应商在客服系统、呼叫中央等产品上深耕多年,有相称完善的产品矩阵和客户资源,对客户需求、履行办理方案都是履历丰富。
AI型科技企业,则是垂直切入外呼场景,依托自身的AI技能,对单一场景进行单点打破,巩固自身的技能壁垒。只是就目前来看,AI技能的瓶颈还未打破,对智能对话、通话体验的改变不大。
除了上述两类企业外,百度云、阿里云、腾讯云之类的云做事商,利用自身上风,将技能集成到开放平台中,形成完全的行业办理方案。为企业供应ASR、NLP、TTS、呼叫系统乃至是线路等根本技能做事,降落了技能门槛,企业不须要特殊的技能储备,即可搭建出自己的系统,可以说是一种降维打击。
PS:事实上AI驱动的企业,完善自身技能后,也在逐步开放AI能力,供应技能做事,为其他企业赋能。
而研究谈天机器人的企业,在NLP技能的研究和积累颇多,也随意马虎快速切入。
三、核心竞争力
虽然说是AI机器人,核心亮点是AI。但是,在实际运用中真正利用到AI技能的并不多。
ASR:除非自身有足够多的语料和研发能力(还要考虑研发本钱、更新掩护能力),否则ASR大多都是通过科大讯飞、阿里云等大平台进行识别。NLP:这个是一个技能核心,不过就目前的提升效果,通过添补关键词之类的笨办法也能达到相同效果。TTS:在实际语音播放中,除了变量等必须由TTS合成外,大部分话术都可通过提古人工录音的办法完成,且播放效果比TTS还要好。个人认为AI机器人的核心,不在于AI,而是基于业务场景的话术。客户不会关心技能如何前辈,而是看终极的接听效果。当一个话术调度成靠近人工坐席效果时,那么在这个业务场景可以说是形成了壁垒,拓展相似业务会更有上风。
本文由 @jessi 原创发布于大家都是产品经理。未经容许,禁止转载
题图来自Unsplash,基于CC0协议