一个AI是免费创建中文谈天机器人(Bot)运用的在线平台,它利用自然措辞理解技能从句法和语义层面理解用户的输入,同时也考虑到对话所处的状态,终极达到识别用户当前输入意图的目的。利用一个AI供应的管理界面和调用接口,无需具备机器学习与自然措辞处理等干系知识,小微企业和个人开拓者,乃至产品和运营职员,都可以开拓出用户友好的自然措辞对话交互运用。
一个AI为开拓者供应了以下核心能力(虚框内功能即将发布):
一个AI的义务是:
让每个人都能轻松开拓一个AI运用。
相对付Viv的灵巧性,一个AI更强调可控性和可掩护性。虽然利用一个AI的所有功能还是有一定的门槛;但是基本利用,或者后期的基本掩护门槛还是很低的,相信一样平常的客服同学就可以胜任。
下面大略先容一个AI的由来和基本逻辑。
一个AI由来
故事要从去年提及……
去年下半年我接到老板一个需求,为佳缘创建一个客服机器人缘缘助手〔1〕,用于回答有关佳缘做事和利用干系的问题,在用户无聊时还可以陪用户唠唠嗑。
首先我们考试测验从表面找可用的谈天机器人做事直接对接。海内这方面做得最大的是小i机器人〔2〕,小i在对话这块做了良久,不过它紧张是做事大企业,比如银行,小米,京东早期的Jimi等。他们一单的要价大概在100w旁边。当时他们也在开始做针对开拓者的接口做事和平台,以是最开始我们就把缘缘助手的知识库掩护到小i上,利用他们的接口做事。但小i有以下几个紧张问题:
知识库掩护平台难用,接口不足稳定。小i的掩护平台体验非常差,各种卡,很随意马虎误操作导致刚写的东西就没了。接口也不稳定,当时小i做接口做事的机器只有一台,然后他们常常不通知就停机,导致做事没法用。
知识库掩护多了,效果反而低落。随着我们在小i平台上掩护的知识库越来越多(统共实在也不大,大概100+的问答组),会涌现各个问答组之间相互斗殴的问题。以是到后来我们就不敢再往上面加东西了。
技能支持不给力。那时候我们拉了个群,除了我们还有小i的商务和技能职员。小i商务同学还是挺积极的,可是技能职员就不给力了。反馈的问题很难得到办理,到后来他们干脆说你们这么多哀求,直接用我们的企业定制好了。。。说这条倒不是怪罪小i技能的意思,相信他们确实也有其他事情安排。但沟通下来的觉得便是小i是个传统公司,而非互联网公司。
基于这些缘故原由,加上缘缘助手的答复须要支持富文本,我们末了就决定自己做跟佳缘干系的那块谈天,也便是知识库这块我们自己做。但闲聊还是用表面的接口做事。其实在理解小i的同时,我们也在看海内的一些创业公司,比如图灵机器人〔3〕,当时他们紧张供应通用谈天功能。之以是最开始没用图灵是由于以为它是个初创公司做事可能不稳定。不过由于之条件到的小i的各种问题,我们末了把闲聊那块也完备切到图灵机器人了,感谢图灵机器人供应的稳定做事。
以是缘缘助手后来的逻辑是这样的,闲聊用图灵机器人的接口,其他的用我们自己开拓的做事。这个项目做完大概是去年年底,之后我一贯在思考一个问题。市场上为大公司进行定制服务的公司已经有小i这种大玩家,但是为小微企业供应做事的公司就很少。图灵机器人供应的紧张做事是闲聊,在企业定制这块做的事并不多。当时我就想为什么这块一贯没人做,后来我想明白了,紧张是由于本钱。小微企业每年最多也就乐意为这种做事付几千块,这种价格估计都cover不住开拓本钱的。
之后我对谈天机器人关注的越来越多,紧张也是想找一个框架,能够降落对小微企业的做事本钱。后来我看到了美国的Wit.ai和Api.ai,当时真是面前一亮。当然这两个紧张是供应英语做事的,对中文的支持很惨,而且wit.ai是Facebook的,已被墙,api.ai在海内利用延迟也是很大的,前几天api.ai也被Google收购了,估计被墙只是韶光问题。以是我就想着自己搞个中国版的api.ai吧,这就出身了现在的一个AI(www.yige.ai)。当然做一个AI还有个缘故原由是相信对话交互一定会利用的越来越多,由于这是人类追求沟通效率带来的一定结果。加上美国各大公司如Google、Facebook、Microsoft、Amazon、Slack已经入场。。。
很多人担心世纪佳缘做一个AI,是不是想让机器人跟用户假聊。真没有,世纪佳缘所有的信件都是用户触发才发的。只是有些页面的发信提醒解释不足明显, 用户在利用之前没看到。不过机器人确实可以用于赞助用户与异性谈天。两个陌生人谈天常常涌现的尴尬是不知道接下来聊啥。我们在考虑用一个AI为佳缘每个用户定制一个机器人谈天导师,它可以建议用户接下来该怎么跟对方聊,提升用户的沟通能力。虽然佳缘自己会用一个AI,但一个AI紧张还是对外的,面向小微企业和个人开拓者。
一个AI简介
一个AI中包含几个主要观点:词库、场景、动作、状态。
词库(http://docs.yige.ai/词库.html)是一个规范的自然措辞短语凑集,常日定义为运用所在领域的关键词、术语。词库在学术领域常日被称为实体(entity),是自然措辞处理中的主要观点。词库在一个AI中用于从用户输入中提取动作和状态所需的参数值。一个AI不仅内置了常用的系统类型,如数字、日期、韶光等,也为开拓者定义自己词库供应了灵巧便捷的支持。开拓者可以定义包含同义词的同义词词库,也可以定义不包含同义词的列举词库,乃至可以定义由其他词库组合而成的组合词库。
场景(http://docs.yige.ai/场景.html)常日对应着从用户提问到AI产生答复的一轮交互过程。一个场景紧张由用户提问、AI回答、动作和输入输出状态所组成。
动作(http://docs.yige.ai/动作和参数.html)是用户提问匹配到的场景实行后触发的一个特定操作,它可以利用从用户输入中提取出的词库作为输入参数。动作相称于代码中的函数,其详细实现在开拓者端,一个AI系统端只是一个标识,相称于函数声明。
状态(http://docs.yige.ai/状态.html)记录了对话交互的背景信息,紧张用于高下文信息(如参数值)的通报。此外,它也被用于管理会话流,串联起原来伶仃的不同场景。多个场景通过场景里的输入输出状态连接成图网络以完成更加繁芜的功能。
一个AI遵照的流程和Api.ai(https://api.ai)类似,在吸收到用户的输入后,流程如下:
一个AI首先识别用户输入中的词库和用户场景。词库和场景的识别并不是独立的,相同的词在不同的场景下可能属于不同的词库类型。在场景识别时也会考虑到场景设定的状态是否存在。如果某场景设定的输入状态不是都存在,则不会把用户输入识别为此场景。
查看动作中须要的必须参数是否都已得到取值。如果存在必须参数还没有得到取值,就触发设定好的提示语作为机器人回答,哀求用户输入对应的参数取值。参数的取值不仅可以来自于这次用户输入中的词库,也可以来自于输入状态中的变量。对付非必须参数,可以为他们设定默认值。
只有所有必须参数都已网络到取值,此场景才能完成,场景设定的AI回答才会作为回答返回给用户。到这里此场景就完成了,用户之后的输入就会触发新的循环。
一个AI定位于做事海内开拓者,以是也引入了一些中文干系的特性,例如查询接口支持未分词的整句话输入,以及分词后的语句输入。
更多信息可见一个AI官方文档(http://docs.yige.ai/),也欢迎大家去一个AI官网(www.yige.ai)走走,考试测验创建年轻人的第一个AI运用吧^_^。
除一个AI官方论坛(http://forum.yige.ai)外,我们也有微博官号“@一个AI”,微信"大众号“yigeAI”,开拓者微信互换群(给“@一个AI”或者“@breezedeus”私信,写明加入开拓者微信群)。
参考资料:
〔1〕缘缘助手:http://www.jiayuan.com/usercp/robot
〔2〕小i机器人:www.xiaoi.com
〔3〕图灵机器人:www.tuling123.com
本文作者:吴金龙,个人微博和博客分别为@breezedeus和http://breezedeus.github.io。2010年得到北京大学数学院打算数学专业博士学位,期间研究方向为推举系统中的协同过滤算法。毕业后加入阿里云,紧张从事PC和云手机的输入法开拓。2011年加入世纪佳缘,卖力世纪佳缘用户推举系统的开拓。目前为世纪佳缘资深总监,领导世纪佳缘技能部,卖力佳缘数据和AI干系的各项事情。