“我和女朋友分离了,心情不好。”
“分离一定很难过,那你现在有什么想说的或者想做的吗?”
以上对话就来自于寻求生理帮助的用户与一款名为emohaa的AI感情对话机器人,这段看似大略的对话包含了探索、共情、安抚、供应建议等生理咨询过程。
2020年下半年开始,受到“疫情导致大众生理压力上升”的逻辑催化,生理康健赛道的节奏有了明显的加快。同时,由于精神生理医疗资源以及生理咨询做事供给侧的高度紧缺,人工做事的办理思路并没有完备办理问题,因此行业便开始看向AI。2021年,数字疗法及AI生理赛道得到频繁融资,成为风口。
海内子工智能-自然措辞处理领域专家、清华大学打算机科学与技能系副教授黄民烈2021年创办人工智能生理康健企业“聆心智能”,通过建立前辈的AI数字疗法体系,为临床患者和广大生理亚康健人群供应高质量、低本钱、个性化、全天候的感情支持、生理咨询和干预方案,为用户供应更科学、高效的精神康健做事。
上面提到的emohaa AI感情对话机器人便是由聆心智能自主研发而成的。除emohaa之外,公司还开拓了生理咨询做事线上平台聆心悠然、AI数字疗法App聆忧,为不同需求层次的用户供应做事。
依托领先的自然语音技能,寻求AI生理行业破局
黄民烈教授表示:“最新的盛行病学调查显示,精神障碍人群大约占到全体人群的16~17%。精神康健是我们面对的核心议题,但我国仅有不敷五万的专业生理咨询师从事生理咨询行业的专兼职事情,精神科年夜夫更是少之又少。这中间巨大的供需差距可以通过人工智能技能和相应的产品来补充。”
然而,当前国内外生理领域AI对话机器人及数字化干预疗法的玩家紧张以CBT(Cognitive Behavioural Therapy 认知行为疗法)为范式,缘故原由在于CBT拥有高度构造化的特色,天然存在数字化的可能性。但是如果只有CBT数字化疗程,AI便是一个硬邦邦、冷冰冰的对话机器,当用户对CBT疗程话术感到不适应、或者不适宜CBT疗法时,AI生理机器人常日须要搭配其他办理方案或者感情话术为用户供应更好的利用体验。
演习出一个具备良好识别能力和感情支持能力的AI机器人,门槛更高。这哀求感情支持AI机器人拥有强语义识别、用户状态识别能力、更广泛的知识图谱和更丰富的对话策略。这些能力背后意味着巨量的、经由妥善标注的数据,以及对感情识别模型进行演习。
作为AI生理赛道中NLP(Natural Language Processing)基因领先的创业团队之一,聆心智能致力于打破当前AI生理行业仅以CBT数字化疗程为主的现状,促进机器人对用户感情状态的区分和识别,并且针对用户的每种状态给予丰富的回应策略,比如表达支持、赞许、感情映射、复述、自我暴露和及时反馈等策略,达到感情支持。
个中,自然措辞处理在聆心智能所供应方案的不同节点都起到了关键浸染。比如,通过自然措辞对话系统能够对用户不同层级的需求予以知足,包括但不限于感情、陪伴、给予建议等等。在赞助诊疗方面,通过自然措辞处理干系技能,将用户的输入信息处理为符合精神生理诊断体系的打算机符号表达,并且将该表达与医学专业诊断之间的关联和映射为理解用户输入供应底层架构上的支持。
末了,在数字疗法-数字药的开拓方面,自然措辞处理一方面作为理解用户需求的最基本工具,结合与其需求相契合的循证算法模型,为用户供应医学上最有用的数字疗法办理方案;另一方面,自然措辞处理技能本身在天生模型上就带有了情绪支持的能力,因此本身也会作为数字疗法的一个组成部分,目前,这是市场上所独占的技能。
AI逻辑如何“翻译”?数据标注如何进行?AI生理疗法开拓寻衅重重
犹如AI在其他运用领域存在的问题一样,聆心智能在全体数字疗法的设计开拓过程中,也碰着了各种各样的难题。
黄民烈教授表示,最难的地方在于把咨询师的认知和措辞,“翻译”成AI逻辑。他说道:“打个比方,CBT疗法咨询师在评估一位患者是否达到预期治疗效果时,其标准常日是患者的社会功能是否已规复至正常水平。在人工生理咨询中,这一过程是根据数据和案例,持续不断调度评估的量化指标权重以期待达到最精准的动态评估。那对AI来说,什么叫做个体层面的正常?在AI算法开拓过程中,我们就须要将这个目标量化。”
类似这种“翻译”,听起来不难,但在实践中非常不随意马虎,须要AI人才和生理咨询人才之间的反复碰撞,才能重新设计出来。
其余,由于生理咨询的咨访过程存在隐私性的伦理哀求,行业在建立和演习模型时可取得的数据量总是有限、且可能存在样本偏差,导致模型能力有所局限。面对这一问题,聆心智能从源头杜绝隐私透露的可能,团队所网络的数据已经取得了来访者的容许,并且已经脱敏。
“我们现在的数据来源不仅是生理咨询,还有很多其他非生理咨询的数据来源,尽可能地确保数据能够覆盖所有人群样本和大部分人们可能碰着的议题。因此,我们在做数据标注时,会对所有可能的维度进行一个更风雅的标注,以尽可能地避免样本偏差。但是必须承认,不可能完备避免偏差。须要注明的一点是,用于临床的机器人是有适应症或人群限定的,我们不期待用一个数据源去面对所熟年龄段的所有来访者种类。”黄民烈教授表示。
在自然措辞领域,算法可阐明性、算法鲁棒性等方面的局限一贯是可信AI 的谈论和研究热点,同样是AI生理领域须要持续办理的主要问题。聆心智能的AI生理疗法开拓中,可阐明性紧张表示在AI的决策始终与其所担当的角色行为逻辑保持同等。黄民烈教授表示:“我们通过知识图谱将生理年夜夫专业知识中的关键观点对齐起来,从而知道人工智能算法的决策是如何天生的。在这方面,我们还在持续探索、进步。关于鲁棒性问题,我们也有相应的算法研究和技能办理方案。”
更大的寻衅在于数据量以及人工数据标注本钱,这是生理领域AI发展的关键。生理咨询理论已经发展了100多年,形成了相对成熟而完全的理论,自发成长出一套标签体系。但是,把这些种别和标签全封不动地搬到AI模型内会面临巨大困难:首先,数据标注专业人士完成,导致标注本钱昂贵;其次,种别体系越细致、越繁芜,AI模型可能学不会,比如可能受到数据标注同等性的影响。
为此,以深入的生理康健专业理解为根本的,聆心智能设计出了一个包含10类感情的标签体系。除了感情种别,在对来访者意图识别等方面,聆心智能也按照类似的方法重构了一套标注体系。通过这种办法既平衡了资源、本钱,也担保了专业性和有效性。
超强“共情”上风,勾引用户解开“心结”
随着AI逻辑的“翻译”、数据隐私及样本偏差、算法的可阐明性、数据标注等一系列难点得到打破,聆心智能成功开拓出了一整套AI生理治疗做事体系,包含筛查、评估、干预、康复、长期跟随康健管理全过程。个中,干预康复阶段即所谓的数字药。
聆心智能以认知、感情和行为三个维度去构建了全体疗法模型,包括了CBT、DBT、IPT、正念等多种已被印证可以治愈感情障碍的循证疗法。并且所供应的干预方案会受到用户自身状态变革而动态调度,更好地根据用户自身特点供应治疗,提高用户的允从性和治疗的有效性。
聆心智能所供应的生理治疗一个显著的上风便是“共情”。在生理咨询的过程中,人和机器有一个比较大的差异,便是人能产生非常强烈的共情,而机器的共情程度没有人类那么浓郁、丰富。
那么聆心智能是如何让机器做到共情的呢?黄民烈教授阐明:“我们现在采取的方法,便是在与用户对话过程中,更多调动用户自身的思考能力——也便是他的认知,并通过一些技能性和策略性的办法,回避机器人不太随意马虎理解的、多样掺杂在一起的繁芜感情。”
聆心智能在编写算法过程中,会授予机器人一个稳定人设,针对不同情景,这个机器人的人设会有自己的反应。例如,用户对机器人说“我事情好累”,拥有人设的机器人会见告他,自己累的时候会做什么,这个事情为什么起效——这个便是机器人在利用自我暴露策略。
其次,机器人听到用户说很累时,可能会问用户压力大时常日会做什么,用户以为这个事情有效吗?如果这个事情暂时没有效果,用户要不要试一下其他办法?然后机器人就会引入一些干预和练习。通过这些策略,既达到了安抚用户感情的目的,同时能够促进用户自主思考什么事情对自己最有效果。
目前,得益于团队业界拔尖的工程能力,聆心智能的预演习模型参数达到了100亿规模旁边,位于行业前列。数据源包括公开社交媒体、互助授权的专业生理康健数据以及实验室在过去6-7年的自主积累数据。数据量在几十亿到几百亿单词量之间。行业领先的大规模预演习模型为聆心智能的产品开拓水平奠定了根本。
未来:政策利好下共创AI生理行业繁荣
目前,美国生理康健机器人Woebot已取得FDA认证,聆心智能团队认为外洋趋势会促进海内监管政策发展,趋势和节奏会越来越快。
同时,海内也正在大力实行社会心理做事体系,北京、海南都已设立数字疗法认证中央,聆心智能的发展方向正这个大体系下非常主要的环节,因此团队有信心能够借助政策力量,更好地普惠大众。
目前,聆心智能已经开始进行临床实验,后续将取得医疗机器认证。“当然,我们可能须要一点韶光,让监管完成对各方面风险评估,但由于数字疗法的副浸染当前来看会非常小,乃至可以认为险些没有,以是数字疗法跟其他治疗比如传统药物比较,得到监管认可的速率会更快。”黄民烈教授说道。
末了,在政策的利好与支持下,聆心智能团队希望与行业同仁共同努力,真正从实践中创造临床代价,而不是纯粹为了逐利,共同以真正惠及于民、有用有效的产品,推动行业标准、规范、监管体系的形成,真正促进一个AI生理行业的大发展。
— 完 —