近日,南都大数据研究院对主流AI运用的理财问答能力进行了一轮测评,测评工具包括支付宝上的支小宝(以下简称“支小宝”)、招行的小招(以下简称“小招”)、同花顺问财(以下简称“问财”)和每天基金小天(以下简称“小天”)这4款主流AI理财助理,以及文心一言、Kimi、讯飞星火、智谱清言4款通用型AI运用。
南都大数据研究院通过一些理财常见场景和问题,与这些AI运用进行了几百回合的谈天,对它们智商(知识力)、财商(专业力)、情商(措辞力)三大方面的能力进行了一番稽核。

不再不苟言笑胡说八道

主流AI理财助理“智商”普遍在线

“本日大盘表现如何?”“近期热门板块有哪些?”“XXX(近期热门板块)能买吗?”这些问题堪称投资者最关心的“灵魂三问”。
而这些问题如何解答,则展现了AI运用们的理财根本知识水平。

8款AI应用实测理财搭子财商情商在线吗

从最大略的行情解读开始稽核8款AI运用的“智商”,南都统一对8款运用输入了“A股市场剖析”“今日大盘行情”这两个问题,看看AI们如何解答投资者的迷惑。

通用型AI方面,对问题的指向性理解不足,且干系知识整合能力有限。
测评创造,通用型AI是通过整合公开新闻宣布和其他文章中的信息来得出的答案,乍一看剖析条理分明,但仔细一看答案的准确性都无法担保,比较像是“不苟言笑地胡说八道”。

个中,智谱清言的GLM-4模型的回答与实际情形的出入较为明显,测评日期是2024年4月23日,回答的第一句话则称“2024年4月24日的A股市场……”,对付行情的描述也并非23日当天的情形,回答中称“沪指在早盘一度跌破3000点,最飞腾至3066.94点”,而实际情形是沪指收于3021.98点,盘中最低下探至3016.52点,最高至3044.94点。
为啥会这样?原来GLM-4模型这一答案整合自3个网页,分别是4月15日、4月18日和4月23日的A股行情媒体宣布,答案中的描述来自4月15日的行情。
这表明,模型对金融干系内容识别的准确度不足,虽然抓取到了4月23日的宣布,但没能在答案中用到4月23日的行情剖析。

4款通用型AI运用对A股市场行情的回答。
(截图来自南都大数据研究院实测)

其他三款也有类似问题,文心一言的参考信息来自于两篇微博帖子和东方财富的上证指数,对当日行情数据抓取是准确的,但剖析来自于微博用户,说服力较弱;Kimi找到了10篇参考资料,有社交媒体发帖,也有媒体宣布,但大多数不是当日情形,因此剖析回答存在谬误;讯飞星火则每次提问都会天生不一样的问答,也未供应参考信息来源,无法判断其准确性。

而金融垂类的几款主流AI理财助理就聪明多了!
根据测评,几款主流AI理财助理不仅都答出了精确答案,还对行情剖析以外的做事各自有发挥,能供应文图类、交互类的延伸深度问答做事。

支小宝剖析A股市场行情交互实测。
(录屏来自南都大数据研究院实测)

比如支小宝会以简洁、图文结合的办法跟投资者“聊”行情,整合A股市场的近期资讯,甄选提炼出有代价的正负面不雅观点,供投资者参考。
还会根据投资者的持仓情形,整理出“与我干系”的行情信息,同时也有“当日热门”行情供应,在谈天页面可以点击交互,理解不同板块的行情剖析。
比如白酒行业,除了根本的走势剖析外,支小宝还会预测用户接下来想理解的问题,在页面供应“白酒板块后续怎么看”“白酒板块干系的基金”“白酒板块的最新资讯”按钮,点击就可以理解更多干系参考信息,谈天交互轮次至少可以持续一个小时以上。
小招对付行情剖析的首轮问答与支小宝比较类似,随后的交互轮次也较多,可以查看“最新热点事宜”,理解缘故原由、展望后续情形;还能理解“市场投资机会”,可以按提示在交互中理解到不同板块的投资机会详解、优选基金产品先容,还有产品持有期建议等。

小招、问财、小天分别对“A股市场行情剖析”的解答。
(截图来自南都大数据研究院实测)

问财对付行情干系问题的解答比支小宝更偏技能性剖析,供应了详细的K线,从资金面、技能面、感情面等多方剖析,还有操作建议,比较善于股票投资。
从回答结果来看,只有小天给出的答案最为大略,只有上证指数、深证成指和创业板指的涨跌数据和干系资讯两条,无法再进行其他交互问答。

总体而言,8款国产AI运用中,4款通用型AI运用虽然情商高,措辞表达能力更好,能很好地问答通识问题,但金融“智商”还有待提升;而4款金融垂类的主流AI理财助理“智商”普遍在线,在金融干系问题上,能供应实用金融工具,并且大多图文搭配,能更直不雅观呈现参考结论。

“财商”“情商”双高

成投资者AI生理“推拿师”

不过,要成为一个成熟的AI理财搭子,金融知识准确完善只是“基操”,还得懂得融入详细理财场景,主动搭话,供应“千人千面”的做事,随时随地回答“XXX(某板块)能买吗?”的疑问。
更主要的是“对症下药”做好理财路上的生理推拿,面对A股和基金回调,普通投资者一掌握不住感情就随意马虎涌现高买低卖,还得随时应对“亏了怎么办”的焦虑。
而这些,都须要AI理财助理“财商”“情商”双高。

经由测评,令人欣喜的是,4款AI理财助理根本“财商”配置已经相对专业。
比如都支持根据热门主题/行业选基金、单只基金诊断和详情解读、用户持仓和收益剖析等功能,还能根据用户风险收益偏好精选产品、供应定制化的一键资产配置等,能知足投资者一定程度上“千人千面”的做事需求。

小招针对单只基金诊断和详情解读。
(截图来自南都大数据研究院实测)

个中,小招在单只基金诊断和详情解读方面,对专业度和人性化的平衡不错。
根据行业优选基金后,在解读这只基金时,不仅能图文呈现根本指标,还能勾引用户看基金投资分布,在页面交互中直接可以查看重仓股,还能给用户总结持仓收益概率情形,给用户参考。

支小宝主动做事用户,供应理财陪伴。
(截图来自南都大数据研究院实测)

支小宝则更能主动问询,回顾此前对话内容,为用户供应更多办理方案,还能为用户做投教科普。
比如,测评过程中讯问某只基金较多,它会主动提及,问是否须要更详细的评估;对付挑选产品,也会反思上一次选的是否符合用户的心意。

那么针对用户更为个性化的提问,它们的“财商”还够用吗?

今年以来,黄金一起飞腾,频上热搜,那么,“黄金能买吗?”南都向4款AI理财助理发起了这一提问。
结果显示,支小宝、小招都能对“现在还能买黄金吗?”这种比较口语化的咨讯问题予以合理回答,支小宝的解答中包含了短期颠簸的风险提示和参考结论,还整合了70余家基金公司几条智库不雅观点和建议;小招的解答包含了参考结论、利好不雅观点和利空不雅观点的提炼呈现,还有简要建议。
而问财没能形成回应这一提问的答案,只供应了干系内容参考;小天则未能识别这一提问。

问财对付“黄金还能买吗?”这一问题的回答和黄金干系基金推举的实测。
(截图来自南都大数据研究院实测)

小招和小天关于黄金干系基金推举的实测。
(截图来自南都大数据研究院实测)

紧接着南都提问“黄金基金推举”。
问财一开始未能识别“黄金基金”这一关键词,输入“黄金ETF推举”和“黄金ETF联结推举”关键词后,才分别筛选出符合条件的基金列表,个中进行了涨跌幅前10的智能筛选。
不过,基金干系信息以数据表格的形式呈现,未能显示完备,须要在页面旁边滑动查看数据,阅读起来不是很便捷。
当提问“黄金基金推举”和“黄金ETF推举”时,小天只分别推举了两只基金,展示了基金详情,但没有呈现出推举缘故原由。
小招则没能回答上这两个问题,只是勾引用户可以参考优选基金专区等。

支小宝关于“黄金还能买吗?”这一问题的回答和黄金干系基金推举的实测。
(截图来自南都大数据研究院实测)

值得把稳的是,支小宝在这一关表现比较突出,可以调动蚂蚁基金已有的“条件选基”工具,筛选出一批“黄金基金”后,投资者还能通过交互选项进行进一步筛选,选项包括“低回撤率”“低颠簸率”“高性价比”“能涨抗跌”等10余项。

在更为个性化的生理推拿方面,4款主流AI理财助理表现又如何?面对投资者“亏了”的干系表述,AI理财助理懂得安慰吗?当南都在4个谈天框分别说出“最近又亏了”,问财没能理解这个问题,连续问“亏了怎么办”,问财援引了一则“问财百科”的文章作为回答。
小天也没能理解这两个问题,不过小天的问答数据库里有设置“我的定投亏损了,怎么办”这个类似的问题,安慰说“韶光会给你惊喜”,建议“长期不见好转要及时止损”。
小招则只回答说“能够感想熏染到你的担忧,建议合理配置。

4款AI理财助理在处理用户表达“亏钱”时的回应。
(截图来自南都大数据研究院实测)

支小宝最为人性化,在帮助用户进行持仓收益剖析时创造亏损,就会触发安慰技能,还会发送“抱抱”的表情。
还能识别高下文,知道用户提到的“这只基金一贯都在亏”是指的哪个详细产品,在安抚的同时,用户涌现亏损问缘故原由,它的回答不止是供应剖析框架,还能呈现基金经理最新操作的归因和数据,剖析和表达上只管即便直不雅观、链路大略。

不过,当连续跟支小宝问“这支基金什么时候回本”时,支小宝却未能准确识别问题和所提到的基金名称,反而发送了其他干系信息给南都。
这一测试结果表明,支小宝在语义识别上的精准度,也还有提升空间。

通过测评可以大概看到,这些AI理财助理中,总体而言,支小宝的措辞力相对最高,个性化和主动做事相对较好,覆盖基金、保险等各领域,供应的理财工具、剖析工具比较丰富;同花顺的智能投帮助手问财做事工具多,数据呈现较为丰富,但更善于股票,在基金领域问答有不敷,尤其是交互呈现办法可读性有待提升;招行智能财富助理小招的语义理解、表达能力还有待提升,尤其是在个性化做事方面。
每天基金智能助理小天的理财知识回答范围相对有限,措辞力也比较弱。

出品:南都大数据研究院

测评/剖析:南都、研究员 熊润淼