7月5日下午,由中国信息通信研究院承办的WAIC 2024 “迈向AGI:大模型焕新与家当赋能”论坛在上海徐汇西岸拉开帷幕。小红书技能副总裁王晓博在论坛上揭橥主题演讲,分享了小红书在大模型领域的最新布局与探索。
目前小红书社区拥有超过三亿的月活用户,越来越多新一代年轻人由于共同的兴趣爱好在这里相聚,小红书上海量的UGC构成了一部丰富的生活指南。
在演讲中,王晓博从“搜”、“推”、“创”、“美”、“伴”等多个技能运用处景阐述了大模型将如何助力小红书这本“生活指南”更便捷、更鲜活、更美好。
王晓博指出:”我们希望通过多模大模型的能力增强,让AI能够越来越像人一样,能够理解小红书的内容,不仅仅可以看懂条记,看懂图片和笔墨,能够进行内容的整理和问答,也能够赞助用户进行更便捷的内容创作,同时通过对内容和用户的深度理解,更好地建立内容和用户之间的关联和匹配效率。“
搜索一贯是用户在小红书上高频利用的功能,70%的小红书生动用户有主动搜索行为。小红书目前正在探索将大模型引入搜索的技能链路,未来能够给用户带来更便捷的搜索体验。
据王晓博先容,在日常利用中,用户查询一些繁芜问题时,每每须要多步搜索才能得到想要的答案。而有了大模型的加持之后,小红书将利用Search Agent来仿照用户的多次搜索过程,通过大模型代理用户的查询过程,直接交付答案给用户,大大提升了搜索效率。
在推举上,大模型则可以帮助小红书更好地理解内容和用户兴趣。王晓博表示,传统推举系统依赖行为数据对用户和内容进行建模,会导致新条记分发难,缺少推理能力导致信息茧房等问题。
在小红书的推举系统中,率先将大模型作为条记的语义编码器来利用,通过语义压缩提示词(prompt)结合比拟学习技能,让大模型能够把条记转化为推举系统可理解的向量表征,在新条记分发上取得了非常大的提升。同时,大措辞模型(LLM)的推理能力能够更好地建模用户兴趣,小红书通过让大模型从历史行为中推理用户潜在的新兴趣,有效的缓解了信息茧房问题,提升了用户留存。
AI智能创作同样是小红书与大模型擦出火花的主要探索领域。今年小红书内部孵化的创新项目InstantID,通过人脸ID注入办法,成功在技能上兼顾了风格的保持和人脸ID的同等性,它不仅风格多样,同时无需模型演习,实现秒级出图,为用户供应了“创造不一样的自己”的创作办法。
目前,该项目已向业界开源,为商业运用如电子商务、广告和娱乐家当创造了新的可能性。
此外,王晓博还认为,大模型不仅可以为用户供应信息和创意,也可以供应很多感情代价。为此,小红书在宠物天下、社区群聊、官号私信这几个紧张场景下,分别搭建了AI宠物、AI群聊、AI助手这一类谈天BOT产品,为用户供应泛娱乐功能。
以AI宠物为例,每位用户都可以领养一个虚拟宠物,通过对话的办法与它交互,在线上互动中得到乐趣与情绪陪伴。在群聊场景,AI 通过角色扮演的办法将自有性情生动的表达,AI助手也可以将生硬的官方活动信息诙谐有趣的通报给用户。
“针对陪伴类谈天运用里影象、人格感情等技能难点,小红书采纳了基于影象网络、天下体系和驱动飞轮等技能相结合的办理方案。通过风雅化影象建模,对历史对话进行语义剖析、主要性判断、节点因子建模,从而深入理解用户行为,构建个性化互动,实现越交互越聪明,越聪明越交互的良性循环。”王晓博说道。
在演讲中,王晓博也指出,运用处景的落地离不开根本能力的培植。
目前,小红书技能团队同时针对措辞模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技能攻关:在多模模型架构、多模态alignment和全体数据体系和视觉感知能力上,都做了一定的探索和优化;并基于多种类型的图文数据,通过端到端多模态演习和优化,演习了对业务场景跟友好的视觉理解大模型,兼顾了图像分辨率、OCR、长尾语义识别等能力。
目前小红书在引擎技能上逐步完备布局,在演习方面对于大模型的工程体系做了完备培植,包括预演习、SFT、RLHF都做了针对模型和硬件的改造加速,自研了推理框架,对量化压缩、投契采样等技能都做了进一步优化。”
个中,比较有亮点的前沿技能,一是在MoE框架下,做了5D并行的高效率演习,同时自研了RLHF框架,相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩,结合算子优化整体性能超过开源框架20%旁边。“王晓博先容道。
末了,王晓博表示:“人工智能技能在多模态、Agent、算力层都有望持续进步,小红书也将借助大模型的能力,进一步拉近社区链接的间隔,更好赋能小红书之城的用户们。”
小红书于2013年在上海创立,以“Inspire Lives”为义务,形成了内容社区、商业广告和电商交易三大业务板块。截至2023年底,小红书月活用户数量超过3亿,超50%用户为95后;同时,小红书社区拥有超过1亿分享者,他们在小红书上分享履历、记录生活。自成立以来,小红书一贯以技能为驱动力,目前持有和申请中的专利、牌号、版权超过4000项,自研的“珠玑”大模型也已通过算法备案。