4月16日,2021百度认知AI创意赛“AI创意派”决赛正式举行,这是业内首次将前辈的AI大模型能力开放给公众利用,实现了大模型在引发创意、落地运用上的打破。百度集团副总裁吴甜出席并环绕大模型行业趋势、家当代价、落地成果,分享了百度文心大模型的进展。
百度集团副总裁吴甜
吴甜指出,预演习大模型已成为人工智能发展的新方向,百度文心大模型源于家当、做事于家当,是真正的家当级知识增强大模型。百度通过大模型与国产深度学习框架领悟发展,打造了自主创新的AI底座,真正发挥大模型驱动AI规模化运用的家当代价。
攀登技能新高地,百度深耕家当级大模型
近年来,国内外科技巨子如谷歌、微软、英伟达、百度等,相继在AI大模型领域展开探索。大模型的主要性在于——人工智能要真正发挥对家当升级转型的驱动力,须要与各行各业的特异性场景深度领悟,而大模型正是支持人工智能低门槛运用于不同场景的通用力量。
大模型的涌现,大幅降落了人工智能的运用门槛。其通过集中供应通用算法模型,打造技能底座,让大多数企业能够“站在巨人的肩膀上”, 使标注数据更少、开拓效率更高、运用本钱更低。
百度自2019年开始深耕预演习模型研发。2019年3月,百度率先发布中国首个正式开放的预演习模型ERNIE1.0,并持续投入于大模型的研发升级;2021年12月,ERNIE 3.0升级为环球首个知识增强千亿大模型鹏程-百度文心。
目前,百度已成功打造文心大模型家族,多个大模型达到天下领先水平,例如环球首个百亿参数中英文对话大模型PLATO-XL、首个聚焦中英文场景大规模 OCR 构造化预演习模型 VIMER – StrucText、环球最大规模中文跨模态天生模型ERNIE-ViLG等。此外,鹏程-百度文心大模型在60多项经典的NLP任务中取得天下领先效果。
超大规模模型的演习和推理,给深度学习框架带来很大磨练。支撑文心大模型高效分布式演习的关键技能力,是百度飞桨平台自主研发的端到端自适应分布式演习框架与4D稠浊并行技能。依托飞桨,文心大模型办理了大模型演习过程中多个天下性难题,使大模型演习速率提升、模型效果更优。
基于百度飞桨平台与百舸集群,文心大模型在算法、框架、算力层面实现完备自主创新,百度通过大模型与国产深度学习框架领悟发展,为中国度当智能化转型打造AI大底座。
大幅降落门槛,文心大模型助力家当规模化运用
随着大模型的代价凸显,由国内外科技巨子主导开拓的大模型正在大量呈现。吴甜认为,大模型未来的发展趋势,一方面会连续涌现技能创新,另一方面会在家当实用上有更多代价产生。
文心大模型作为家当级知识增强大模型,核心代价在于驱动AI的规模化运用。本次创意赛,百度在行业首次将前辈的AI大模型能力开放给公众利用,吸引全国各地近2000名不同年事、不同技能根本的选手参与个中,网络超过300份创意方案,作品覆盖教诲、医疗、金融、娱乐、科技、生理康健等多个领域。
创意运用中,文心大模型用AI为创意插上腾飞羽翼。其基于大规模知识和海量无构造数据领悟学习、深度学习,不断接管海量文本数据中词汇、构造、语义等方面的知识,并通过持续学习不断提升理解能力和天生能力,实现视频、歌词、艺术画等创意作品的自动天生。尤其是在AIGC(AI generated content,人工智能创造内容)领域,借助大模型的跨模态综合技能能力引发创意、提升内容多样性。
基于文心大模型天生的歌词和艺术画
为了进一步降落AI运用难度,文心大模型还为开拓者供应了工具平台,配套易上手的大模型开拓、轻量化、支配工具,让各行各业的开拓者都能低门槛地实现AI的运用。
据吴甜先容,“今年是文心大模型家当落地关键年”。目前,文心大模型已大规模运用于百度内部的各种产品,包含搜索、信息流、小度智能屏、百度舆图等,显著提升了产品智能化体验。基于文心的开放能力,对外的日调量也超过了五千万次。
文心大模型已通过飞桨开源开放平台、百度智能云等赋能到工业、能源、金融、通信、媒体、教诲等各行各业,个人、企业开拓者数量超6万。在保险领域运用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域运用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%;在医疗领域运用中,文心大模型将每份病历的检讨韶光,从30分钟缩短到了秒级别。
从AI核心技能到AI根本平台,坚持技能创新及开放生态,百度正不断降落AI技能开拓和运用的门槛,并通过云平台、AI框架、大模型的领悟发展,为各行各业的数字化、智能化转型打造厚实的根本举动步伐。