十岁的男孩,一触网就开始研讨抽象的打算机措辞;到了中学期间,他在阅读比尔·盖茨《未来之路》的书本时,就畅想着科技将如何改变未来的生活;如今,看科幻影视作品成为他最大的爱好……佳都科技首席人工智能科学家兼通用大模型研究中央主任王凯从儿时就与打算机结下不解之缘,并一股脑扎根进去,在数据、算法、大模型等技能领域谋创新,用科技为传统家当赋能,加快形成新质生产力。
佳都科技首席人工智能科学家兼通用大模型研究中央主任王凯
【创新故事】
科技创新,要长于“借智”
“打算机遍及要从娃娃抓起”。上世纪80年代提出来的这句话影响了许多人的生平。如今,当年那一批年轻人中有的已发展为信息技能领域的技能骨干。
佳都科技首席人工智能科学家兼通用大模型研究中央主任王凯对此深有感触,85后的他从小学三四年级开始打仗电脑,学习编程。在那个四四方方的屏幕里,箭头闪烁移动,一个未知的天下就呈现在面前。从那时起,王凯便开始了探索打算机天下的奇妙旅程,用科技创新改变未来的种子不知不觉在心里抽芽发展。
由于热爱,他一股脑扎根于打算机行业的前沿领域,成为清华—加州理工联合培养博士,以第一作者在A类国际期刊及学术会议上揭橥论文十余篇,毕业前受邀赴十多个国家和地区进行学术报告和科研互换,奋斗在科技创新的最前沿。
王凯
提及如何持续提升科技创新能力的问题,王凯说:“如果你要做有技能含量的事情,就要想着攻破核心技能。首先,你的内心要保持面向天下科技前沿领域谋创新的追求。不管身处哪个环境,我们始终以高标准哀求自己,并不断传染周围的人与你同行。其次,科技创新,要长于‘借智’”。
“我们要思考如何快速实现技能创新,并实现落地运用。”他建议,要密切关注行业前沿的最新动向,判断行业冒出来的新技能是否对自己的研究有帮助,取长补短,努力提升自己的研发能力。
以新质生产力 让城市交通更“聪明”
与此前在实验室专一做科研比较,王凯现在从事的事情更接“地气”。目前,他作为佳都科技首席AI科学家,卖力交通畅业大模型研发事情。
作为人工智能行业龙头企业,佳都科技通过技能攻坚和自主创新,以新质生产力推动轨道交通畅业转型升级,驱动家当链的代价跃升,让城市交通更“聪明”。去年6月发布的佳都知行交通大模型,已通过国家网信办大模型备案,并在轨道交通智能客服、智能运维等场景落地运用。
谈及该大模型技能赋能交通领域的实际运用处景,王凯举例表示,从一个搭客进入地铁开始,基于视觉大模型TransCore-V的集中判图能快速完成安检,而基于措辞大模型TransGPT的智能客服系统,则能通过交互问询的办法帮助搭客进行线路、票价等信息查询和快速购票,同时基于多模态大模型TransCore-M则能对站内的拥堵、非常情形进行实时判断,为相应的站内管控和车辆调度供应赞助决策和应急处置。通过完成这一系列搭客从进站到出站的全流程举措,帮助交通领域实现智能化管理。
在学习编程的同时,王凯喜好从影视作品去探索未来天下的样子,并畅想科技将如何改变我们的生活。另日常平常最大的爱好便是看美剧,尤其偏爱科幻和智能题材。
他喜好的一部科幻类型的美剧是《疑犯追踪》,全剧向不雅观众展示了一个能将城市所有摄像头整合剖析的平台:它能够根据特定的需求,实时处理海量的视频信息得出相应的结果,帮助警察破案。
“这跟我现在做的事情很类似。我们正在把城市百万级别的摄像头的信息用大模型进行加工处理、剖析,并把非常问题及时反馈出来。”王凯见告。他期待未来的交通大模型能够像他看过的科幻影视作品一样,能够在幕后“变成”一个比人还聪明的“大脑”:它能对城市级交通数据进行实时处理剖析,让交通管理更加高效,让人们出行更方便。
广州“研”值:人工智能家当生态百花齐放
广州作为国家人工智能创新运用先导区被寄予厚望,已将人工智能融入家当发展,推动传统家当改造提升,加快形成新质生产力。
●这背后来源于广州前瞻布局下好“先手棋”,近年来先后印发了许多政策文件,提出以“链长制”造就壮大人工智能家当链的计策举措——开展“十百千”计策,培植10个人工智能家当园、100个人工智能范例运用处景示范、1000家旁边人工智能企业,确定“造车健城”上风赛道,每条赛道挑选一批重点造就企业,形成百花齐放、相互赋能的人工智能家当生态。
●广州家当门类完好、根本雄厚,形成了6个千亿级工业行业。家当链条长、创新要素集聚、运用处景丰富等上风,为人工智能企业在广州扎根发展供应沃土。
●发展的步伐还在加速。今年3月,《广州市支持海珠区培植人工智能大模型运用示范区履行方案》正式印发履行,这是海内首个聚焦行业大模型家当发展的政策文件,力争到2026年,推动人工智能大模型在8个以上行业深度运用,带动示范区主营业务收入超5000亿元,成为全国领先的运用示范高地、政策高地和人才高地。
“科”到了:什么是多模态大模型?
“多模态”是指多种信息来源或表现形式,如笔墨、图像、语音、视频等。面向交通畅业,还加入了韶光空间序列的数据。而“多模态大模型”便是能够同时处理和理解这些不同模态信息的模型,实现信息的全面理解和高效整合。这就像是我们人类在互换时,不仅会听对方说什么,还会不雅观察对方的表情、动作和语气,以获取更全面的信息。
专题统筹、视频剪辑/陈雅诗
文/广州日报新花城:张露
图/广州日报新花城:李波
视频/广州日报新花城:李波、张露
广州日报·新花城编辑:席乐瑶