只管大模型最先发轫于国外,却在海内引发轰轰烈烈的运用。中国能否拔得“中国版ChatGPT”头筹?如何实现关键技能与家当运用紧密结合,实现“弯道超车”乃至“直道冲刺”?
琶洲实验室副主任、华南理工大学打算机科学与工程学院院长陈俊龙认为,我国的人工智能家当在运用端和做事端有极大的先发上风和广阔市场,接下来,可以从根本理论、运用落地两端发力。
在2023天下人工智能大会上,网易伏羲展示具身智能无人装载机。南方+ 王俊涛 摄
1
如何扬长?
发挥家当先发上风
在这一波大模型热中,国产大模型起步虽然稍晚,但反应仍旧敏捷。
从今年3月百度率先发布大措辞模型天生式AI产品“文心一言”后,各大科技互联网巨子纷纭入局,海内大模型瞬间各处着花。包括阿里、华为、商汤科技、科大讯飞、360、腾讯等,纷纭推出各种大模型。
各大企业的较劲,从以ChatGPT为代表的通用大模型转入到垂直领域运用,深入实体经济,赋能千行百业。
这与海内的家当转型高度契合。当前,我国度当正面临智能化转型,人工智能与海内各行业深度领悟,成为驱动家当转型升级的主要力量。浩瀚家当对高质量发展的需求,为大模型的落地运用供应了场景支撑。可以说,家当运用的实际场景已经成为了大模型的最佳“练兵场”。
例如,在电力能源场景中,传统的AI模型每每须要重复大量呆板的数据标注事情,而大模型可实现数据自动化标注,让员工有韶光做更有代价的事情。
商汤科技与南方电网人工智能公司互助研发了不少特定场景下的小模型,如智能巡检、三维建模等,供应大模型的演习根本举动步伐、算法、演习和微调做事,做事于电力的发输配变用调等各个方面。
百度CEO李彦宏就曾谈到,大模型技能将重构环球数字化家当。新的国际竞争计策关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI运用,这些个运用在多大程度上提升了生产效率。“如果我们能挤上牌桌,得到竞赛入场券,中国将拥有更壮大的数字化家当,数字经济规模将得到巨大增长”。
陈俊龙提到,我国的人工智能家当在运用端和做事端有极大的先发上风和广阔市场,但在人工智能根本理论方面的研究较欠缺。过去的研究中,每每展现市场带动研发的姿态,中国应该发挥政校勾引上风,建立项目目标指引,从单点打破转为体系统筹,从根本理论、运用落地两端发力,使AI行业呈现康健的发展姿态。
2
怎么补短?
挺进关键核心技能
在多位专家看来,把关键技能与家当运用紧密结合,也能反向促进根本研究和关键技能的发展。
科大讯飞董事长刘庆峰坦言,讯飞不仅要致敬和追赶OpenAI,更要的是在源头上做自主创新。通用人工智能将是一个新的进程,但绝不是一挥而就的,以是既要有短期攻关的年夜志,更要有长期主义的恒心。
中国大模型正呈现发达发展态势,实际上,大模型不是“平底起高楼”,在此之前,中国的人工智能技能就已经位列环球前列。中国大模型技能沿各技能路线迅速发展,在自然措辞处理、机器视觉和多模态等领域呈现出多个具有行业影响力的预演习大模型。
“大模型实在也不是从天上掉下来的,去年溘然火了,大家就去做大模型,我们在2020年就对措辞的天生投入了很多精力。”京东探索研究院院长、京东科技智能做事和产品部总裁何晓冬表示,京东在天生式人工智能领域有20多年的履历,在他看来,大模型并不是一挥而就的技能产品,只管各家集中发布了大模型,但这是由各个平台长期的技能积累所推动的。
在科技圈,有这样一个津津乐道的故事:7年前,商汤科技在深圳举行第一次高管会,个中一个主题是关于企业文化的磋商。此后,商汤确定了“让人工智能引领人类进步”的义务,商汤科技创始人、喷鼻香港中文大学教授汤晓鸥又在这句话之前加上了四个字——“坚持原创”。
在2023天下人工智能大会开幕式发言中,汤晓鸥分享了他的三个学生在大模型研究中作出的原创贡献:王晓刚带领开拓的DeepID系列首次让机器的人脸识别超过了人的眼睛,何恺明有关残差网络(ResNet)的论文办理了深度网络的梯度通报问题,林达华的打算机视觉开源算法体系OpenMMLab成为国际上最具影响力的视觉算法开源体系。
“中国的科技原创者也开始看到了曙光。”他说。
除了专一研发,跨国科研互助也成为专家们的关注焦点。陈俊龙就提到,中美两国在人工智能领域是环球的领头羊,然而单打独斗是不可取的。美国AI领域高水平论文均匀引用率为44.99%,中国AI领域高水平论文均匀引用率为31.88%,中美互助论文的均匀引用率达51.2%,其影响力明显高于中国和美国各自论文的均匀引用水平。这表明,跨国互助的科研成果在世界人工智能研发领域的展示和互换概率大大增加。
“放眼天下,只有中国才有可能成为美国之外‘聪慧呈现’的第二极。”刘庆峰说道。
对付大模型接下来的发展,何晓冬表示非常有信心。“如果从更高层次来看,大模型会走向多模态,走向具身智能,比如说机器人真的有通用智能,这本身便是很激动民气的事情”。
3
若何攻坚?
底层技能成角力场
看起来势头凶猛的国产大模型依旧面临着不容忽略的寻衅,这并不虞味着大模型门槛就低。对国产大模型而言,这注定是一场漫漫征途。
新的算法不再开源、算力底座不稳、高质量演习数据稀缺,被称为人工智能发展的“三驾马车”中,彷佛每个要素都布满荆棘。发展大模型每每意味着数亿到数十亿美元的资金持续投入。
行业数据依然是最大的痛点,特殊是在搜集文档形成提示样本方面,还须要下功夫。以商汤科技联合南方电网人工智能公司联合推动的大模型为例,卖力整理文档、数据和撰写提示这些“脏活累活”的劳务团队就超过40人,这与OpenAI这方面的劳务投入是相同等的,否则大模型会“学不到电力系统知识,或者学到不应该学的”。
构建大模型是本钱极高的系统工程,须要大量的高质量数据进行演习和优化,还必须经由洗濯和预处理,某种程度上,大模型掀起了科技公司领域的“云上战役”。目前,包括华为、腾讯、商汤科技等厂商,已纷纭前瞻性布局算力中央,打通算力、算法和平台,支持大模型演习的根本。
陈俊龙建议,看重底层硬件和框架自研。受限于AI高性能芯片的缺失落,我国大模型的高算力需求终将面临瓶颈。须要加强芯片的设计和制造能力,提高芯片的性能和能效,多支持、扶持华为昇腾、摩尔线程等芯片、打算卡干系的设计和生产主体。此外,人工智能框架是搭建模型的根本,包括TensorFlow、PyTorch等。我国也有相应的深度学习框架,如百度的PaddlePaddle、华为的MindSpore,但有名度和遍及率远不及前者。须要加强对框架的研究和开拓,提高框架的性能和易用性。
同时,他指出,政府应看重与资源、院校、用户的四方协同,合理制订发展计策。发挥打算资源上风方面,在广州人工智能公共算力中央、深圳鹏城云脑、横琴人工智能超算中央、韶关数据中央集群的算力保障下,政府应大力推广算力共享与做事,促进院校与企业摆脱设备限定、简化软硬件平台的采购掩护流程,将重心投入算法和做事的研发。
南方+ 郜小平
【作者】 郜小平;王俊涛
南方家当智库