笔者今年仲春在武汉出差时有一次及早班高铁,用打车软件叫了一辆网约车之后,定位旗子暗记显示网约车定时到达并停在指定地点,笔者在定位地点附近绕了几圈看不到车的影子,打电话给司机一贯无人接听。后来意识到可能司机嫌韶光太早、间隔太近,但迫于平台派单压力,以是以“ghost”的办法“出车”了。发急之时,有位出租车司机看到我在等车,讯问后表示,他接的搭客也去高铁站,可以一起去。至于结局,一方面是笔者坐着一辆拥挤的车定时遇上了高铁,另一方面是出租车司机收了两笔用度。现在转头看仅仅只差半年,但现在的“萝卜快跑”险些可以完备办理当时的困境,如果笔者仅以消费者的心情看待萝卜快跑,那只能是:我可想去世你了!
一、自动驾驶技能简介
人工智能实质上来说,是机器模拟人的行为和思考的过程。自动驾驶技能的发展见证了从人到机器的思考逐渐进阶的全过程。比如:最低级的人机交互办法,是通过人直接输入代码,给予机器指令,让车辆遇见红灯时实现“停车/减速”的行为结果;但是,路况繁芜,并不是只有红灯才须要停车或减速,也有可能遇上其他障碍使得车辆必须停滞或者减速。以是人类的编程给机器传达指令,尽可能穷尽所有必须停车或减速的环境并通过代码“见告”机器,使得干系环境涌现时,车辆自动做出相应的反应,是最早的人工智能运作办法,但这种低效率完备无法知足自动驾驶的汽车能够像“老司机”一样安全上路。以是须要让机器通过无数次的仿照演习达到“老司机”的应变标准。而这里的仿照演习,便是从“人工智能”走向“机器学习”,再走向“深度学习”的打破性步骤,即:给予机器自我学习的“算法”,也便是一种学习规则,让机器根据人设定的学习规则长期、反复自我学习。仿照“新司机”到“老司机”的思考、演习和行为。(点击阅读:《人的智能vs人工智能,ChatGPT天生作品的著作权如何归属》)
二、Transformer模型:自动驾驶的底层技能
Chatgpt在2023年初大火的时候,Open AI的技能被推上风口浪尖,穷究Chatgpt技能事理往后会创造,实在它的底层技能来自于一篇“经典咏流传”的论文《Attention is all you need》,本文公开了人工智能领域具有划时期意义的“Transformer”模型,它作为底层技能已经广泛运用于各种涉人工智能的技能领域。而这篇文章的八位作者曾经组成谷歌大佬工程师团队,目前这几位作者都已经离开谷歌,个中一位目前就职于Open AI,以是从最初的Chatgpt到后来的Sora,Open AI的拳头产品,包括其他公司干系的AI产品,都散发着“Transformer”这一熟习的配方。
(一)Transformer专利在中国的驳回
今年年初,一件由谷歌于2018年申请的名为《基于把稳力的序列转换神经网络》的专利(以下简称“谷歌专利”)被国家知识产权局驳回。审查员给出的驳回情由是:该申请不属于专利法意义上的技能方案,不符合《专利法》第2条第2款的规定。详细给出的详细情由包括:对神经网络的改进,是神经网络本身的问题,而不是专利法意义上的技能问题,且对神经网络本身的打算过程,该手段不是专利法意义上的技能手段,不产生专利法意义上的技能效果。权利哀求1所哀求保护的技能方案并未办理详细技能领域的详细技能问题,其办理的仍旧是神经网络本身的问题,采取的手段是改变神经网络构造及设置,相应所得到的效果是:使得神经网络操作更随意马虎并行化,进而提高神经网络的转换效率和性能,不属于技能效果。[1]
本驳回引起海内子工智能从业职员的关注,一方面是,谷歌的中国专利有在先其他国家在先申请的同族专利作为优先权根本,且同族专利已经在不少国家被付与专利权,而在中国确却被驳回。另一方面是,该论文是大措辞模型中具有里程碑意义的技能方案,为何都无法达到专利的最低授权标准。
下文中笔者考试测验探索《专利法》立法意图并结合《审查指南》干系标准对谷歌专利是否应该被驳回进行剖析。
(二)谷歌专利不可付与专利权的情由
1、大措辞模型本身并非专利法意义上的技能方案
论文本身的主要代价是毋庸置疑的,但论文公开的是底层的技能方案和基本数学模型,它是一种具有“普适性”浸染的抽象的技能方案。而专利授权要求“符合自然规律”的详细技能方案,这里可以理解为论文给出的抽象算法实质上属于“自然规律”,还未触及详细运用目的的“技能领域”,远远没有达到授权的标准,只有将其落地,运用到详细技能领域,办理了该技能领域的详细技能问题才能认为符合专利法意义下的授权标准。
被誉为人工智能之基石的Transformer模型,同时也是所有人工智能产品运用处景中涌现频率最高的模型,笔者将其与谷歌论文中的流程图和谷歌专利解释书的附图进行比较如下:
不丢脸出专利申请文本便是论文的中文翻译。当然本申请以国外同族专利作为优先权根本,撰写过程有诸多限定,为了避免失落去优先权以及修正超范围,无法在中国专利申请文本上给予细化和调度,以至于本专利公开的技能方案,只管经由几次答审,但仍旧无限靠近论文原文。由此可见,一篇学术意义重大的论文仍旧与其能办理的详细技能问题之间有一道鸿沟。
2、涉大措辞模型的专利的权利哀求保护范围过大,将造成较高的法律壁垒
专利申请的根本目的是将技能壁垒加固一层法律壁垒,加强市场的垄断性上风。在此目的下,专利申请人一定试图扩大权利哀求保护范围,也便是尽可能考试测验得到“抽象化”“上位化”技能方案的保护范围,这样往后凡是其他运用者采取了包含“上位”技能方案、且附加了“下位”技能特色的产品,都无可避免的会触碰到“上位”技能方案的保护边界,从而导致侵权的结果。从谷歌将抽象的论文内容作为专利文本直接申请专利的行动也可以看出其野心,也便是试图将保护范围扩展到最大,使得所有的运用领域的技能都成为陵犯其专利权的工具。无限扩大权利人的保护范围,且最大程度的压缩了将改进的技能“落地”到详细运用领域的商业代价,与专利法律制度的立法目的也是相悖的。
(三)以大措辞模型运用中的技能方案战胜谷歌专利无法授权的毛病
纵然谷歌的市场垄断野心昭然若揭,但其论文的技能领先性也并不是只能免费贡献给市场,依然可以在专利撰写上进行权利哀求保护范围的调度,从而将底层技能的非专利保护客体纳入保护范围之内。
关于专利授权每个国家都有自主制订的审查标准,比如我国的《审查指南》对仅涉及大措辞模型和算法的专利不予授权也是有据可依的。《审查指南》第二部分第九章第6节记载例5如下:
申请的权利哀求:一种深度神经网络模型的演习方法,包括: 当演习数据的大小发生改变时,针对改变后的演习数据,分别打算所述改变后的演习数据在预设的候选演习方案中的演习耗时; 从预设的候选演习方案中选取演习耗时最小的演习方案作为所述改变后的演习数据的最佳演习方案,所述候选演习方案包括单处理器演习方案和基于数据并行的多处理器演习方案; 将所述改变后的演习数据在所述最佳演习方案中进行模型演习。
剖析及结论:该办理方案是一种深度神经网络模型的演习方法,该模型演习方法为办理演习速率慢的问题,针对不同大小的演习数据,选择适配具有不同处理效率的单处理器演习方案或多处理器演习方案,该模型演习方法与打算机系统的内部构造存在特定技能关联,提升了演习过程中硬件的实行效果,从而得到符合自然规律的打算机系统内部性能改进的技能效果。此,该发明专利申请的办理方案属于专利法第二条第二款规定的技能方案,属于专利保护的客体。
回顾谷歌专利,在解释书的“详细履行办法”的第[0015] -[0021]段在公开了本发明核心的技能特色,即:“编码器”“解码器”,以及“输入和输出办法”的同时,也详细列举了本技能特色可以利用的详细技能领域,包括:该系统可以是神经机器翻译系统[0016] 、该系统是语音识别系统[0017] 、该系统是自然措辞处理系统[0018] 、该系统是打算机赞助医疗诊断系统的一部分[0019] 、该系统是图像处理的一部分[0020] 。如果在权利哀求保护范围的布局时,将个中一种详细的运用处景作为详细的技能领域,着眼于在该场景下的运用办法作为核心技能方案,同时纳入底层算法模型结合运用办法确定发明点,即可通过详细技能领域的运用办法进一步限定并缩小权利哀求保护范围,以战胜底层技能过于抽象无法办理详细技能问题的毛病。
三、建立在Transformer模型上的自动驾驶技能细分技能领域
自动驾驶技能最早依赖于卷积神经网络的演习办法,自Transformer模型的论文揭橥以及运用逐步成熟往后,这一模型更好的将自动驾驶深度学习和实行过程中所须要的摄像头、激光雷达等这些不同设备采集的旗子暗记提取特色并领悟。
百度于2023年2月14日申请了一件名为“多视角图像的视角转换方法、装置、设备和介质”的发明专利(以下简称“百度专利”),目前已经公告授权。百度专利的权利哀求1记载了如下技能特色:一种多视角图像的视角转换方法,包括: 提取多视角图像的图像特色,得到各视角图像的特色图,并将所述特色图作为值,个中,所述多视角图像是由不同视角的相机获取;根据所述特色图,构建所述各视角图像在对应的相机视角的局部3D坐标系下的局部键; 根据全局坐标系到各视角的相机坐标系的转换关系,构建所述各视角图像在所述局部3D坐标系下的局部查询; 将所述值、局部键和局部查询,以及所述全局坐标系下的全局键和全局查询,输入Transformer网络的解码器,通过所述解码器得到所述多视角图像在所述全局坐标系下的图像特色。
在本专利的发明点中,笔者提取两个重点技能特色进行稽核:
1)Transformer网络的解码器
很显然要实现自动驾驶中“提取多视角图像的图像特色,得到各视角图像的特色图”这一技能效果,必须要用到论文中公开的Transformer模型。因此该模型不但构成百度专利的现有技能,也是权利哀求1的必要技能特色。
2)三要素:“值”“局部键”和“局部查询”
这三个要素同时也涌如今论文和谷歌专利申请中,比较如下:
要将Transformer模型运用到自动驾驶领域的“提取多视角图像”这一细分技能领域下,须要对三个要素进行定性,百度的申请正是将自动驾驶场景下提取多视角图像的值、局部键和局部查询对应到Transformer模型能识别、演习的Q、K、V,才能使权利哀求1的技能方案得以履行并实现预期的技能效果。
可见,上述论文以及谷歌专利已经构成了百度在后申请的现有技能,如果谷歌专利被付与专利权,未经谷歌容许的情形下,百度的自动驾驶产品也将陵犯谷歌的专利权。
四、建立在Transformer模型上的自动驾驶技能细分技能领域的技能改进
有了Transformer模型在自动驾驶领域的详细运用,演习和实行过程中对细节进行逐步改良和深入专利布局也具有其必要性。比如这次萝卜快跑在运行过程中涌现撞人的交通事件,虽然行人擅自闯红灯是造成车祸的紧张成分,但也给自动驾驶在面对更繁芜的突发情形该如何“决策”的模型改良提出了更高的哀求。
针对此技能需求,特斯拉采纳蒙特卡洛树搜索和神经网络组成的架构在传统的多头把稳力机制的技能下对实行方法和实行模型进行了改良,以特斯拉在 2022 年人工智能日上给出的例子为例(如下图所示),在此示例中,车辆必须:1.造孽让行人过路;2.让右侧驶来的车辆先行。因此,它构建了一个树构造,在个中天生并准确评估这些选择。[2]
此示例中,出于对Transformer模型中的多头把稳机制的实行方法和模型进行改良,一定会对上文中提及的Q、K、V以及输入和输出办法进行微调,当涌现图中的行人纵然在红灯的情形下坚持过马路的情形,如何出于人性化考虑进行车辆运动中的“决策”模块的技能改进,也是技能改良过程中可以办理的详细技能问题和实现技能的效果,因此可以成为下一层次专利布局的核心。
五、基于大措辞模型的人工智能专利多层次布局思路
对付大措辞模型在专利中的代价,本文从最抽象的论文,到详细运用领域的专利申请,到详细运用领域的细分领域的专利申请,再到细分领域的技能改进,逐一剖析和建议。具有自主研发能力的企业可以参照这一思路设计专利内部管理制度进行研发成果的巩固和转化,笔者将该制度的设计思路总结如下:
结语
“萝卜快跑”涌现至今总还有很多人以为,“无人驾驶”便是有真人司机在后台玩“仿照人生”的游戏,还有很多人都坚信没有人的车子是跑不起来的。但实在传统的人工智能技能加上现今Transformer模型的迭代,早就可以实现用“算法”驾驶,目前看到的后台的安全员们仅仅是在人工智能失落控或者涌现故障的时候及时接盘作为额外的保障。但是随着大措辞模型的优化和驾驶数据的累积,机器深度学习的结果会进一步降落对安全员的依赖而终将完备趋于驾驶过程的“无人化”。“萝卜”既然来了就别跑,好好地生根萌芽发展壮大吧!
[1]《AI大措辞模型基石专利被驳回!
改进神经网络算法本身,不受专利保护!
》,百科君IP杂谈,2024年6月13日
[2]《自动驾驶算法——Breakdown:特斯拉如何从模块化过渡到端到端深度学习?》,机器人方案与掌握研究所,2024年06月28日,
https://mp.weixin.qq.com/s/EKxGuowMUcwfX8oaKGEBgA
文:周文洁(星瀚武汉分所)
本文为星瀚原创,如需转载请先联系。