对于处理AI领域美国专利申请的同行来说,美国审查框架下的专利适格性审查(即“§ 101条款”),无疑是最棘手的障碍之一。
在AI专利申请中,如果说有什么技术主题最容易触及§ 101条款的红线,“模型训练”方案无疑位列其中。原因在于,“模型训练”在形式上最接近纯粹的数学运算与算法逻辑,极易被审查员归入“抽象概念”的范畴。
然而,近期一项由美国专利商标局(以下称“USPTO”)上诉复审小组(以下称“ARP”)作出的判决——Ex parte Desjardins,恰恰就针对“模型训练”这一核心环节的专利适格性,给出了强有力的正面论证。这个判例之所以至关重要,不仅因为它推翻了专利审判和上诉委员会 (以下称“PTAB”)的决定,更因为它为看似抽象的算法如何体现技术性,提供了一份极具参考价值的官方指引。
案件概要:一份典型的AI专利申请及其波折的审查历程
我们先来看一下这个案子。
申请人:谷歌旗下的DeepMind公司。
技术方案:核心是解决AI领域一个公认的技术难题——“灾难性遗忘”。即,如何让一个机器学习模型在学习新任务时,不忘记已经学过的旧任务。
审查历程:
1)初审被驳回:Desjardins(以下简称“申请人”)提交了一件美国专利申请 “基于突触智能的持续学习”(以下简称“涉案申请”),被审查员基于§ 103(创造性)驳回。
2)上诉被驳回:申请人向专利审判和上诉委员会 (以下称“PTAB”)起诉审查员,指控其对涉案申请的审查存在不合理,PTAB审理后维持了§ 103的驳回,并且主动增加了基于§ 101(专利适格性)的新驳回理由,认为该发明本质上是数学计算,属于抽象概念。
3)要求重申被驳回:申请人不服,向PTAB提出复审,PTAB驳回了申请人的重审请求。
4)ARP介入:在看似已成定局时,由USPTO局长参与的ARP决定介入,并最终推翻了PTAB基于§ 101的驳回决定。
从审查历程可见,本案的核心是§ 101的适用问题。
一份已被PTAB确认不具专利适格性的申请,为何会被更高层级的ARP推翻?其关键在于双方对“抽象概念”的界定,以及在 Alice 两步法分析路径上的分歧。
争议的焦点:权利要求1
为了理解争议的核心,我们有必要看一下被判决的权利要求1的主要内容:
1.一种由计算设备实现的方法,用于训练机器学习模型,其中该机器学习模型具有至少多个参数,并且已经使用第一训练数据在第一个机器学习任务上进行了训练,以确定该多个参数的第一组值,该方法包括:
[A] 确定每个参数对于第一个机器学习任务的重要性的相应度量,包括:
[A1] 基于通过在第一个机器学习任务上训练模型所确定的第一组参数值,计算参数可能值的后验分布的近似值;
[A2] 使用该近似值,为每个参数分配一个值,该值是该参数对于第一个机器学习任务的重要性的相应度量,并近似一个概率,即在给定用于训练模型的第一个训练数据的情况下,该参数在第一个机器学习任务训练后的第一值是该参数的正确值;
[B] 获取用于在第二个、不同的机器学习任务上训练该模型的第二训练数据;以及
[C] 通过使用第二训练数据训练机器学习模型来调整多个参数的第一组值,以优化机器学习模型在第二个机器学习任务上的性能,同时保护其在第一个机器学习任务上的性能;
[D] 其中,调整多个参数的第一组值包括 : [D1] 调整参数的第一组值以优化一个目标函数,该目标函数部分依赖于一个惩罚项,该惩罚项基于已确定的参数对于第一个机器学习任务的重要性的度量。
可以看到,这项权利要求深度嵌入了数学概念,特别是步骤[A1]中的“计算后验分布的近似值”。这正是它被认定为“抽象”的直接原因。那么,ARP是如何论证它最终又不属于“抽象”的呢?
ARP的判决逻辑:深入 Alice 框架的剖析
ARP的分析严格遵循了MPEP(美国专利审查程序手册)中对 Alice 两步法的指引,尤其是在 Step 2A 的两个子步骤(Prong One 和 Prong Two)中展现了与PTAB截然不同的思路。
Step 2A Prong One:权利要求是否“记载”了司法例外(如抽象概念)?
在这一步,ARP其实是同意PTAB的。ARP并未试图争辩该发明不包含抽象概念。它承认权利要求中包含抽象概念,例如权利要求中的“计算后验分布的近似值”属于数学概念,是抽象的。
Step 2A, Prong Two:权利要求作为一个整体,是否“指向”了该司法例外?
这才是决胜负的地方。Prong Two是评估权利要求是否通过额外的要素,将抽象概念整合到实际应用中,从而使得权利要求的核心并非指向抽象概念本身。
ARP的论证非常精彩。他们指出,不能仅仅因为权利要求中存在数学计算,就认定整个权利要求都指向了抽象概念。必须审视其他的权利要求要素。
具体而言,ARP的论证路径如下:
1)整体性原则
强调必须“将权利要求作为一个整体”来评估,而不是将其中涉及算法的部分孤立出来进行评判。
2)聚焦“技术改进”
ARP的论证重心都集中在这一步。
ARP重点分析了上述权利要求1中的步骤[C]和[D]:“调整参数...以优化...在第二个任务上的性能,同时保护其在第一个任务上的性能”,以及通过“惩罚项”来实现这一目标。
ARP认为,这些步骤并不是在进行通用的数学运算。它们描述了一个具体的、技术性的过程,这个过程被明确地应用于改进一个机器学习模型的功能——即赋予它连续学习而不会“遗忘”的能力。这直接解决了计算机科学领域的一个公认技术难题。
因此,ARP得出结论:当把步骤[A]的数学计算与步骤[C]、[D]的技术应用结合起来看时,权利要求作为一个整体,其特征是指向一个对机器学习模型运作方式的技术改进,而不是指向数学计算本身。 这个抽象概念被成功地整合到了一个实际应用中,并带来了可衡量的技术优势,例如减少存储需求、降低系统复杂性。
3)引用经典判例
ARP花了一定篇幅引用 Enfish 案,基于 Enfish 案,ARP强调软件创新可以像硬件一样,对计算机的功能本身带来改进。
4)反对审查员的“过度泛化”
ARP在判决中批评了PTAB将“任何机器学习都等同于不可专利的算法”以及将其他元素视为“通用计算机组件”的分析方法,认为这样的审查“过于泛化”,不利于保护创新。
基于这个判决,我们可以说,创造出一个更好的模型,或是对模型的训练方法作出改进,都可以视为对计算机技术的改进。
如何将上述判例用于实战?把它作为美国申请撰写和答复的标准之一
Ex parte Desjardins 案的判决之所以意义重大,不仅在于其本身的论证逻辑,更在于它出现的时机——恰好与USPTO最新的审查指导(2024年7月)动态形成了鲜明的对照,为我们提供了应对未来审查挑战的有力之矛。
就在2024年7月,USPTO发布了最新的《专利客体适格性示例》,其中的 Example 47 (Anomaly Detection,“异常检测”) 尤其值得我们关注。
该示例中的 Claim 2,描述了一种使用人工神经网络(ANN)的方法,其步骤包括:
(a) 接收连续训练数据;
(b) 离散化数据;
(c) 使用反向传播算法和梯度下降算法进行训练;
(d) 检测异常;
(e) 分析异常;
(f) 输出异常数据。
USPTO官方明确判定:Claim 2不具备专利适格性(ineligible)。
官方的分析核心在于,Claim 2仅仅是一系列常规、已知的计算步骤的组合(接收数据、离散化、用标准算法训练),而权利要求本身并未限定这些步骤如何被用于实现对计算机功能或相关技术的任何特定改进。换言之,它描述了一个通用的、谁都可以使用的训练流程,而没有指出这个流程具体解决了什么技术问题,或带来了什么技术提升。
许多审查员可能无法深入辨别一项方案是仅仅应用了现有方法,还是利用现有方法实现了真正的技术改进。这导致,Example 47的存在,会让很多模型训练类申请面临101问题。
而Desjardins 案的价值在于它清晰地展示了:并不是所有模型训练的申请都有101问题,只要能够解决一个具体的技术问题并带来明确的技术改进,就足以跨越§ 101的门槛。
这正是我们工作的关键所在。我们的任务,就是通过精准的撰写和有力的答复,将这一点清晰地呈现出来。
基于此,我们可以形成以下具体的撰写与答复策略:
申请文件撰写策略 - 主动规避“Example 47陷阱”
我们的核心目标,是在撰写阶段就确保权利要求不会被轻易地与Example 47的Claim 2画上等号。
技术问题导向:撰写的起点,不应是“我们有一个新算法”,而应是“我们为解决一个具体的技术问题,而提出了一种新的训练方案”。这个“技术问题”必须是明确的,例如Desjardins 案中的“灾难性遗忘”,或是模型压缩、训练效率、小样本学习等真实的技术瓶颈。
权利要求体现“整合”:权利要求本身必须体现出算法与具体技术应用的深度整合。效仿Desjardins 案的权利要求1,我们的权利要求不仅要包含训练步骤(数学部分),更要包含明确指向技术目的和改进的要素。
审查意见答复策略 - 以 Desjardins 案“划清界限”
我们的答复不应是否认与Example 47的相似性,而应是承认相似性,并强调本质区别。甚至,直接引用 Desjardins 案来论证区别。
比如,可参考话术:本发明的权利要求作为一个整体,遵循了 Ex parte Desjardins 案确立的审查原则。如权利要求[X]所限定的,本发明的训练方法通过XX,旨在解决XX技术问题,并实现了XX技术改进。因此,本发明并非仅仅“应用”一个抽象概念,而是提供了一个具体的、改进了计算机技术的技术解决方案。这完全符合 Desjardins 案中被认定为具备专利适格性的情形,并与Example 47的反面教材有明确区分。”
通过这样的策略,我们可以有理有据地论证,尽管我们的发明可能建立在常规方法之上,但其核心价值在于实现了明确的技术改进,这正是其应当受到专利法保护的根本原因。
更多的话
该案虽未宣告§ 101审查的终结,但它明确地提升了“技术改进”在审查标准中的权重。它告诉我们,一个包含算法的发明能否获得专利,关键不在于是否“抽象”,而在于它是否足够“具体地”解决了“技术领域”中的一个“真实问题”。
关于Ex parte Desjardins 案的讲解到这里就结束了,如果还有疑问欢迎评论区留言讨论。
推荐文章:
权利要求步骤中涉及计算机,专利就一定有效吗?--判例解读之06