文/北京集佳知識產(chǎn)權(quán)代理有限公司 潘曉松
近年來,隨著人工智能(AI)技術(shù)的快速發(fā)展,美國專利商標局(USPTO)針對專利主題適格性(subject matter eligibility),即專利客體問題發(fā)布了更新指導(dǎo),以應(yīng)對AI相關(guān)權(quán)利要求評估的挑戰(zhàn)。本文基于USPTO 2024年7月發(fā)布的更新指導(dǎo)以及2024年12月底發(fā)布的培訓(xùn)材料中的Example 48、即“語音分離”判例,對主題適格性問題進行了探討。
一、法律框架:AI發(fā)明背景下的Alice/Mayo測試
根據(jù)相關(guān)指導(dǎo)和培訓(xùn)材料的指示,所有AI相關(guān)的軟件發(fā)明都必須通過源于最高法院判例的Alice/Mayo兩步法測試:
1.第一步(Step 2A, Prong One):權(quán)利要求是否“指向”(directed to)一個司法例外,如自然法則、自然現(xiàn)象或抽象概念。在AI領(lǐng)域,最常見的抽象概念包括“數(shù)學(xué)概念”(如數(shù)學(xué)關(guān)系、公式、算法)和“精神過程”(如人類可以通過思維完成的觀察、評估、判斷)。
2.第二步(Step 2A, Prong Two & Step 2B):如果第一步的答案為是,那么權(quán)利要求是否包含“顯著更多”(significantly more)的要素,從而將這個抽象概念轉(zhuǎn)化為具體的、具有創(chuàng)造性的應(yīng)用。
USPTO的最新指南強調(diào),在評估第二步之前,審查員應(yīng)首先在第一步的第二個分支(Prong Two)中判斷:權(quán)利要求作為一個整體,是否將司法例外“整合”(integrates)到了一個“具體的實踐應(yīng)用”(practical application)中?如果答案是肯定的,那么該權(quán)利要求就不再被視為“指向”抽象概念,從而直接滿足101條的要求,無需進入更為嚴格的Step 2B分析。
二、Example 48詳細分析:基于AI的語音分離和識別
Example 48標題為“使用深度神經(jīng)網(wǎng)絡(luò)的語音分離”,描述了一個在嘈雜環(huán)境中分離混合語音信號的系統(tǒng)、例如虛擬會議。該發(fā)明使用一種人工神經(jīng)網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò),DNN),用包含較少說話者的混合語音信號對其進行訓(xùn)練,訓(xùn)練后的網(wǎng)絡(luò)可分離更多聲源的語音信號。
1.不具主題適格性的權(quán)利要求1(Claim 1)
權(quán)利要求1描述了一個語音分離的方法,包括:
(a)接收包含多個不同聲源sn(其中n∈{1,…,N})語音的混合語音信號x;
(b)使用短時傅里葉變換將所述混合語音信號x轉(zhuǎn)換為時間-頻率域的頻譜圖,并獲取特征表示X,其中X對應(yīng)于所述混合語音信號x的頻譜圖和從所述混合語音信號x中提取的時間特征;
(c)使用深度神經(jīng)網(wǎng)絡(luò)(DNN)通過公式V=fθ(X)確定嵌入向量V,其中V=fθ(X)是所述混合語音信號x的全局函數(shù)。
USPTO的分析:該權(quán)利要求被認定為“指向”抽象概念,因而不具備主題適格性。
?步驟(b)中的傅里葉變換是純粹的數(shù)學(xué)計算。
?步驟(c)中明確限定了一個數(shù)學(xué)公式,用于計算嵌入向量,這同樣屬于數(shù)學(xué)概念。
?雖然權(quán)利要求中提到了“接收信號”和使用“DNN”,但被認為是高度概括性的。接收數(shù)據(jù)僅僅是常規(guī)的“數(shù)據(jù)收集活動”(data gathering),而使用通用的DNN來執(zhí)行數(shù)學(xué)計算,則被視為“應(yīng)用它”(apply it)的指令,即將抽象的數(shù)學(xué)公式應(yīng)用在一個通用計算環(huán)境上。
核心結(jié)論:權(quán)利要求1的整體內(nèi)容僅僅是描述了一系列的數(shù)學(xué)運算,從一個信號計算出另一個數(shù)據(jù)(嵌入向量),并未限定如何利用這個計算結(jié)果去解決實際的“語音分離”技術(shù)問題。因此,未能將抽象的數(shù)學(xué)概念整合到具體的實踐應(yīng)用中。
2.具備主題適格性的權(quán)利要求2(Claim 2)——從抽象計算到具體技術(shù)實現(xiàn)
權(quán)利要求2是在權(quán)利要求1的基礎(chǔ)上進一步限定的方法,增加了以下步驟:
(d)將所述嵌入向量V劃分為與不同聲源sn對應(yīng)的聚類;
(e)對所述聚類應(yīng)用二進制掩碼,以生成帶掩碼的聚類;
(f)從所述帶掩碼的聚類中合成語音波形,其中每個語音波形對應(yīng)于不同的聲源sn;
(g)組合所述語音波形以生成混合語音信號x’,具體為:將與不同聲源sn對應(yīng)的語音波形拼接,排除目標聲源ss的語音波形,使得所述混合語音信號x’包含來自不同聲源sn的語音波形,且不包含來自目標聲源ss的語音波形;
(h)將所述混合語音信號x’傳輸至遠程位置存儲。
USPTO的分析:該權(quán)利要求被認定為具備適格性。
?步驟(h)中的“傳輸”屬于無關(guān)緊要的“非解決方案相關(guān)活動”。
?步驟(f)和(g)通過記載 “深度神經(jīng)網(wǎng)絡(luò)如何輔助聚類分配以匹配混合語音信號中識別的聲源,隨后將這些聚類合成為時域中的分離語音波形,并轉(zhuǎn)換為排除非目標聲源音頻的混合語音信號”,體現(xiàn)了說明書中討論的改進。
權(quán)利要求2的技術(shù)方案解決了“分離同類語音源的語音”的問題,且無需預(yù)先知曉說話者數(shù)量或進行說話者特定訓(xùn)練。
這些步驟體現(xiàn)了說明書中描述的改進。因此,該權(quán)利要求指向?qū)ΜF(xiàn)有計算機技術(shù)或語音分離技術(shù)的改進,且已將抽象概念整合為實際應(yīng)用。
總結(jié):Example 48代表了AI下§ 101分析的關(guān)鍵進步,AI往往涉及數(shù)學(xué)模型,風險抽象,該判例強調(diào)了記載(recitation)例外與涉及(involve)例外的區(qū)分。權(quán)利要求1明確記載數(shù)學(xué)概念,而權(quán)利要求2同樣涉及數(shù)學(xué)概念但突出了整體權(quán)利要求分析,相關(guān)培訓(xùn)材料中指出,需要評估各個限定特征之間的相互關(guān)聯(lián)(例如權(quán)利要求2的步驟(f)和(g))。同時,也提醒申請人,應(yīng)強調(diào)解決的技術(shù)問題,而非僅結(jié)果。
參考資料:
1.Reminders on evaluating subject matter eligibility of claims under 35 U.S.C. 101;
2.2024 Guidance Update on Patent Subject Matter Eligibility, Including on Artificial Intelligence