觀點文章呈現多元意見,不代表《WEB3+》的立場

從Harvey跟Lawsnote 判決談 AI 時代的著作權戰爭

Harvey,這個由 OpenAI 投資、被視為全球法律 AI 解決方案龍頭的工具,不僅進駐多家頂級律所,還被稱作是下一個改變法律產業的革命性產品。

可是在這麼強大的技術背後,有一件事反而特別低調:「Harvey 並沒有整合 Lexis、Westlaw、或其他任何商業法學資料庫的判決內容。」

是的,一個法律 AI 工具,居然不直接引用美國最龐大的法律資料庫,這合理嗎?他們不是技術做不到,是不敢。

Harvey 的設計裡,有一個極為關鍵的策略安排——該系統要求使用者自行上傳查得的判決內容,或輸入具體的法律條文與裁判資料,方能進行分析。

換言之,其模型資料庫本身,並不主動內含 Lexis 或 Westlaw 的資料內容,甚至刻意避開判決資料的摘要語言與分類架構。這是為什麼?因為全球的法律資料庫,都「超級兇」。

這不只是法律 AI 業界的常識,更早已具體表現在國際司法實務上。例如 Thomson Reuters 訴 Ross Intelligence 一案,即為資料庫平台主張其「編輯著作權」而對法律 AI 新創提起訴訟的代表案件。

Westlaw v. Ross Intelligence:法律資料庫如何以「編輯著作」發動訴訟?

在該案中,Thomson Reuters 主張其擁有 Westlaw 法律平台上的「原創及經修訂之法律資料彙編」著作權,包括其設計之 Headnotes(判決重點摘要)與 Key Number 系統(分類標籤架構)。

Ross Intelligence 為一家法律 AI 新創企業,開發出一套自然語言檢索引擎,可自動回答法律問題並引用判決資料。部分 Ross 用於訓練其 AI 搜尋引擎的司法文本,即來自 Westlaw 系統之 Headnotes 與分類標籤資料。

Thomson Reuters 於是提起訴訟,主張 Ross 對其具原創性的判決摘要及分類結構進行未經授權之重製與利用,構成編輯著作權之侵害。

此一主張未針對判決原文,而是針對資料庫平台對公共資料所做的再整理、再包裝、再分類的商業性編輯行為提出保護。

這場訴訟正顯示出:在 AI 與資料學習日益普及的背景下,資料庫平台所主張的著作權邊界,正從「內容擁有者」轉為「結構壟斷者」。Harvey 對此了然於胸,因此其產品架構便刻意採取風險隔離設計,避免觸碰任何已受編輯著作權保護之資料集。

看來 Harvey 的判斷是真的沒錯,因為不管美國還是台灣,資料庫對於潛在競爭者都是訴訟到底,台灣的法源資料庫也不例外。

法源與 Lawsnote 的衝突:市場常態

以本次備受爭議的 Lawsnote 判決為例,Lawsnote 作為開放型的法學資料檢索平台,其與傳統付費型資料庫「法源資訊」在服務性質與商業模式上,顯係處於競爭關係。兩者皆提供司法判決檢索、條文查詢、裁判邏輯歸納與標記等功能,並採訂閱制收費。

在此種市場格局下,資料庫平台之間的訴訟固然令人遺憾,但若從實務視角觀察,雙方互提訴訟實屬於現行制度下的合理戰略選項。

類似情形早在科技產業屢見不鮮:從蘋果與三星之間的專利大戰,到美國多家資料服務商彼此交互提告,使用「專利」與「著作權」作為競爭武器,早已不再稀奇。問題不在於資料庫會不會告,而在於法院如何審理與界定其主張的正當性。

法院應為界線守門人,而非資料霸權的放行者

著作權制度原本即具有平衡性與彈性。當創作者提出侵權主張時,法院理應從公共利益、合理使用、創新價值等面向進行判斷與衡量。

尤其在面對類似「法律資訊的彙編結構」時,是否應被視為著作權保護的客體,實應具體分析其創作性與獨創程度,而不應輕率以彙整與標註之工作即推定構成受保護作品。

在美國判決中,即便原告主張資料分類結構具創作性,法院亦會進一步檢視該分類是否真屬高度原創,是否有公領域重疊、是否實質限制 AI 發展空間。

而我國此次 Lawsnote 判決卻以高度簡化方式,將平台的資訊分類與羅列,視為高度保護對象,並進而裁定刑責及鉅額民事賠償。此等處理方式,未能顯現法院應有的平衡與技術理解能力,令人深感遺憾。

編輯著作權的界線:不能凡整理即成創作

我個人始終認為,所謂「編輯著作」的保護,不應成為公共資料資訊再利用的高牆。

如果今天是法源平台自行設計的分類邏輯,諸如:精選侵權行為案例彙編,對於此種分類,當然可主張編輯著作之保護。但若僅係按法條順序排列、按年份羅列判決、或將條文對應裁判摘要作形式歸檔,則應視為公領域運用,而非私人財產權保護客體。

著作權保護的應該是創作,而不是公共資訊的結構化複誦。過度寬放編輯著作權的主張,只會導致知識被壟斷、創新者自律寒蟬。

結語:資料庫已成產業障礙,法院應為資訊利用與著作權之間的界線劃定標準

Harvey 不碰資料庫,不是因為他不想碰,而是因為他碰不起。這不只是單一平台的設計選擇,更是整個法律 AI 發展受阻的制度性困境。

今天我們看到的,不只是一次台灣的 Lawsnote 判決而已,而是全球性現象:法學資料庫的壟斷性資料控制,加上著作權法下保護「編輯著作權」主張,正在系統性地阻礙法律 AI 的發展。

事實上,像 Westlaw、Lexis 這類平台在美國早已藉由法律訴訟讓許多 AI 新創公司無力抵抗、直接退出市場。這些資料庫不僅不授權,還主張所有分類架構、摘要文字皆具創作性,一旦用於訓練模型便構成侵權,重則刑責,輕則天價賠償,完全封鎖了創新空間。

Harvey 今天之所以只能被稱為「legal assistant」,而非「legal intelligence system」,很大一部分是因為他無法完全學習法學資料庫內的判決資料。如果他得以合法運用 Westlaw 的龐大資料來訓練與生成法律意見,他所能取代的,可能就不僅是初階實習律師,而是高階資深律師工作。

說到底,資料庫業者當然有權利,但法院有更高的義務——那就是設定界線與重新定義合理利用的空間。當科技不斷演進,一些本來可能具有創作性但高度結構化與公式化的分類方式,是否仍值得享有著作權保護,是否應可被 AI 作為資料學習之用,這都是法院必須回答的問題。

如果法院願意出面劃出這條界線,這將真正打開 AI 在法律領域的發展之門。也唯有如此,才能在促進技術進步與保護產業投資之間建立平衡。

更多報導
台灣第一起網路爬蟲遭重判!Lawsnote判4年、罰1億,發生什麼事?爭議在哪?
一張照片就能試穿所有衣服!Google推AI試衣App「Doppl」,虛擬試穿商機有多大?