在 AI 與大數據浪潮下,資料抓取與著作權保護的界線逐漸模糊。新北地方法院近期一起判決,針對法源資訊與 Lawsnote 七法的資料庫侵權爭議做出裁決。 (前情提要:下載他人創作再 AI 洗圖違法!中國首例 AI 侵犯著作權刑案宣判入獄+罰金) (背景補充:虹膜驗證時代來臨?Reddit 將採用 World ID 對抗 AI 假帳戶,世界幣 $WLD 飆漲) 在 AI 與大數據浪潮下,透過爬蟲自動抓取資料已成為不少企業的網路日常,不過近期一宗案件引起討論。新北地方法院在 6 月宣判,七法公司(Lawsnote)的兩位共同創辦人分別被判處 4 年和 2 年徒刑,同時公司與創辦人必須連帶賠償法源資訊新台幣 1 億元。 這項判決讓這家曾被媒體譽為「法學版 Google」的新創公司,從原本備受矚目的潛力股,瞬間成為科技圈的警示案例。 從法學版 Google 到法律警鐘 七法公司 Lawsnote 成立於 2016 年,以其即時檢索法律文件的功能,迅速累積了大量律師和企業客戶。然而,自 2021 年起,法源資訊指控 Lawsnote 利用爬蟲程式,大規模複製其「法源法律網」資料庫的內容,並將這些內容用於其收費服務。 在檢調單位進行搜索後,認定 Lawsnote 重製並上架了法源資訊經過選擇、組織和編輯的資料,且其行為具有營利目的,已經侵害了法源資訊的「編輯著作權」。 因此,新北地方法院 6 月做出了有罪判決,這也成為台灣法律科技領域首宗因資料爬取行為而面臨刑、民雙重制裁的案例。根據自由時報報導,法官在判決中特別強調:「公共資料不等於自由利用」。 著作權爭議的核心與判決影響 在這起案件中,Lawsnote 方面辯稱他們僅對條文進行了簡單的文字和符號處理,不構成侵權行為;然而,法源資訊則主張,其資料庫經過大量人工的挑選與排版,屬於具有創作性的編輯著作。 法院最終採納了法源資訊的主張,並引用《著作權法》中的重製權以及《刑法》中的無故取得電腦電磁紀錄罪,認定被告的行為「具營利動機且規模龐大,情節重大」。法官在判決理由中指出: 「公共資料不等於自由利用;凡經編輯或創作性加工,即便源自公部門,仍受著作權保護。」 這段判決理由未來勢必會成為法律資訊服務業在資料使用和著作權問題上的重要參考依據。 對 AI 與大數據產業的衝擊與風險 近年來,許多資料驅動的商業模式高度仰賴網路資料的抓取。Lawsnote 的判決凸顯了一個重要的事實:僅僅是開放存取並不等於擁有免責的權利。 尤其當前生成式 AI 模型需要大量資料進行訓練,近期也面臨著資料來源合法性的挑戰。國際上也已經出現了類似的案例,例如 Reddit 就控告 Anthropic 未經授權收集其平台上的貼文。 根據科技新報報導,訓練資料來源的合法性已經成為 AI 產業未來發展的最大隱憂。為了解決這個問題,Creative Commons 近期正在推動一個名為「CC signals」的框架,試圖在開放數據的共享與著作權保護之間建立共識,並為開發者提供一套可識別的授權標示。 爬取資料的自我檢查清單 Lawsnote 的案例也為所有新創公司提供了一份重要的風險清單,提醒他們在進行資料爬取和使用時必須格外謹慎: 在爬取資料之前,務必確認資料是否具備創作性選擇或編輯的成分。 如果你的資料使用涉及營利目的,建議取得相關方書面的授權,或者考慮購買合法的 API。 建立內部合規流程,包括嚴格審核資料來源、記錄重製過程以及明確的版權聲明。 當遇到法律上的灰色地帶時,應積極尋求專業的法律意見,而不是僅僅依靠技術手段來規避風險。 隨著 AI 模型對大量高品質訓練資料的需求持續暴增,數據倫理與法規遵循的重要性勢必會提升到企業核心策略的層級。未來需要產、官、學界能夠攜手合作,共同完善數據授權標準和開放機制,才能確保科技創新能夠走得更快、更穩。 相關報導 投資風口還是泡沫?AI + Web3 賽道還有什麼價值? 蘋果AI轉戰「自動化設計晶片」,M6、A20晶片有望能效再加強 好文》AI如何改變人類的閱讀習慣?原始文本終會消失?〈台灣首宗資料爬蟲判刑》法學版Google「七法Lawsnote」濫用對手法源資訊,2名創辦人入獄+罰金1億元〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。