自中國大型語言模型 DeepSeek R1 以其媲美 OpenAI 的推理能力及低於業界九成的震撼性低價發布以來,已超過 150 天。當時市場普遍擔憂此舉將引發AI模型的商品化割喉戰。然而,數據顯示的卻是另一幅景象:儘管 DeepSeek 的模型在第三方平台(如 OpenRouter)大受歡迎,其自營的應用程式與 API 服務流量卻不增反減,市佔率持續下滑。
研究機構《SemiAnalysis》指出,核心原因在於 DeepSeek 為應對美國晶片出口管制下的算力限制,採取了犧牲使用者體驗的戰略,亦即其雖然價格低廉,卻伴隨著極高的延遲(Time-to-First-Token)與極小的上下文視窗(Context Window),迫使用戶等待數秒才能獲得回應。
《SemiAnalysis》分析指出,這種刻意的取捨,是為了將有限的高階運算資源集中用於模型研發,力求在 AGI(通用人工智慧)的終極競賽中取得突破,而非著眼於當前的API服務營利。
DeepSeek App 市占:從 8% 回落至 4.5%
那麼,DeepSeek 的 App 市占率究竟下滑多嚴重?據《SemiAnalysis》指出,DeepSeek 可謂出道即巔峰 ,在今年一月份推出 App 後,市占率出現了近乎垂直的爆炸性增長,從接近 0% 迅速飆升至超過 8% 的峰值。
研究強調,因為中國市場的用戶數據追蹤不完整,且許多西方 AI 服務在中國被禁用,因此數據很可能低估了 DeepSeek 的真實影響力。 但整體而言,DeepSeek 市占率在 1 月觸頂之後就一路下滑,截至 5 月底已回落至 4.5% 左右 ;值得注意的是,同期間整體市場的 AI App 使用者指數一路上升,顯見用戶外移的趨勢。
圖源:《數位時代》「AI 應用使用者指數」與「DeepSeek 市場佔有率」比較的趨勢圖。
DeepSeek 網頁訪問次數:衰退近 30%
而在瀏覽器訪問這一端,DeepSeek 網頁版的訪問次數同樣一路下降。根據 SimilarWeb 數據,從今年 2 月到 5 月這三個月期間,DeepSeek 網站流量從 6.14 億次(614 M)下降至 4.36 億次(436 M),衰退幅度高達 29%。
但反觀 ChatGPT,作為市場的領導者,其流量從 39.05 億次(3,905 M)增長到 54.92 億次(5,492 M),仍然實現了 40.6% 的強勁增長。而 Google 旗下的 Gemini 成長幅度更驚人,流量從 2.84 億次(284 M)大幅增長至 5.28 億次(528 M),增長率高達 85.8%。
至於比較晚加入戰局的 Grok 由於流量基期較低,同期間流量從 5,100 萬次(51 M)爆炸性增長至 1.79 億次(179 M),增長率達到了驚人的 247.1%,是所有服務中最高的;Claude 則成長穩健,流量從 7,300 萬次(73 M)增長到 1 億次(100 M),實現了 36.5% 的成長。
5大AI模型瀏覽器訪問變化
圖源:《數位時代》
犧牲體驗換未來,DeepSeek 的算力告急
DeepSeek 的策略選擇清晰地體現在其服務的各項指標上。相較於其他提供商,用戶在使用 DeepSeek 官方服務時,必須忍受超過 25 秒的延遲與僅 64K 的上下文視窗,這嚴重限制了如程式碼分析等需要大量記憶的應用場景。
《SemiAnalysis》指出,與此形成鮮明對比的是,第三方託管的 DeepSeek 模型實例,總使用量自 R1 發布以來成長了近 20 倍,因為這些服務商利用更優化的硬體配置,提供了延遲更低、上下文視窗更大的選項。
DeepSeek 透過高併發批次處理(Batching)使用者請求,將單一 GPU 的效能壓榨到極致,從而降低每百萬代幣的成本。此舉雖換來了全球性的模型知名度與開源社群採納,卻也將服務的重擔與商機轉嫁給了第三方雲端平台。
《SemiAnalysis》指出,這反映了在無法大規模取得如輝達高階晶片的困境下,中國 AI 企業只能「用(用戶的)時間換(預算的)空間」,確保核心研發不致落後。
代幣經濟 3 要素:除了價格外的「CP 值」指標
DeepSeek 現象揭示了當前 AI 市場的競爭核心已不再是單純的價格戰,而是「代幣經濟學」(Tokenomics) 的權衡。一個模型的價值不能僅由「$/Mtok」(每百萬代幣價格)來定義,而是取決於三大關鍵績效指標(KPI)的平衡:
延遲(Latency):從發出請求到模型生成第一個代幣所需的時間。
互動性(Interactivity):模型生成後續代幣的速度,通常以每秒代幣數(tokens per second)衡量。
上下文視窗(Context Window):模型能「記住」的對話或資料長度。模型供應商可透過調整這些變數,來決定最終的代幣價格。
AI Token之戰,不只拚總量也拚「輸出純度」
算力受限並非 DeepSeek 獨有的困境,即便是資金雄厚的西方 AI 公司 Anthropic 也面臨著相似的挑戰。Anthropic 的 Claude 4 Sonnet 在 API 上的輸出速度自推出以來已下降 40%,來到每秒約 45 個代幣。這與 DeepSeek 的原因如出一轍:為了用有限的算力應對海量請求,不得不提高批次處理率,從而犧牲了互動速度。
然而,Anthropic 也展現了另一種優化方式,其模型在回答問題時更為「精煉」,產生的總代幣數遠少於競爭對手,也就是儘管速度較慢,但用戶獲得完整答案的總等待時間可能更短。
本文經授權轉載自:《數位時代》
原文標題:《海水退潮了?DeepSeek流量雪崩近30%:為何走「俗擱大碗」CP值路線,卻留不住用戶?》
原文作者:李先泰
『DeepSeek流量雪崩近30%!為何走俗擱大碗路線,卻留不住用戶?』這篇文章最早發佈於『加密城市』