DeepSeek 發佈 DeepSeek-Prover-V2-671B 模型，參數達 6710 億

Binance News · 2025-04-30T10:43:56.000Z

据 BlockBeats 报道，4 月 30 日，DeepSeek 在 Hugging Face 上发布了 DeepSeek-Prover-V2-671B 模型。该模型使用 safetensors 文件格式，支持多种计算精度，参数达 6710 亿。该模型采用 DeepSeek-V3 架构，使用 MoE 模式，具有 61 层 Transformer 层和 7168 维隐藏层。支持超长上下文，最大位置嵌入达 16.38 万，采用 FP8 量化技术，提高推理效率。

Binance News

--・通過驗證的幣安官方帳戶

AI 摘要

DeepSeek 發佈 DeepSeek-Prover-V2-671B 模型，參數規模達 6710 億，採用先進架構和技術，提升推理效率，支持超長上下文處理。

據 BlockBeats 報道，4 月 30 日，DeepSeek 在 Hugging Face 上發佈了 DeepSeek-Prover-V2-671B 模型。該模型使用 safetensors 文件格式，支持多種計算精度，參數達 6710 億。
該模型採用 DeepSeek-V3 架構，使用 MoE 模式，具有 61 層 Transformer 層和 7168 維隱藏層。支持超長上下文，最大位置嵌入達 16.38 萬，採用 FP8 量化技術，提高推理效率。

免責聲明：包含來自第三方的見解。非財務建議。可能包含贊助內容。請參閱條款。

DEEPUSDT

永續

0.19588

+2.23%

DeepSeek 發佈 DeepSeek-Prover-V2-671B 模型，參數達 6710 億

實時新聞

熱門文章