DeepSeek發佈6710億參數開源模型,專注數學定理證明

哈世鏈聞消息,DeepSeek公司今天推出了一款名爲DeepSeek-Prover-V2-671B的開源模型,特別設計用於數學定理證明。該模型採用混合專家(MoE)架構,並通過Lean 4框架進行形式化推理訓練,其參數規模高達6710億。通過結合強化學習與大規模合成數據,此模型在自動化證明方面展現出顯著的能力提升。目前,這一模型已上線Hugging Face,支持進行本地部署和商業用途。