小米發佈首個推理大模型MiMo-7B並宣佈全面開源



哈世鏈聞消息,小米今日宣佈發佈其首個專門爲“推理”打造的大模型MiMo-7B,並宣佈全面開源。根據其官方公衆號“Xiaomi MiMo”透露,MiMo-7B在AIME數學推理和LiveCodeBench編程測評中表現超過OpenAI o1-mini和阿里Qwen-32B。通過大規模推理數據的預訓練及強化學習後訓練,MiMo的推理能力得到提升,並引入了一種創新算法Test Difficulty Driven Reward,在同類7B模型中強化學習潛力領先。整個系列已開源至Hugging Face,並同步發佈相關技術報告。