4月30日消息,據小米公司公衆號“Xiaomi MiMo”,小米今日開源首個專爲“Reasoning(推理)”打造的大模型MiMo-7B,在AIME數學推理和LiveCodeBench編程測評中超越OpenAI o1-mini及阿里Qwen-32B。

MiMo通過大規模推理數據預訓練與強化學習後訓練聯動提升推理能力,提出Test Difficulty Driven Reward等創新算法,並在同類7B模型中強化學習潛力領先。全系列已開源至Hugging Face,相關技術報告同步發佈。