Theo PANews, Xiaomi đã công bố phát hành mô hình mã nguồn mở đầu tiên của mình được thiết kế cho lý luận, có tên là MiMo-7B. Mô hình này đã thể hiện hiệu suất vượt trội trong các đánh giá lý luận toán học AIME và lập trình LiveCodeBench, vượt qua o1-mini của OpenAI và Qwen-32B của Alibaba. MiMo-7B nâng cao khả năng lý luận thông qua việc đào tạo trước trên dữ liệu lý luận quy mô lớn và học tăng cường sau đó, giới thiệu các thuật toán đổi mới như Phần thưởng Dựa trên Độ Khó Bài Kiểm Tra. Nó dẫn đầu về tiềm năng học tăng cường trong số các mô hình 7B tương tự. Toàn bộ loạt đã được phát hành trên Hugging Face, kèm theo một báo cáo kỹ thuật chi tiết.