Xiaomi juga menghapus biaya tambahan untuk penggunaan jendela konteks 1 juta token penuh dan mereset kredit pengguna saat peluncuran, membuatnya lebih ramah pengembang.
Pada awal Juni 2026, Xiaomi meluncurkan MiMo Code, agen pengkodean AI berbasis terminal yang menggunakan MiMo-V2.5.
Berbeda dengan asisten pengkodean lain yang kehilangan konteks saat jendela penuh, MiMo Code memiliki sistem memori persisten yang melacak keputusan di seluruh proyek panjang.
MiMo-VL: Model Visi-Bahasa
Di sisi visual, Xiaomi merilis MiMo-VL (Vision-Language) dan varian khusus rumah, MiMo-VL-Miloco-7B. Model Miloco dirancang untuk memahami lingkungan rumah.
Model ini dapat mengenali gestur sehari-hari seperti jempol, OK, tanda damai, dan telapak tangan terbuka.
Ia juga dapat mengidentifikasi aktivitas rumah tangga umum seperti menonton TV, berolahraga, atau membaca. Model ini dibangun dengan campuran supervised fine-tuning dan reinforcement learning.
MiDashengLM-7B: Model Audio AI
Dirilis pada Agustus 2025, MiDashengLM-7B adalah model audio AI Xiaomi.
Tidak seperti kebanyakan sistem suara AI yang dilatih pada pengenalan ucapan, model ini menggunakan pendekatan "general audio caption".
Model ini dilatih pada dataset besar 38.662 jam dan dapat memahami tidak hanya kata-kata, tetapi juga musik, suara lingkungan, emosi pembicara, dan konteks akustik.
Model ini dibangun di atas Qwen2.5-Omni-7B dari Alibaba dan tertanam di kendaraan listrik serta perangkat rumah pintar Xiaomi.
Xiaomi merilisnya di bawah lisensi Apache 2.0.
>>> ASUS ROG dan ProArt PZ14 Hadir di India dengan Prosesor AI dan RTX 50-Series
MiMo-Audio: Mendengar dalam Skala Besar
Bersamaan dengan pekerjaan visi dan bahasa, Xiaomi juga menerbitkan MiMo-Audio, model bahasa audio terpisah. Encoder audio dari MiMo-Audio kemudian diintegrasikan ke dalam MiMo-V2.5 untuk mendukung pengalaman omnimodal.