شیائومی پس از عرضه مدل MiMo‑V۲‑Pro در چند هفته گذشته اکنون دو مدل جدید هوش مصنوعی با نامهای MiMo‑V۲.۵ و MiMo‑V۲.۵‑Pro را معرفی کرده است. این دو مدل نسل تازهای از معماری چندوجهی شیائومی محسوب میشوند که قابلیت پردازش همزمان تصویر، ویدیو و صدا را ارائه میدهند.
برخلاف نسل پیشین که تنها قادر به تحلیل متن و کد بود، مدل MiMo‑V۲.۵ اکنون توانایی درک و تحلیل ورودیهای بصری و صوتی را بهصورت یکپارچه دارد؛ بهعنوان مثال کاربران میتوانند تصویر داخل یخچال خود را بارگذاری کرده و دستور پخت دریافت کرده یا از یک ویدیوی آموزشی خلاصهای گامبهگام تهیه کنند.
@ADS#2پیشرفت مدل حرفهای Pro
# شیائومی اعلام کرده که نسخه حرفهای یعنی MiMo‑V۲.۵‑Pro در حوزههایی همچون معماری عاملمحور، مهندسی نرمافزار پیچیده و اجرای وظایف بلندمدت جهش محسوسی داشته است. این مدل در بسیاری از بنچمارکهای تخصصیِ مرتبط با ایجنتها و کدنویسی، عملکردی نزدیک به مدلهای برجستهای همچون Claude Opus ۴.۶ و GPT‑۵.۴ ارائه داده است.
طبق اعلام شیائومی مدل MiMo‑V۲.۵‑Pro برای انجام وظایف حرفهای سنگین طراحی شده و قادر است پروژههایی را که انجام آن توسط انسان چندین روز زمان میبرد بهطور خودکار انجام دهد. سرعت این مدل ۶۰ تا ۸۰ توکن بر ثانیه است و هزینه پردازش آن برای هر یک میلیون توکن ۱ دلار برای ورودی و ۳ دلار برای خروجی تعیین شده است.در مقابل مدل MiMo‑V۲.۵ بهعنوان نسخه عمومیتر و مناسب وظایف روزمره عرضه شده است. این مدل با سرعت ۱۰۰ تا ۱۵۰ توکن بر ثانیه و قیمت کمتر ۰.۴ دلار ورودی و ۲ دلار خروجی همچنان از پردازش چندرسانهای شامل تصویر، صدا و ویدیو پشتیبانی میکند.هر دو مدل دارای پنجره زمینه یکمیلیونتوکنی هستند؛ قابلیتی که امکان پردازش حدود ۷۵۰ هزار کلمه را در یک مکالمه واحد فراهم میکند.
در آزمون SWE‑bench Pro که معیار مهمی برای ارزیابی توانایی مدلها در حل مسائل واقعی برنامهنویسی است مدل MiMo‑V۲.۵‑Pro توانسته ۵۷.۲ درصد از وظایف را با موفقیت حل کند؛ رقمی که بهطور قابلتوجهی بالاتر از میانگین ۲۵ درصدی سایر مدلها است، همچنین در معیارهایی همچون T3-bench و ClawEval عملکرد این مدل در سطح مدلهای پیشرفته بازار، همچون Claude Opus ۴.۶ و GPT‑۵.۴ گزارش شده است، با این حال در آزمون چندرشتهای Humanity’s Last Exam این مدل به امتیاز ۴۸ درصد دست یافته در حالی که مدل GPT‑۵.۴ توانسته امتیاز ۵۸.۷ درصد را ثبت کند.
مدلهای جدید MiMo هماکنون از طریق AI Studio شیائومی در دسترس هستند و توسعهدهندگان میتوانند از طریق Xiaomi MiMo API نیز به آنها متصل شوند؛ شیائومی اعلام کرده که در حال توسعه نسل بعدی مدلهای خود با تمرکز بر استدلال عمیقتر، ادغام پیشرفتهتر ابزارها و ریشهمندی بیشتر در جهان واقعی است.