Les modèles d’IA en Chine connaissent une évolution rapide depuis plusieurs années. Après une période marquée par la course aux paramètres et aux performances, de nouveaux critères semblent désormais attirer l’attention des entreprises et des développeurs.

Récemment, le lancement de MiMo-V2.5-Pro-UltraSpeed par Xiaomi a suscité un vif intérêt. Selon les données publiées par l’entreprise, plus de 66 000 demandes d’accès ont été enregistrées en moins de deux semaines. Au-delà du modèle lui-même, c’est surtout sa vitesse d’exécution qui a retenu l’attention du marché.

Cette tendance pourrait révéler une évolution plus profonde dans la manière dont les modèles d’IA en Chine sont désormais évalués.

Vous souhaitez vous développer sur le marché chinois ?

La concurrence entre les modèles d’IA évolue

Au cours des dernières années, la compétition s’est principalement concentrée sur la taille des modèles et leurs capacités générales.

Les entreprises ont successivement présenté des modèles comptant des centaines de milliards, puis des milliers de milliards de paramètres. Dans le même temps, les classements et les benchmarks sont devenus des références importantes pour mesurer les performances.

Cependant, à mesure que l’intelligence artificielle s’intègre aux usages professionnels, de nouvelles attentes émergent. Les entreprises ne recherchent plus uniquement des modèles puissants ; elles s’intéressent également à leur efficacité dans des situations réelles.

Ainsi, les modèles d’IA en Chine ne sont plus évalués uniquement sur leurs performances théoriques, mais aussi sur leur capacité à répondre rapidement aux besoins des utilisateurs.

Pourquoi l’efficacité devient-elle un critère essentiel ?

L’IA est aujourd’hui utilisée dans de nombreux secteurs, notamment la finance, le droit, la logistique, l’industrie ou encore le service client.

Dans ces contextes, les entreprises doivent souvent traiter de grandes quantités d’informations. Une réponse plus rapide peut donc avoir un impact direct sur la productivité et les coûts opérationnels.

C’est précisément ce qui explique l’intérêt suscité par MiMo-V2.5-Pro-UltraSpeed. Selon Xiaomi, le modèle peut dépasser les 1000 tokens par seconde, avec des pics proches de 1200 tokens/s. Cette performance place la vitesse d’inférence IA au centre des discussions.

Par ailleurs, Xiaomi a adopté plusieurs technologies destinées à optimiser les performances. Le modèle repose sur une architecture MoE (Mixture of Experts), avec un total d’environ 1 000 milliards de paramètres, mais seulement 42 milliards activés lors d’une requête.

L’entreprise utilise également des techniques telles que la quantification FP4, le décodage spéculatif DFlash et le moteur d’inférence TileRT. Ensemble, ces optimisations permettent d’améliorer la vitesse tout en limitant la consommation de ressources.

Évolution des modèles d’IA en Chine

Quand la vitesse devient un avantage concurrentiel

Aujourd’hui, la compétition ne repose plus uniquement sur la taille des modèles.

De plus en plus d’entreprises recherchent des solutions capables d’offrir un équilibre entre puissance, rapidité et coût d’utilisation. Dans de nombreux cas, un modèle plus rapide apporte davantage de valeur qu’un modèle légèrement plus performant mais plus lent.

Cette évolution concerne l’ensemble du marché. De DeepSeek à Tongyi d’Alibaba, en passant par Hunyuan de Tencent ou MiMo de Xiaomi, les acteurs chinois explorent différentes approches afin d’améliorer l’efficacité de leurs modèles.

Dans ce contexte, la vitesse devient progressivement un facteur de différenciation. Elle influence non seulement l’expérience utilisateur, mais aussi la capacité des entreprises à déployer l’IA à grande échelle.

L’exemple de Xiaomi montre que les attentes du marché évoluent. Lorsque les performances des modèles commencent à se rapprocher, l’efficacité opérationnelle et la rapidité d’exécution prennent davantage d’importance.

À l’avenir, la concurrence entre les modèles d’IA en Chine pourrait donc se jouer autant sur la création de valeur que sur les capacités techniques elles-mêmes.

Comprendre l’évolution des modèles d’IA en Chine

STAiiRS suit de près les modèles d’IA en Chine, les avancées en inférence IA ainsi que les tendances liées à l’innovation en intelligence artificielle, afin d’aider les entreprises internationales à mieux comprendre l’évolution du marché chinois.

Alors que les besoins des entreprises continuent de croître, l’efficacité, la vitesse et les usages concrets pourraient devenir les principaux moteurs de la prochaine phase de développement des modèles d’IA en Chine.