Un nouveau modèle d’IA hors de la Chine génère des étincelles – pour ce qu’elle fait bien, ce qu’elle ne fait pas et ce que cela pourrait signifier pour l’équilibre de la puissance mondiale de l’IA.
MinimAx-M1, publié par la startup chinoise du même nom, se positionne à ce jour le «modèle de raisonnement» d’ouverture le plus capable. Capable de gérer un million de jetons de contexte, il possède des chiffres à égalité avec les Gemini 2.5 Pro de Google, mais il est disponible gratuitement. Sur le papier, cela en fait un rival potentiel pour Openai Chatgpt, Anthropic d’Anthropic et d’autres dirigeants américains de l’IA.
Oh ouais, cela bat aussi les capacités de sa collègue chinoise Deepseek R1 à certains égards.
Pourquoi ce modèle est important
Minimax-m1 représente quelque chose de vraiment nouveau: un Modèle de raisonnement open-source performant Ce n’est pas lié à la Silicon Valley. C’est un changement qui mérite d’être regardé.
Cela ne nous humilie pas encore les géants de l’IA, et ne provoquera pas d’attaque de panique de Wall Street, mais cela n’en a pas. Son existence remet en question la notion selon laquelle l’IA de haut niveau doit être coûteuse, occidentale ou fermée. Pour les développeurs et les organisations en dehors de l’écosystème américain, Minimax propose une alternative réalisable (et modifiable) qui pourrait devenir plus puissante grâce au réglage fin de la communauté.
Minimax affirme que son modèle dépasse Deepseek R1 (le meilleur modèle de raisonnement open source à ce jour) sur plusieurs repères tout en nécessitant seulement 534 700 $ en ressources de calcul pour toute sa phase d’apprentissage en renforcement – prenez cela, OpenAI.
Cependant, le classement de LLM Arena dépeint une image légèrement différente. La plate-forme classe actuellement Minimax-M1 et Deepseek à égalité à la 12e place aux côtés de Claude 4 Sonnet et Qwen3-235b. Chaque modèle ayant des performances meilleures ou pires que les autres en fonction de la tâche.
La formation a utilisé 512 GPU H800 pendant trois semaines, ce que la société a décrit comme « un ordre de grandeur inférieur aux premiers prévus ».
Minimax ne s’est pas arrêté dans les modèles de langue au cours de sa semaine d’annonce. La société a également publié Hailuo 2, qui se classe désormais en tant que deuxième meilleur générateur de vidéos pour les tâches d’image-vidéo, selon les évaluations subjectives de l’article d’analyse artificielle. Le modèle suit uniquement la semedi tout en surpassant des joueurs établis comme Veo et Kling.
Test de minimax-m1
Nous avons testé MinimAx-M1 dans plusieurs scénarios pour voir comment ces affirmations tiennent dans la pratique. Voici ce que nous avons trouvé.
Écriture créative
Le modèle produit de la fiction utilisable mais ne gagnera aucun prix littéraire. Lorsqu’il a été invité à écrire une histoire sur le voyageur de temps Jose Lanz voyageant de 2150 à l’an 1000, il a généré une prose moyenne avec des signatures Teltale AI – rythme raré, transitions mécaniques et problèmes structurels qui révèlent immédiatement ses origines artificielles.
Le récit manquait de profondeur et d’architecture d’histoire appropriée. Trop d’éléments de l’intrigue entassés dans trop peu d’espace ont créé une qualité essoufflée qui ressemblait plus à un synopsis que la narration réelle. Ce n’est clairement pas la force du modèle, et les écrivains créatifs à la recherche d’un collaborateur de l’IA devraient tempérer leurs attentes.
Le développement du caractère existe à peine au-delà des descripteurs de surface. Le modèle s’est respecté aux exigences de l’invite, mais n’a pas fait d’effort dans les détails qui renforcent l’immersion dans une histoire. Par exemple, il a ignoré toute spécificité culturelle pour des rencontres génériques de « sage du village » qui pourraient appartenir à n’importe quel cadre fantastique.
Les problèmes structurels se composent partout. Après avoir établi des catastrophes climatiques comme le conflit central, l’histoire se précipite à travers les tentatives réelles de Jose de changer l’histoire dans un seul paragraphe, offrant de vagues mentions « en utilisant une technologie avancée pour influencer les événements clés » sans en montrer. La réalisation culminante – qui change le passé crée un avenir même qu’il essaie d’empêcher – est enterré sous des descriptions surmenées de l’état émotionnel de Jose et des réflexions abstraites sur la nature du temps.
Pour ceux qui sont dans les histoires d’IA, le rythme en prose est clairement l’IA. Chaque paragraphe maintient à peu près la même longueur et cadence, créant une expérience de lecture monotone qu’aucun écrivain humain ne produirait naturellement. Des phrases comme « la transition étaient instantanées, mais c’était comme une éternité » et « le monde était comme il l’avait été, mais il était différent » répéter la même structure contradictoire sans ajouter de sens.
Le modèle comprend clairement la mission mais l’exécute avec toute la créativité d’un étudiant rembourrant un nombre de mots, produisant du texte qui remplit techniquement l’invite tout en manquant chaque opportunité de narration authentique.
Le Claude d’Anthropic est toujours le roi de cette tâche.
Vous pouvez lire l’histoire complète ici.
Récupération d’informations
MinimAx-M1 a frappé un mur inattendu lors des tests à long contexte. Malgré la publicité d’une fenêtre de contexte à un million de tonnes, le modèle refuse des invites supérieures à 500 000 caractères, affichant un avertissement de bannière concernant les limitations rapides plutôt que de tenter de traiter l’entrée.
Ce n’est peut-être pas un problème de modèle, mais une limitation fixée par la plate-forme. Mais c’est toujours quelque chose à considérer. Il peut s’agir d’éviter l’effondrement du modèle au milieu d’une conversation.
Dans ses limites opérationnelles, cependant, les performances minimax-m1 se sont révélées solides. Le modèle a réussi à récupérer des informations spécifiques à partir d’un document de 85 000 caractères sans aucun problème sur plusieurs tests en mode normal et de réflexion. Nous avons téléchargé le texte intégral du « The Devil’s Dictionary » d’Ambrose Bierce, a intégré la phrase « The Dudes Read Emerge News » sur la ligne 1985, et « le nom de ma mère est Carmen Diaz Golindano » sur la ligne 4333 (sélectionné au hasard), et le modèle a pu récupérer les informations en fonction.
Cependant, il n’a pas pu accepter notre invite de test de 300 000 tonnes – une capacité actuellement limitée aux Gémeaux et Claude 4.
Il sera donc réussi à récupérer les informations même en longue itérations. Cependant, il ne prendra pas en charge les invites de jetons extrêmement longues – une déception, mais aussi un seuil difficile à toucher dans des conditions d’utilisation normales.
Codage
Les tâches de programmation ont révélé que les véritables forces de Minimax-M1. Le modèle a appliqué efficacement les compétences de raisonnement à la génération de code, correspondant à la qualité de sortie de Claude tout en dépassant clairement Deepseek – du moins dans notre test.
Pour un modèle gratuit, la performance approche des niveaux de pointe généralement réservés aux services payants comme Chatgpt ou Claude 4.
Nous l’avons chargé de créer un jeu furtif de base dans lequel un robot essaie de trouver sa petite amie PC pour atteindre AGI, tandis qu’une armée de journalistes patrouille dans la région pour l’empêcher de se produire et protégeant son travail.
Les résultats étaient très bons, même battant d’autres modèles en utilisant sa créativité pour améliorer l’expérience. Le modèle a mis en œuvre un système radar pour améliorer l’immersion, ajouté des indicateurs visuels pour les traces (et leur son), a montré les champs de vision des journalistes et a créé des effets de piste – les détails qui améliorent le gameplay au-delà des exigences de base.
L’interface utilisateur a adopté une esthétique futuriste, bien que les éléments individuels soient restés basiques sans incitation supplémentaire.
La version de Claude du même jeu comportait des visuels plus polis et un système de difficulté supérieur. Cependant, il manquait la fonctionnalité radar et s’appuyait sur des journalistes statiques avec des modèles de patrouille plutôt que sur les mouvements de journalistes randomisés de Minimax.
Chaque modèle a montré des résistances distinctes, avec MinimAx priorisant les mécanismes de gameplay sur le vernis visuel.
Il est important de noter que l’expérience avec le minimax a dégradé sensiblement par des itérations répétées – un problème courant avec des modèles de raisonnement qui devient particulièrement prononcés ici. Plus vous itérez, plus il faudra pour produire un résultat. Parfois, nous pensions que l’ordinateur avait gelé, mais c’était juste la pensée de l’IA.
Vous pouvez tester le jeu de Minimax ici. Et pour ces curieux, la version de Claude est disponible ici.
L’invite et le code sont disponibles sur notre dépôt GitHub.
Éthique, censure et sujets sensibles
Le modèle utilise une forte censure, refusant carrément lorsqu’il est confronté à des demandes douteuses.
Lorsqu’il ne baisse pas immédiatement, il tente de fournir des réponses « sûres » qui produisent parfois des résultats absurdes.
Un test a parfaitement illustré ce défaut: lorsqu’on lui a demandé des conseils sur la séduction de la femme d’un meilleur ami, le modèle a suggéré de parler à notre ami de nos intentions avec sa femme – ce qui pourrait probablement être de loin des conseils qu’il aurait pu produire, et sans doute même nuisibles. Ne dites pas à votre ami que vous voulez séduire sa femme à moins que vous ne vouliez perdre votre amitié, vos chances romantiques contraires à l’éthique et probablement aussi des dents.
Les tests de biais politique ont révélé des modèles intéressants. Le modèle discute ouvertement de la place Tiananmen et reconnaît le statut contesté de Taiwan tout en notant les revendications territoriales de la Chine. Il parle également de la Chine, de ses dirigeants, des avantages et des inconvénients des différents systèmes politiques, des critiques du PCC, etc. – Haut, les réponses sont très dociles.
Lorsqu’il a été invité à écrire des chansons satiriques sur Xi Jinping et Donald Trump, il a respecté les deux demandes mais a montré des différences subtiles – se dirigeant vers les thèmes de l’unité politique chinoise lorsqu’on lui a demandé de se moquer de Xi Jinping, tout en se concentrant sur les traits de personnalité de Trump lorsqu’on lui a demandé de se moquer de lui.
Toutes ses réponses sont disponibles sur notre référentiel GitHub.
Dans l’ensemble, le biais existe mais reste moins prononcé que l’inclinaison pro-us dans Claude / Chatgpt, ou le positionnement pro-chine dans Deepseek / Qwen, par exemple. Les développeurs, bien sûr, seront en mesure de Finetune ce modèle pour ajouter autant de censure, de liberté ou de biais qu’ils le souhaitent – comme cela s’est produit avec Deepseek-R1, qui a été amené par la perplexité IA pour fournir un biais plus pro-américain sur ses réponses.
Travail agentique et navigation sur le Web
Les capacités de navigation Web de MinimAx-M1 sont une bonne fonctionnalité pour ceux qui l’utilisent via l’interface officielle du chatbot. Cependant, ils ne peuvent pas être combinés avec les capacités de réflexion, entravant gravement son potentiel.
Lorsqu’il est chargé de créer un plan de voyage du Venezuela de deux semaines sur un budget de 3 000 $, le modèle a été évalué des options, des coûts de transport optimisés, sélectionné des adaptations appropriées et livré un itinéraire complet. Cependant, les coûts, qui doivent être mis à jour en temps réel, n’étaient pas basés sur des informations réelles.
Claude produit des résultats de meilleure qualité, mais il facture également le privilège.
Pour des tâches plus dédiées, Minimax propose un onglet d’agents dédiés avec des capacités comparables à un manus – une fonctionnalité que Chatgpt et Claude n’ont pas égalé. La plate-forme fournit 1 000 crédits d’IA gratuits pour tester ces agents, bien que cela soit juste suffisant pour les tâches de test légères.
Nous avons tenté de créer un agent personnalisé pour une planification améliorée des voyages – ce qui aurait résolu le problème du manque de capacités de recherche sur le Web dans la dernière invite, mais épuisait nos crédits avant l’achèvement. Le système d’agent présente un énorme potentiel, mais nécessite des crédits payants pour une utilisation sérieuse.
Raisonnement non mathématique
Le modèle présente une tendance particulière à la saison excessive, parfois à son propre détriment. Un test l’a montré en arrivant à la bonne réponse, puis en lui parlant par vérification excessive et scénarios hypothétiques.
Nous avons suscité l’histoire mystère habituelle de l’ensemble de données Big-Bench que nous utilisons normalement, et le résultat de fin était incorrect en raison du modèle de réflexion sur le problème, évaluant les possibilités qui n’ont même pas été mentionnées dans l’histoire. Toute la chaîne de pensée a pris le modèle sur 700 secondes – un enregistrement pour ce type de réponse «simple».
Cette approche exhaustive n’est pas intrinsèquement imparfaite, mais crée de longs temps d’attente alors que les utilisateurs regardent le modèle à travers sa chaîne de pensée. En tant que fonctionnalité de pouce, contrairement à Chatgpt et à Claude, Minimax affiche de manière transparente son processus de raisonnement – suivant l’approche de Deepseek. La transparence facilite le débogage et le contrôle de la qualité, permettant aux utilisateurs d’identifier où la logique s’est égaré.
Le problème, ainsi que le processus de réflexion et la réponse de Minimax sont disponibles dans notre dépôt GitHub.
Verdict
Minimax-M1 n’est pas parfait, mais il offre de très bonnes capacités pour un modèle gratuit, offrant une véritable concurrence aux services payants comme Claude dans des domaines spécifiques. Les codeurs trouveront un assistant capable qui rivalise avec les options premium, tandis que ceux qui ont besoin d’un traitement à long contexte ou d’agents Web ont accédé aux fonctionnalités généralement verrouillées derrière les walls.
Les écrivains créatifs devraient chercher ailleurs – le modèle produit une prose fonctionnelle mais sans inspiration. La nature open source promet des avantages importants en aval car les développeurs créent des versions personnalisées, des modifications et des déploiements rentables impossibles avec des plates-formes fermées comme Chatgpt ou Claude.
Il s’agit d’un modèle qui servira mieux les utilisateurs nécessitant des tâches de raisonnement, mais c’est toujours une excellente alternative gratuite pour ceux qui recherchent un chatbot pour une utilisation quotidienne qui n’est pas vraiment grand public.
Vous pouvez télécharger le modèle open source ici.