En novembre 2025, la scène française de l’intelligence artificielle s’est vue bousculée par une révélation inattendue : le gouvernement a dévoilé le premier classement officiel de son comparateur d’IA, compar:IA, et les résultats diffèrent nettement de ceux attendus, plaçant un modèle français moins connu en tête.
Le comparateur français d’IA, une initiative publique unique en son genre
Depuis octobre 2024, la Direction interministérielle du numérique (DINUM) et le ministère de la Culture ont mis en place une plateforme inédite permettant aux utilisateurs de comparer anonymement différentes intelligences artificielles conversationnelles. Dans la majorité des cas, les utilisateurs posent des questions « à l’aveugle » à deux IA, puis sélectionnent la réponse préférée avant de découvrir l’identité des modèles. Ce procédé vise à offrir une évaluation impartiale, mais il garde aussi le mystère sur le profil exact des votants, ce qui complexifie l’interprétation des résultats.

Une méthodologie qui bouleverse les attentes traditionnelles
Ce système d’évaluation contraste fortement avec le fonctionnement des comparateurs internationaux comme LMArena. Tandis que ces derniers se basent souvent sur des critères purement techniques et des analyses d’experts, compar:IA s’appuie sur les préférences réelles des utilisateurs. Il en résulte un classement où des modèles dits « allégés », privilégiant le compromis entre performance et rapidité, dominent les versions lourdes et ultra-performantes reconnues mondialement.
Mistral Medium 3.1, l’outsider qui remporte la première place
Surprise générale : le modèle Mistral Medium 3.1, développé par la jeune pousse française Mistral AI, triomphe dans le classement. Ce modèle, de taille intermédiaire, est conçu pour optimiser le rapport coût/performance en environnement cloud. Il devance nettement des poids lourds comme Gemini 2.5 Flash et Gemini 2.0 Flash, pourtant réputés pour leur agilité et leur vitesse d’exécution. Cette ascension étonne car elle reflète moins la puissance brute que la satisfaction utilisateur dans un contexte d’utilisation réel.
À l’inverse, les versions haut de gamme telles que GPT-5 ou Gemini 2.5 Pro, qui brillent dans les classements traditionnels de LMArena, ne figurent pas dans le top 3 français, soulignant un clivage entre perception locale et reconnaissance internationale. Cette disparité invite à questionner les paramètres d’évaluation : serait-ce un signe que les utilisateurs valorisent aussi la facilité d’accès, la rapidité ou même l’impact environnemental de ces IA ?
Un regard français qui met en lumière des préférences inédites
Le clique autour de Mistral AI ne doit pas être simplement vu comme un choix patriotique, même si les responsables français précisent qu’aucun biais culturel n’a encore été démontré. L’incertitude, quantifiée ici via un intervalle de confiance, montre que la dominance de Mistral Medium 3.1 est stable et que le classement restera toutefois évolutif avec la montée des votes.
Les écarts dans les classements et la place des autres acteurs majeurs
Quelques modèles d’OpenAI apparaissent plus loin dans la liste du comparateur français, notamment gpt-oss-120b, une déclinaison open source, à la septième place. Cette présence démontre l’intérêt croissant pour des modèles ouverts, offrant une alternative aux géants propriétaires comme ChatGPT ou Claude, de Hugging Face. Ce phénomène rejoint les discussions sur les licences logicielles et la responsabilité juridique liées à l’IA, sujets abordés dans les analyses récentes.
Par ailleurs, certaines IA spécialisées telles que DeepL pour la traduction ou Replika pour les interactions émotionnelles, continuent de s’imposer dans leurs niches, bien que moins visibles dans ce classement général. La diversité des usages et des préférences montre que le monde de l’intelligence artificielle est loin d’être homogène et qu’elle impacte désormais des secteurs variés allant du marketing à l’économie circulaire, comme exploré dans ces études sectorielles.
Une plateforme française en pleine évolution
Le ministère de la Culture assure une mise à jour hebdomadaire de ce classement, qui reste vivant et réactif aux nouveaux usages et innovations. Le débat autour des critères d’évaluation – incluant potentiellement le poids écologique ou les aspects éthiques – pourrait transformer profondémment ce palmarès. Dans ce cadre, l’émergence d’acteurs comme Winston AI ou Jasper révèle aussi la montée en puissance d’IA polyvalentes capables de répondre à des besoins toujours plus diversifiés.











