Mellum2 : le modèle MoE open-source de JetBrains pour le code

4 min de lecture · Hugging Face Blog · 1 juin 2026 IA générative 8/10 Moyen

JetBrains présente Mellum2, un modèle MoE open-source de 12 milliards de paramètres spécialisé dans le traitement du texte et du code. Avec seulement 2.5B paramètres activés par token, il offre une inférence 2x plus rapide que des modèles de taille comparable. Le modèle cible spécifiquement les workflows logiciels sensibles à la latence.

« Mellum2 delivers competitive benchmark performance while achieving more than 2x faster inference. » — Hugging Face Blog

Que faut-il retenir ?

Mellum2 est un modèle MoE de 12 milliards de paramètres avec seulement 2.5B activés par token.
Le modèle offre des performances comparables aux modèles similaires avec une inférence 2x plus rapide.
Mellum2 est spécialisé pour le texte et le code sous licence Apache 2.0.
Cas d'usage : routage, pipelines RAG, sous-agents et déploiements privés.

Pourquoi cette nouvelle compte-t-elle ?

Mellum2 répond au besoin croissant de modèles spécialisés et efficaces pour les workflows logiciels. Son architecture MoE et sa vitesse d'inférence en font une solution pertinente pour les systèmes nécessitant des opérations à faible latence comme le routage ou le RAG. Son ouverture permet des déploiements privés sécurisés.

2.5B paramètres activés par token

Public concerné : développeurs, entreprises

Quels sont les avantages de Mellum2 par rapport à d'autres modèles génératifs ?

Mellum2 se distingue par son architecture MoE qui n'active que 2.5B paramètres par token, permettant une inférence 2x plus rapide que des modèles de taille similaire. Il est spécialement optimisé pour les tâches de traitement de texte et de code avec une licence open-source Apache 2.0.

Voir l'article original → Lire en français

🔧 Outils mentionnés

Avec

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre