La veille

Nemotron 3 Nano Omni : le modèle multimodal de Nvidia

Nemotron 3 Nano Omni : le modèle multimodal de Nvidia

4 min de lecture · The Decoder · Maximilian Schreiner · 29/04/2026 IA générative 9/10 Élevé
Nemotron 3 Nano Omni : le modèle multimodal de Nvidia

Nvidia dévoile Nemotron 3 Nano Omni, un modèle multimodal open-source capable de traiter texte, images, vidéo et audio. Avec 30 milliards de paramètres et une fenêtre contextuelle de 256 000 tokens, il surpasse son prédécesseur sur plusieurs benchmarks.

Points clés

  • Nemotron 3 Nano Omni est un modèle open-source multimodal avec 30 milliards de paramètres et une fenêtre contextuelle de 256 000 tokens.
  • Il utilise un hybride Mamba-Transformer avec Mixture-of-Experts, activant environ 3 milliards de paramètres par requête.
  • Sur le benchmark OSWorld, sa précision passe de 11,1 à 47,4 points par rapport à la version précédente.
  • Nvidia a utilisé 717 milliards de tokens pour l'entraînement, avec des données synthétiques provenant de modèles comme Qwen, GPT-OSS et DeepSeek-OCR.

Pourquoi c'est important

Ce modèle ouvre de nouvelles possibilités pour les applications agentielles, le traitement de documents et l'analyse multimédia. Son architecture hybride et ses performances améliorées en font un outil puissant pour les développeurs et les entreprises. La transparence sur les données d'entraînement et la publication des pipelines sont des atouts majeurs.

Public concerné : développeurs, entreprises

Quels sont les avantages de Nemotron 3 Nano Omni par rapport aux autres modèles multimodaux ?

Nemotron 3 Nano Omni offre une fenêtre contextuelle étendue (256 000 tokens), une architecture hybride performante et des résultats supérieurs sur plusieurs benchmarks. De plus, Nvidia publie les données d'entraînement et les pipelines, ce qui est rare dans l'industrie.

Commentaires (0)

Aucun commentaire pour le moment. Soyez le premier !

🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !