Know3D : Contrôler les objets 3D avec des prompts textuels

6 min de lecture · The Decoder · Jonathan Kemper · 4 avr. 2026 IA générative 8/10 Élevé

Know3D permet aux utilisateurs de contrôler la face cachée des objets 3D via des prompts textuels, résolvant un problème majeur dans la génération 3D à partir d'une seule image. Cette méthode utilise des modèles de langage multimodaux pour améliorer la précision.

Que faut-il retenir ?

Know3D utilise Qwen2.5-VL comme modèle de langage et Trellis.2 de Microsoft comme générateur 3D.
Le modèle génère des états intermédiaires porteurs d'informations sémantiques et spatiales.
Know3D obtient les meilleurs scores sur HY3D-Bench pour la correspondance sémantique.
L'approche permet de générer des dos d'objets cohérents avec les instructions textuelles.

Pourquoi cette nouvelle compte-t-elle ?

Know3D offre un contrôle précis sur la génération 3D, ce qui est crucial pour les applications nécessitant des modèles réalistes et cohérents. Cette innovation réduit les erreurs courantes dans la génération 3D et améliore la qualité des résultats, impactant directement les secteurs comme le design industriel et la réalité virtuelle.

Public concerné : développeurs, entreprises

Comment Know3D améliore-t-il la génération 3D à partir d'une seule image ?

Know3D utilise des modèles de langage multimodaux pour générer des états intermédiaires porteurs d'informations sémantiques et spatiales, permettant un contrôle précis de la face cachée des objets 3D.

Voir l'article original → Lire en français

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre