Anthropic réduit les hallucinations de Claude
Anthropic a réduit les hallucinations de son modèle Opus 4.8 en lui apprenant à dire « je ne sais pas ». Le modèle passe quatre fois moins de bugs ignorés dans le code et propose des fonctionnalités comme Dynamic workflows pour les gros projets.
« Opus 4.8 laisserait passer quatre fois moins de défauts sans les signaler par rapport à la version précédente. » — Siecle Digital
Que faut-il retenir ?
- Opus 4.8 signale quatre fois moins de bugs ignorés dans le code que la version précédente.
- Dynamic workflows permet de découper un projet en morceaux et de lancer des centaines de sous-agents en parallèle.
- Le prix du mode rapide est réduit à 10 dollars par million de tokens en entrée et 50 en sortie, soit trois fois moins.
- Anthropic gagne 4,9 points sur SWE-Bench Pro et 8,5 points sur Terminal-Bench.
Pourquoi cette nouvelle compte-t-elle ?
Cette avancée réduit les erreurs dans les projets logiciels et optimise les coûts, crucial pour les développeurs et entreprises. La transparence accrue des modèles renforce la confiance, tandis que les économies de tokens impactent directement les budgets.
4 fois moins de bugs ignorés dans le code
Public concerné : développeurs, entreprises
Comment Anthropic réduit-il les hallucinations de Claude ?
Anthropic a entraîné Opus 4.8 à signaler ses doutes et éviter les affirmations non étayées, réduisant ainsi les hallucinations. Le modèle passe aussi quatre fois moins de bugs ignorés dans le code.