Encodage positionnel

Q: Pourquoi un Transformer a-t-il besoin d'encodage positionnel ?

Parce que son mécanisme d'attention traite les tokens en parallèle et est insensible à l'ordre ; sans encodage positionnel, il verrait la phrase comme un « sac de mots », sans syntaxe.

Q: Qu'est-ce que RoPE ?

RoPE (Rotary Position Embedding) est une variante moderne d'encodage positionnel, très répandue dans les LLM récents, qui encode la position en « faisant tourner » les vecteurs plutôt qu'en les additionnant.

Abstract

L'encodage positionnel ajoute à chaque token l'information de sa place dans la séquence, pour qu'un Transformer — dont l'attention ignore l'ordre — tienne compte de la position des mots.