Clique em uma palavra para torná-la a Query. O painel calculará como ela presta atenção nas demais palavras (Keys) usando as matrizes do artigo e a Máscara $\mathbf{M} = [1, 0, 1, 0, 1]$.
O foco atual gera a query.
A soma ponderada (pelos pesos de atenção) dos Values ($\mathbf{v}$).
Como a palavra foco avalia cada palavra da sequência. Notar que o mascaramento zera as conexões com $i=1$ e $i=3$ antes do softmax, resultando em pesos iguais a $\exp(0)=1$ na soma.