Todas as postagens

Transformers, Do Código à Geração

Nesta aula, mergulhamos fundo na arquitetura completa dos Transformers. Desvendamos o bloco decodificador, incluindo a atenção mascarada e a atenção cruzada, e como ele interage com o codificador para gerar...

Transformers - Prestando Atenção

Neste artigo, partimos da modelagem de sequências textuais. E construímos gradualmente a intuição sobre modelos mais sofisticados, como a atenção, fundamentais para a arquitetura Transformer.

Transformers- Desvendando a Modelagem de Sequências

Neste artigo, mergulhamos na modelagem de sequências textuais. Partimos das Cadeias de Markov, N-grams, e suas limitações, construindo gradualmente a intuição para modelos mais sofisticados capazes de capturar dependências de...

Resolvendo o Grid World Com MDP

Descubra como resolver o Grid World usando *Dynamic Programming* e C++ 20. Um guia prático e matemático para entender a solução de MDPs, desde as equações de Bellman até a...

Multiplicação de Matrizes

Uma introdução a matemática que suporta a criação de transformers para processamento de linguagem natural com exemplos de código em C++20.

Transformers - A Temida Matemática

Uma introdução a matemática que suporta a criação de transformers para processamento de linguagem natural com exemplos de código em C++20.