Todas as postagens

Resolvendo o Grid World Com MDP

Descubra como resolver o Grid World usando *Dynamic Programming* e C++ 20. Um guia prático e matemático para entender a solução de MDPs, desde as equações de Bellman até a...

Um Mundo Inteiro em uma Grade

O Reinforcement Learning (RL) com o Grid World! 🚀 Um guia prático e didático para iniciantes construírem uma base sólida em IA. Domine MDPs e algoritmos essenciais de RL explorando...

Entendendo Markov Decision Process

A primeira parte do capítulo sobre MDP, com código em C++ 20, os motivos impulsionaram Markov e o que ele descobriu que levaria ao RL.

Reinforcement Learning: História

Nos últimos anos a aprendizagem por reforço (*reinforcement learning - *RL**) tem chamado a atenção da mídia que cobre inteligência artificial em todo o mundo. Sua trajetória, no entanto, é...

Deepseek-R1: explicado de forma simples

Para entender o DeepSeek-R1 e Reinforcement Learning usando como base o artigo de lançamento com um pouco mais de profundidade e didática.

DeepSeek AI: Revolução na Eficiência Pode Abalar o Mercado

DeepSeek AI prova: tamanho não é documento na IA! Com inovações disruptivas e um orçamento 20x menor, eles estão desafiando o status quo. Prepare-se para um mercado mais acessível e...