Selecione uma única palavra-alvo. O SkipGram usará apenas o vetor dessa palavra para tentar prever todas as palavras do contexto simultaneamente.
Não há média aqui. O vetor de entrada é diretamente o embedding da palavra alvo selecionada.
Uma única distribuição é gerada. No SkipGram, o erro (Loss) penaliza essa única distribuição baseada em quantas palavras reais do contexto ela errou.