Frank de Alcantara
Pai, marido, professor e engenheiro.
Siga no Twitter

O jogo da imitação: o diploma vem, a competência não

Item: O jogo da imitação: o diploma vem, a competência não
Rating: 5
Author: Frank de Alcantara

Nas últimas décadas, o ensino brasileiro passou por uma transformação profunda. Essa transformação não ocorreu apenas nos currículos, nas tecnologias, nas formas de avaliação ou na expansão do acesso. O que mudou de modo mais silencioso foi a própria estrutura do jogo educacional.

Em muitos contextos, o ensino deixou de ser organizado em torno da compreensão de conceitos, da transferência de conhecimento e da resolução de problemas novos. Em uma educação intelectualmente mais exigente, o professor apresentaria um conhecimento $A$, apresentaria também um conhecimento $B$ e, na avaliação, cobraria um conhecimento $C$, que não foi simplesmente repetido de algo que aconteceu em aula, mas que pode ser inferido pela combinação, adaptação ou generalização de $A$ e $B$ (mais ou menos o que esperamos das ferramentas de IA, ainda que se discuta se elas generalizam ou apenas imitam). Em seu lugar, consolidou-se um modelo no qual o professor apresenta uma técnica, resolve alguns exemplos e depois cobra, principalmente nas avaliações, que os alunos apliquem a mesma técnica a problemas muito parecidos, eventualmente idênticos ou que não requerem combinação, adaptação ou generalização. Neste ponto, a inferência e a criatividade foram substituídas por reconhecimento de padrões. A transferência foi substituída por reprodução. A compreensão foi substituída por memorização.

Chamo esse fenômeno de jogo da imitação.

O nome não é inocente. Alan Turing chamou de imitation game o teste que propôs em 1950 para decidir se uma máquina pensa: se um interlocutor não consegue distinguir as respostas da máquina das de um humano, a máquina passa. Tomo o termo de empréstimo de propósito, porque o critério é o mesmo. O jogo da imitação educacional adota, sem dizê-lo, um critério à la Turing para a aprendizagem: se o desempenho do aluno na prova é indistinguível do desempenho de quem compreende, supõe-se que houve compreensão. A tese deste texto é que essa indistinguibilidade é frágil, porque vale apenas na superfície estreita dos problemas familiares e desaparece quando o problema muda de forma. A simetria com a IA é deliberada e incômoda: a mesma pergunta que faço sobre o aluno, se ele generaliza de fato ou apenas imita padrões, é a que se faz hoje sobre as ferramentas de IA, e é por isso que o empréstimo do termo de Turing me parece adequado. Já havia usado este termo em 2025 no livro Virando a Mesa do Jogo da Imitação.

Neste texto vou tentar fazer com que a esforçada leitora compreenda o problema usando a teoria dos jogos. A teoria dos jogos é minha ferramenta preferida para entender como decisões individuais, quando tomadas em um contexto de interação estratégica, podem levar a resultados coletivos indesejáveis.

Só para deixar claro a favor da honestidade intelectual, eu não sou especialista em teoria dos jogos. Eu sou um professor que se interessa por educação, aprendizagem e avaliação, e que tem uma formação em engenharia eletrônica e computação. A teoria dos jogos é uma das ferramentas que a economia oferece para entender fenômenos sociais complexos. Eu a estudo e uso como lente para analisar o jogo da imitação, mas não sou um teórico dos jogos profissional. Portanto, minha análise é menos formal que a de um especialista.

No jogo da imitação, um dos agentes, o aluno, não precisa compreender profundamente a estrutura do problema. Ele precisa reconhecer a superfície do problema. Se o enunciado tem determinado formato, se os números aparecem de certa maneira, se as palavras se parecem com as palavras usadas no exemplo, então o aluno aplica o procedimento demonstrado pelo professor.

O professor, por sua vez, não precisa necessariamente abandonar, ou suavizar, o conteúdo. Ele pode continuar ensinando o conteúdo formalmente. A diferença é que a avaliação passa a cobrar a reprodução de padrões conhecidos, não a capacidade de usar o conhecimento em situações novas.

O problema central pode ser resumido assim:

\[\text{reprodução correta de uma técnica} \neq \text{aprendizagem robusta}\]

No entanto, dentro do jogo da imitação, a escola ou a universidade frequentemente tende a tratar essas duas coisas como equivalentes:

\[\text{nota alta} \approx \text{aprendizagem}\]

ou:

\[\text{aprovação} \approx \text{competência}\]

Há um outro problema que discutirei em outra oportunidade: a média. Por enquanto, basta dizer que a média é um indicador de desempenho coletivo, mas não é um indicador de aprendizagem individual. Ela pode mascarar a heterogeneidade da turma, a distribuição de notas e a presença de alunos que não aprenderam nada. A média pode ser alta mesmo quando muitos alunos falharam. A média pode ser baixa mesmo quando muitos alunos tiveram bom desempenho. A média é um sinal frágil. Para piorar, ela é um sinal que pode ser manipulado por estratégias de imitação.

Neste artigo pretendo que a atenta leitora compreenda que o professor não precisa ser incompetente, o aluno não precisa ser preguiçoso e a instituição não precisa desejar má formação para que o resultado final seja ruim. Não é necessário que haja má vontade, falta de ética ou intenção de prejudicar. O jogo da imitação funciona mesmo quando todos os agentes têm boas intenções, porque o arranjo de incentivos torna racional para cada agente adotar estratégias que, coletivamente, produzem incompetência nas disciplinas mais avançadas, na pesquisa e/ou na aplicação profissional.

A hipótese é mais incômoda: mesmo quando cada agente age racionalmente dentro dos incentivos que recebe, o sistema pode produzir coletivamente uma formação frágil. A deterioração do aprendizado pode emergir não da intenção individual, mas da estrutura do jogo. O sistema é ruim e, como na fábula do sapo que não nota a água esquentar (fábula, pois o sapo real escapa), os agentes são incapazes de perceber a deterioração porque estão imersos nela e cada um faz o melhor possível. O jogo da imitação é um equilíbrio ruim, mas estável, do ponto de vista da teoria dos jogos.

O que é o jogo da imitação

O jogo da imitação é um arranjo educacional no qual professores, alunos e instituições, os três agentes principais, passam a operar em torno de sinais de aprendizagem, e não necessariamente em torno da aprendizagem efetiva.

O professor ensina uma técnica. O aluno treina a técnica. A avaliação cobra a técnica em situação parecida. A instituição registra a aprovação como evidência de sucesso.

A sequência típica é esta:

\[\text{exemplo demonstrado} \rightarrow \text{exercício semelhante} \rightarrow \text{prova semelhante} \rightarrow \text{aprovação}\]

Essa sequência produz uma aparência de funcionamento. O professor ensinou. O aluno estudou. A prova foi aplicada. A nota foi registrada. A disciplina foi concluída. O indicador administrativo foi satisfeito.

Mas há uma pergunta que permanece aberta:

o aluno aprendeu a resolver problemas ou aprendeu a reconhecer padrões de prova?

Essa distinção é essencial.

A aprendizagem exige que o aluno compreenda a estrutura do problema, reconheça as hipóteses envolvidas, escolha uma técnica adequada, aplique o procedimento corretamente e verifique se a resposta faz sentido. O jogo da imitação permite um atalho: o aluno identifica semelhanças superficiais entre o exercício atual e o exemplo anterior.

Assim, a estrutura cognitiva passa de:

\[\text{problema} \rightarrow \text{modelo} \rightarrow \text{método} \rightarrow \text{solução} \rightarrow \text{verificação}\]

para:

\[\text{formato do enunciado} \rightarrow \text{técnica memorizada} \rightarrow \text{resposta}\]

O modelo, a justificativa e a verificação desaparecem ou tornam-se secundários.

A técnica não é o problema

É importante separar duas coisas.

O problema não é ensinar técnicas. Toda formação marginalmente séria ensina técnicas. Matemática ensina técnicas. Física ensina técnicas. Programação ensina técnicas. Engenharia, medicina, direito, economia e música também ensinam técnicas.

Não há formação intelectual sem métodos, procedimentos, algoritmos, protocolos e rotinas. Que precisam ser repetidos para serem aprendidos. Que precisam ser treinados para serem automatizados. Que precisam ser aplicados para serem compreendidos.

O problema aparece quando a técnica é separada de sua razão de uso, o porquê. Quando isso ocorre, o aluno aprende o procedimento, mas não aprende quando o problema exige aquele procedimento, ou quando ele pode ser adaptado, ou quando ele não é a melhor opção. Também não aprende os limites, as hipóteses que são exigidas, como adaptá-lo ou combiná-lo com outros procedimentos. Talvez o aluno aprenda a aplicar a técnica, mas não aprenda a reconhecer as situações nas quais o procedimento não é adequado ou como justificar a resposta obtida.

Considere a disciplina de cálculo. O professor ensina a técnica de derivação. Ele resolve exemplos de derivação. Ele cobra na prova exercícios de derivação. O aluno aprende a técnica de derivação, mas não aprende a interpretar o significado da derivada, a decidir quando a derivada é o instrumento adequado, a explicar o comportamento da função, a relacionar cálculo simbólico e interpretação geométrica ou a verificar se a resposta faz sentido no contexto. O aluno sabe todas as técnicas de derivação mas é incapaz de calcular o ponto onde o momento fletor de uma viga é máximo.

Portanto, a crítica não é ao ensino técnico procedimental. A crítica é a redução da aprendizagem à imitação de técnicas.

Podemos representar a diferença assim:

\[\text{ensino técnico legítimo} = \text{técnica} + \text{conceito} + \text{justificativa} + \text{transferência}\]

enquanto:

\[\text{jogo da imitação} = \text{técnica} + \text{repetição} + \text{avaliação previsível}\]

A primeira estrutura forma competência. A segunda estrutura forma desempenho localizado em provas.

Eu falei teoria dos jogos?

A teoria dos jogos permite analisar situações em que vários agentes tomam decisões estratégicas em função das ações esperadas dos demais. O ponto central é que o resultado coletivo pode ser inferior mesmo quando cada agente age racionalmente do ponto de vista individual.

No jogo da imitação, os principais jogadores são:

Jogador	Objetivo local provável
Professor	Ensinar o conteúdo, reduzir conflito, tornar a avaliação corrigível, evitar reprovação excessiva e cumprir o programa
Aluno	Maximizar nota, reduzir risco, economizar esforço e avançar no currículo
Instituição	Aumentar aprovação, reduzir evasão, melhorar indicadores e evitar conflito administrativo
Coordenação	Reduzir reclamações, retenção e instabilidade na oferta das disciplinas
Famílias ou financiadores	Obter progressão, diploma e sinais externos de sucesso
Mercado ou sociedade	Receber indivíduos capazes de resolver problemas reais
Avaliadores externos	Medir desempenho por instrumentos frequentemente padronizados

O conflito aparece porque esses jogadores não conseguem observar a mesma variável.

A sociedade precisa de competência. O mercado precisa de autonomia. As disciplinas posteriores precisam de pré-requisitos reais. Mas o sistema educacional mede notas, aprovações, frequência, fluxo, evasão e satisfação.

Neste ponto, o indicador substitui o objetivo.

A aprendizagem deveria ser o objetivo. A nota deveria ser apenas um sinal. No jogo da imitação, a nota passa a ser o objetivo operacional, e a aprendizagem passa a ser inferida a partir dela. Essa inferência é o ponto central do jogo da imitação.

O problema é que a inferência pode ser falsa. Essa falsidade só é percebida quando o aluno precisa usar o conhecimento em uma situação nova, e não consegue. Talvez no mercado, talvez na pesquisa, talvez em uma disciplina posterior. Em um determinado momento, o aluno se depara com um problema que tem a mesma estrutura profunda, mas uma superfície diferente. Ele não consegue reconhecer a estrutura porque nunca aprendeu a reconhecê-la. Ele só aprendeu a reconhecer a superfície.

Estratégias do professor e do aluno

Para simplificar, considere duas estratégias possíveis para o professor:

Estratégia	Descrição
$T$	Ensinar uma técnica e cobrar aplicação semelhante
$C$	Ensinar conceitos, fundamentos, variações e problemas novos

A estratégia $T$ representa o ensino por técnica imitável. A estratégia $C$ representa o ensino orientado à compreensão transferível.

Agora considere duas estratégias possíveis para o aluno:

Estratégia	Descrição
$I$	Imitar padrões, memorizar procedimentos e treinar exercícios semelhantes
$A$	Compreender fundamentos, estudar variações e construir autonomia

A combinação problemática é:

\[(T, I)\]

Isto é:

\[\text{professor ensina técnica imitável} + \text{aluno aprende por imitação}\]

Essa combinação pode produzir bons resultados aparentes: notas razoáveis, aprovação, menor conflito e previsibilidade. Mas ela não garante aprendizagem robusta.

A combinação formativa mais desejável seria:

\[(C, A)\]

Isto é:

\[\text{professor ensina para compreensão} + \text{aluno estuda para autonomia}\]

O problema é que essa segunda combinação tem maior custo imediato para todos os agentes envolvidos no jogo da imitação.

A matriz conceitual do jogo

Podemos representar o jogo de forma simplificada:

	Aluno imita padrões $(I)$	Aluno busca compreensão $(A)$
Professor ensina técnica $(T)$	Alta aprovação, baixo conflito, aprendizagem frágil	Aluno aprende mais do que a avaliação exige, mas paga custo adicional
Professor ensina conceitos $(C)$	Aluno tenta memorizar sem compreender, há maior risco de frustração e reclamação	Aprendizagem robusta, mas com maior custo de tempo, esforço e avaliação

A tabela acima lista consequências observáveis, não as utilidades de cada jogador. Para identificar um equilíbrio, a sagaz leitora precisa de uma matriz de payoffs na qual cada célula informe, separadamente, o que cada jogador recebe. Usando utilidades ordinais de curto prazo, nas quais valores maiores indicam situações preferíveis para aquele jogador, e escrevendo cada célula como o par $(u_{\text{prof}}, u_{\text{aluno}})$, obtemos:

	Aluno imita $(I)$	Aluno compreende $(A)$
Professor ensina técnica $(T)$	$(2,\, 2)$	$(2,\, 1)$
Professor ensina conceitos $(C)$	$(1,\, 0)$	$(3,\, 3)$

A leitura das células é a seguinte. Em $(T, I)$, ambos obtêm um resultado seguro e razoável: o professor evita conflito e correção custosa, o aluno recebe boa nota com baixo esforço. Em $(C, A)$, ambos obtêm o melhor resultado, porque a compreensão transferível é o bem público que beneficia os dois, ainda que ao custo de mais esforço. Em $(C, I)$, o professor cobra compreensão enquanto o aluno apenas imita, e o desencontro produz reprovação, reclamação e frustração, com perda para ambos. Em $(T, A)$, o professor cobra imitação enquanto o aluno estuda em profundidade, de modo que o aluno paga um custo adicional sem recompensa correspondente na avaliação. Note-se que, sob $T$, a utilidade do professor é praticamente insensível à estratégia do aluno: o regime imitativo desacopla o resultado do professor da aprendizagem efetiva do aluno.

O equilíbrio, agora, não é afirmado, é deduzido das melhores respostas (best responses). Se o aluno joga $I$, o professor prefere $T$, pois $2 > 1$. Se o aluno joga $A$, o professor prefere $C$, pois $3 > 2$. Se o professor joga $T$, o aluno prefere $I$, pois $2 > 1$. Se o professor joga $C$, o aluno prefere $A$, pois $3 > 0$. Disso resulta que $(T, I)$ é um equilíbrio de Nash: dado que o outro jogador mantém sua estratégia, nenhum dos dois ganha desviando.

A atenta leitora terá observado que $(C, A)$ também satisfaz essa condição e é, portanto, um segundo equilíbrio de Nash, Pareto-superior ao primeiro. A pergunta de por que o sistema tende a se fixar no equilíbrio pior, e não no melhor, é uma questão de seleção de equilíbrio (equilibrium selection) que examino adiante, ao tratar da estabilidade do equilíbrio.

O equilíbrio $(T, I)$ é atraente porque reduz custo para os dois jogadores.

Para o professor, ele reduz:

incerteza da avaliação;
tempo de correção;
contestações;
reprovação;
desgaste com alunos;
pressão da coordenação;
necessidade de justificar problemas mais abertos;
risco de avaliações negativas.

Para o aluno, ele reduz:

esforço de estudo;
incerteza sobre a prova;
necessidade de abstração;
tempo dedicado à disciplina;
risco de erro em problemas novos;
custo cognitivo de compreender fundamentos.

Para a instituição, ele produz:

aprovação;
previsibilidade;
menor evasão aparente;
menor conflito;
menor retenção;
indicadores administrativos aceitáveis.

O resultado é um equilíbrio estável, contudo pobre em transferência de conhecimento.

Equilíbrio de baixa transferência

Um conceito adequado para esse fenômeno é equilíbrio de baixa transferência.

Transferência é a capacidade de usar um conhecimento aprendido em uma situação diferente daquela em que ele foi originalmente ensinado.

No jogo da imitação, o aluno pode resolver um problema $P_1$ porque viu antes um problema $P_1’$ quase igual. Mas, quando encontra um problema $P_2$ com a mesma estrutura profunda e superfície diferente, falha.

A diferença pode ser expressa assim:

\[\text{imitação} = \text{reconhecimento de superfície}\] \[\text{compreensão} = \text{reconhecimento de estrutura}\]

O aluno treinado pela imitação pergunta:

com qual exemplo este exercício se parece?

O aluno formado pela compreensão pergunta:

que estrutura este problema possui?

Essa diferença muda tudo.

Em matemática, por exemplo, dois problemas podem ter números, palavras e contextos diferentes, mas exigir a mesma estrutura de raciocínio. Em física, o mesmo princípio de conservação pode aparecer em situações aparentemente distintas. Em programação, o mesmo padrão algorítmico pode aparecer em problemas com histórias diferentes. Em engenharia, o mesmo modelo pode sustentar aplicações em domínios variados.

A imitação reconhece a casca. A compreensão reconhece a estrutura.

Por que o equilíbrio é estável

O equilíbrio de baixa transferência é estável porque qualquer tentativa unilateral de sair dele produz custos.

Se o professor decide mudar sozinho e passa a cobrar problemas novos, conceituais ou abertos, pode enfrentar:

aumento da reprovação;
reclamações de que a prova foi diferente da aula;
pior avaliação pelos alunos;
pressão da coordenação;
maior tempo de correção;
necessidade de elaborar rubricas mais complexas;
maior instabilidade nos resultados;
acusação de dificultar artificialmente a disciplina.

Se o aluno decide estudar profundamente, pode enfrentar:

maior custo de tempo;
menor retorno imediato se a avaliação for imitativa;
desvantagem em relação a colegas que treinam diretamente o padrão da prova;
dispersão do estudo;
frustração por estudar conceitos que não são cobrados.

Se a instituição decide mudar uma única disciplina, mas mantém os mesmos indicadores administrativos, o custo aparece localmente, enquanto o benefício pode aparecer apenas anos depois.

Logo, o sistema pode permanecer no equilíbrio ruim mesmo quando todos sabem que ele é ruim.

Esse é o ponto central da teoria dos jogos: o problema não depende apenas da consciência dos jogadores. Depende dos incentivos que tornam certas estratégias mais vantajosas que outras.

Vale precisar a que família de jogos pertence essa estrutura, porque disso depende a forma do remédio. A combinação de duas características — dois equilíbrios de Nash, sendo um deles, $(C, A)$, Pareto-superior ao outro — identifica o jogo como uma caça ao cervo (stag hunt), um jogo de coordenação (coordination game), e não um dilema do prisioneiro (prisoner’s dilemma). A distinção não é terminológica. No dilema do prisioneiro, a deserção é estratégia dominante e o resultado ruim é o único equilíbrio; cooperar é irracional, e nenhuma mudança de expectativas resolve o problema. Na caça ao cervo, cooperar é racional desde que o outro também coopere, e o resultado bom $(C, A)$ é um equilíbrio legítimo, apenas não selecionado. É por isso que a prescrição apresentada adiante pode funcionar: em um jogo de coordenação, deslocar expectativas e payoffs move o sistema para o equilíbrio melhor, ao passo que, em um dilema do prisioneiro, deslocar expectativas, sem alterar a estrutura de payoffs, não basta; seria necessário modificar os incentivos que tornam a deserção uma estratégia dominante.

Há um fato incômodo que a honestidade exige registrar. Com os payoffs da matriz, $(C, A)$ não é apenas Pareto-superior; ele é também risk-dominant. A perda por desvio em $(C, A)$ é, para o professor, $3 - 2 = 1$ e, para o aluno, $3 - 0 = 3$, com produto $1 \times 3 = 3$; em $(T, I)$, as perdas são $2 - 1 = 1$ e $2 - 1 = 1$, com produto $1 \times 1 = 1$. Pelo critério de Harsanyi e Selten, o equilíbrio de maior produto domina em risco, de modo que pelo critério de dominância em risco, o equilíbrio $(C, A)$ seria o candidato selecionado no jogo simultâneo de uma rodada; portanto, a persistência de $(T, I)$ precisa ser explicada por elementos externos à matriz estática. A persistência observada de $(T, I)$ não decorre, portanto, da estática dos payoffs. Ela decorre de três elementos que o modelo simultâneo omite.

O primeiro é a história. O sistema já se encontra em $(T, I)$, e em um jogo de coordenação o equilíbrio vigente funciona como status quo autorrealizável: cada jogador adota $I$ ou $T$ porque espera que o outro o faça, e a expectativa se confirma. O segundo é a estrutura sequencial. O professor não escolhe simultaneamente ao aluno; ele compromete o regime de avaliação antes de observar a resposta da turma. Se antecipa uma turma que jogará $I$, porque foi assim formada, sua melhor resposta é $T$, e o desvio para $C$ o expõe à célula $(C, I)$, a pior para ele. O terceiro, e decisivo, é a cunha institucional.

A instituição penaliza a reprovação, a reclamação e a instabilidade, isto é, exatamente os custos que recaem sobre o professor que joga $C$ sozinho. Modele-se essa penalidade como uma redução $p$ aplicada à utilidade do professor na linha $C$. Enquanto $p$ é pequeno, a caça ao cervo se preserva e $(C, A)$ permanece um equilíbrio acessível. Mas, quando $p > 1$, tem-se $u_{\text{prof}}(C, A) - p < u_{\text{prof}}(T, A)$, ou seja, $3 - p < 2$: mesmo que o aluno jogue $A$, o professor prefere $T$. nesse ponto, $T$ torna-se estratégia dominante para o professor, $(C, A)$ deixa de ser equilíbrio, e o jogo passa a ter um único equilíbrio ruim, produzido por uma assimetria institucional de incentivos. Ele se aproxima do dilema do prisioneiro apenas no resultado agregado indesejável, mas não na estrutura formal completa. A sagaz leitora notará a consequência: não é o aluno preguiçoso nem o professor incompetente que destrói o equilíbrio bom, mas a estrutura de incentivos da instituição, que desloca a própria família do jogo. É também por isso que apelos morais fracassam, e por que a alavanca eficaz é reduzir $p$, isto é, alterar o que a instituição premia e pune.

O jogo da imitação como problema de sinalização

A escola e a universidade precisam sinalizar aprendizagem. Para isso, usam notas, aprovações, históricos, certificados e diplomas.

Esses sinais deveriam representar competência real.

No entanto, no jogo da imitação, o sinal pode ser produzido sem a competência correspondente.

A relação ideal seria:

\[\text{nota alta} \Rightarrow \text{competência transferível}\]

Mas a relação real pode ser:

\[\text{nota alta} \Rightarrow \text{boa reprodução de padrões conhecidos}\]

A nota continua funcionando como sinal administrativo, mas perde parte de sua confiabilidade epistemológica.

Esse é um problema de sinalização imperfeita. O avaliador externo observa o sinal, mas não observa diretamente a competência. O aluno aprovado parece competente porque foi aprovado. Mas a aprovação pode refletir apenas adaptação a um ambiente de avaliação previsível.

O jogo da imitação, portanto, infla o sinal.

O diploma, a nota ou a aprovação dizem menos do que deveriam dizer.

Quando o indicador vira objetivo

A formulação que abre esta seção tem nome e procedência. O enunciado quando uma medida se torna alvo, ela deixa de ser uma boa medida é a versão que Marilyn Strathern deu, em 1997, à Goodhart’s law. Charles Goodhart havia proposto a ideia em 1975, no contexto da política monetária britânica, sob a forma de que toda regularidade estatística observada tende a colapsar quando passa a ser pressionada para fins de controle. Mais próxima ainda do problema educacional está a Campbell’s law, enunciada por Donald Campbell em 1976: quanto mais um indicador social quantitativo é usado para tomar decisões, mais ele fica sujeito a pressões que o corrompem e mais tende a distorcer o próprio processo que deveria medir. Campbell tratava explicitamente de testes de desempenho escolar, o que faz da sua formulação a mais pertinente para o jogo da imitação.

No contexto educacional, isso significa que, quando a nota passa a ser o objetivo central, professores e alunos ajustam suas estratégias para produzir nota. A avaliação deixa de funcionar como instrumento de verificação e passa a funcionar como roteiro de treinamento.

A relação deixa de ser:

\[\text{ensino} \rightarrow \text{aprendizagem} \rightarrow \text{avaliação}\]

e passa a ser:

\[\text{avaliação esperada} \rightarrow \text{treinamento} \rightarrow \text{nota}\]

O sistema começa pelo fim. A pergunta deixa de ser:

o que o aluno precisa compreender?

e passa a ser:

o que provavelmente cairá na prova?

Essa inversão é uma das características centrais do jogo da imitação.

Risco moral

O jogo da imitação contém uma estrutura análoga ao risco moral: os agentes tomam decisões localmente vantajosas porque não suportam integralmente, nem imediatamente, os custos da formação frágil que ajudam a produzir.

Risco moral ocorre quando um agente toma decisões cujos custos serão suportados, em parte, por outros agentes ou por momentos futuros do sistema.

O professor que simplifica a avaliação recebe benefícios imediatos: menos conflito, menos reprovação e correção mais objetiva. O aluno que imita padrões recebe benefício imediato: aprovação com menor custo. A instituição recebe benefício imediato: bons indicadores.

O custo aparece depois.

Aparece quando o aluno precisa resolver um problema novo. Aparece em disciplinas posteriores. Aparece no estágio. Aparece na pesquisa. Aparece no trabalho. Aparece quando a tarefa não se parece com o exemplo da aula.

O custo também aparece quando o aluno não consegue formular problemas, apenas resolver formatos já reconhecidos.

No jogo da imitação, o benefício é imediato e localizado. O custo é diferido e distribuído.

Essa é uma estrutura típica de risco moral.

Jogo de bens públicos

A aprendizagem robusta pode ser vista como um bem coletivo institucional, ou como uma externalidade positiva produzida pela formação de qualidade.

Quando uma escola ou universidade forma alunos capazes de compreender, transferir e resolver problemas novos, todos se beneficiam:

os próprios alunos;
os professores das disciplinas seguintes;
os cursos;
a instituição;
o mercado;
a pesquisa;
a sociedade.

Mas produzir esse bem público exige custo:

aulas mais exigentes;
avaliações melhores;
problemas menos previsíveis;
mais tempo de correção;
mais feedback;
mais estudo;
mais atendimento;
maior tolerância institucional à reprovação legítima;
maior coordenação entre disciplinas;
menor dependência de indicadores imediatos.

Cada agente pode desejar o benefício da aprendizagem robusta, mas preferir que outro agente pague o custo de produzi-la.

O professor quer receber alunos autônomos nas disciplinas posteriores, mas pode evitar impor autonomia em sua própria disciplina. O aluno quer um diploma valorizado, mas pode preferir avaliações previsíveis. A instituição quer reputação, mas pode priorizar fluxo e satisfação. A coordenação quer qualidade, mas pode resistir a reprovações elevadas.

Assim, a compreensão profunda sofre subinvestimento coletivo.

A avaliação define o jogo

No ambiente escolar, a avaliação não apenas mede o aprendizado. Ela define o jogo.

Se a avaliação cobra repetição, o aluno repete. Se cobra exercícios quase iguais aos exemplos, o aluno treina exemplos. Se cobra palavras-chave, o aluno memoriza palavras-chave. Se cobra fórmulas sem interpretação, o aluno memoriza fórmulas. Se cobra procedimentos isolados, o aluno aprende procedimentos isolados.

O comportamento do aluno é uma resposta racional ao mecanismo de recompensa.

O mesmo vale para o professor. Se a instituição pune reprovação, reclamação e instabilidade, mas não recompensa a formação robusta, o professor tende a construir avaliações mais previsíveis e defensáveis.

A avaliação, portanto, não é neutra. Ela produz o tipo de aprendizagem que será buscado.

A mecânica cognitiva da imitação

No jogo da imitação, o aluno aprende uma associação do tipo:

\[E \mapsto P\]

onde:

$E$ é o formato do enunciado;
$P$ é o procedimento a ser aplicado.

O aluno reconhece marcas superficiais:

certas palavras;
certa organização dos dados;
certo tipo de número;
certo desenho;
certa posição da incógnita;
certa semelhança com o exemplo da aula.

A aprendizagem robusta exigiria outro processo:

\[S \rightarrow M \rightarrow P \rightarrow V\]

onde:

$S$ é a situação-problema;
$M$ é o modelo conceitual;
$P$ é o procedimento técnico;
$V$ é a verificação da solução.

O jogo da imitação frequentemente elimina ou enfraquece o modelo $M$ e a verificação $V$.

O aluno passa diretamente da aparência do problema para o procedimento.

Essa é a razão pela qual ele consegue resolver problemas familiares, mas falha quando o problema muda de forma ou quando necessita de compreensão profunda, inferência e generalização.

A ilusão da aprendizagem

O jogo da imitação cria uma ilusão poderosa: a ilusão de que houve aprendizagem porque houve desempenho.

O aluno resolve listas. O professor corrige provas. A turma é aprovada. A instituição registra o sucesso. Tudo parece funcionar.

Mas o desempenho pode estar restrito a uma família estreita de problemas.

O aluno sabe resolver quando:

\[P_{\text{prova}} \approx P_{\text{exemplo}}\]

mas não sabe resolver quando:

\[P_{\text{novo}} \not\approx P_{\text{exemplo}}\]

mesmo que a estrutura profunda seja a mesma.

Isso explica um fenômeno frequente: alunos que foram aprovados em disciplinas anteriores não conseguem usar esse conhecimento em disciplinas posteriores.

A aprovação ocorreu. A transferência não.

A propagação do problema

O jogo da imitação não permanece restrito a uma disciplina. Ele se propaga.

A sequência é relativamente previsível:

uma disciplina passa a cobrar reprodução de procedimentos;
os alunos aprendem a estudar por imitação;
disciplinas posteriores recebem alunos com baixa autonomia;
essas disciplinas reduzem sua própria exigência ou passam a reensinar pré-requisitos;
novas avaliações tornam-se mais previsíveis;
o padrão de formação é recalibrado;
a instituição passa a tratar o novo nível como normal.

Esse processo pode estabilizar um equilíbrio de baixa exigência cognitiva.

A consequência é que o sistema continua funcionando administrativamente, mas com perda progressiva de profundidade intelectual.

Quando os imitadores viram professores

A propagação descrita até aqui ocorre entre disciplinas, dentro de uma mesma geração de alunos. Resta examinar uma propagação mais lenta e mais grave, que ocorre entre gerações de professores. Para isso, é preciso expor um pressuposto silencioso do modelo. Em toda a análise anterior, a estratégia $C$, ensinar para a compreensão, permaneceu disponível ao professor; ela era apenas cara. A matriz de payoffs supõe que o professor pode, se aceitar o custo, criar e corrigir avaliações que exijam transferência. A hipótese que examino agora desafia esse pressuposto: o que ocorre quando o próprio corpo docente passa a ser formado por egressos do jogo da imitação? Considere três gerações sucessivas, cada uma formada por imitação e tornada professora da seguinte.

A primeira geração executa $T$ com competência, mas tem capacidade reduzida de produzir $C$. Construir um problema com a mesma estrutura profunda e superfície nova exige exatamente a compreensão estrutural que o jogo da imitação não forma. Quem aprendeu a reconhecer a casca não fabrica com facilidade uma casca diferente para a mesma estrutura, nem distingue, na correção, o aluno que reconheceu a estrutura daquele que apenas reconheceu outra casca. A estratégia $C$ deixa de ser cara e passa a ser parcialmente inacessível:

\[C: \text{custosa} \rightarrow \text{inacessível}\]

A coluna $C$ da matriz não desaparece no papel, mas esvazia-se na prática.

Na segunda geração, dois efeitos se compõem. O primeiro é a erosão do conteúdo: transmite-se técnica-menos-conceito, porque o que não foi compreendido tende a não ser repassado. O segundo, mais grave, é a perda do meta-nível. O professor da geração zero que jogava $T$ sabia que $C$ existia, e escolhia; o professor da segunda geração joga $T$ porque é o único repertório que possui, sem consciência de que há escolha. O sapo da fábula deixa de notar a temperatura, não por estar imerso, mas por não ter linha de base lembrada. A própria palavra equilíbrio enfraquece aqui, pois pressupõe uma estratégia alternativa para a qual se poderia desviar, e ela já saiu do conjunto de estratégias.

Na terceira geração, o sistema atinge um ponto fixo (fixed point): a imitação é o conteúdo integral transmitido. Surge então um fenômeno que o modelo original não contempla, porque ele supunha a técnica ao menos correta. Trata-se da degradação por cópia (generation loss). Cada repasse perde fidelidade e acumula erro, e, sem compreensão estrutural, não há como detectar quando a própria técnica foi corrompida. O equívoco deixa de ser corrigido e passa a ser canonizado: a concepção errada vira currículo. O estado terminal não é técnica sem conceito; é técnica progressivamente errada, ensinada com a mesma confiança com que se ensinaria a correta.

Três consequências sistêmicas decorrem disso. A primeira é que o diagnóstico deste artigo exige um ponto de vista externo, alguém que saiba o que é transferência. Após três gerações, esse ponto de vista desaparece de dentro do sistema, e os corretores que eu havia designado como externos, avaliadores, coordenação, mercado e as disciplinas seguintes, passam a ser, eles mesmos, produto do jogo. O laço de correção com que o texto contava fica comprometido, e o problema de signaling torna-se total: todos confiam no sinal porque ninguém consegue mais ler a competência subjacente. A segunda é que o equilíbrio se torna mais estável que o original. O equilíbrio descrito antes era estável contra o desvio unilateral; este é estável contra a própria intenção de desviar, porque falta a capacidade. Não se escolhe $C$ quando não se sabe criar $C$. A terceira é que as soluções propostas adiante pressupõem agentes que saibam o que é transferência; depois de três gerações, a reforma interna deixa de ser suficiente, e a recuperação passa a depender de importar a capacidade de fora, por currículos estrangeiros, especialistas externos, pressão da indústria ou literatura técnica de outras tradições.

A esses efeitos, a sagaz leitora pode somar uma seleção que os reforça. O jogo da imitação tende a reter na academia justamente quem foi melhor em imitar: nota alta, progressão, permanência, pós-graduação e docência. Há, portanto, um efeito de sobrevivência (survivorship) que empurra o corpo docente na direção de pessoas otimizadas para imitação, e não para transferência, o que acelera a deriva entre gerações em vez de apenas mantê-la.

Três ressalvas se impõem, em nome da honestidade que este texto persegue, contra a leitura de um colapso determinístico e completo. A primeira é que sistemas reais são abertos, não fechados. Há vazamentos: autodidatas, livros e cursos estrangeiros, material em rede, mobilidade de pessoas formadas em outras tradições e uma minoria que reconstrói a estrutura por conta própria. A previsão realista não é a extinção da competência, mas hysteresis forte, declínio de reversão custosa e dependência de insumos externos para qualquer recuperação. A segunda é que a degradação é desigual entre as áreas. Campos com feedback externo rápido e implacável resistem mais, porque a realidade corrige no lugar do avaliador: a ponte cai, o código quebra, o reator não funciona, o paciente não melhora. Campos de feedback lento e difuso degradam primeiro. Essa é, aliás, uma previsão verificável que o modelo gera, e que distingue a engenharia de áreas em que o erro demora a cobrar seu preço. A terceira é que a própria indústria, ao não conseguir mais operar com os profissionais que recebe, eventualmente força uma recalibração para cima; mas o faz com defasagem de anos e a um custo já incorrido, e nada garante que a instituição leia o sinal a tempo.

Disso resulta uma urgência que o restante do texto apenas insinua. Enquanto há, no corpo docente, quem ainda saiba distinguir estrutura de superfície, o jogo pode ser redesenhado de dentro. Quando essa capacidade se perde, redesenhar o jogo deixa de ser uma questão de incentivos e passa a ser uma questão de reimportar, de fora, aquilo que o sistema esqueceu como se faz. A janela para a correção barata é a geração presente.

Por que culpar indivíduos é insuficiente

É possível encontrar professores que ensinam mal. É possível encontrar alunos que estudam pouco. É possível encontrar instituições que priorizam indicadores inadequados. Mas essas explicações individuais não bastam.

O ponto mais importante é que o jogo da imitação pode funcionar mesmo quando os indivíduos têm boas intenções.

O professor pode querer ensinar bem, mas adaptar-se a turmas grandes, baixo tempo, pressão por aprovação e avaliações institucionais. O aluno pode querer aprender, mas adaptar-se a um sistema que recompensa memorização. A instituição pode querer formar bem, mas operar com métricas que favorecem fluxo, retenção baixa e satisfação imediata.

A teoria dos jogos ajuda exatamente aqui: ela mostra como resultados ruins podem emergir de ações localmente racionais.

A pergunta correta não é apenas:

quem errou?

A pergunta correta é:

que jogo foi desenhado para que essa estratégia se tornasse racional?

Como mudar o jogo

Se o problema é estratégico, a solução não pode depender apenas de apelos morais.

Não basta dizer ao professor: ensine melhor.

Não basta dizer ao aluno: estude mais.

Não basta dizer à instituição: valorize a qualidade.

É necessário alterar os incentivos.

Algumas mudanças possíveis são:

avaliações que incluam problemas novos, não apenas variações de exemplos;
provas com justificativa conceitual obrigatória;
questões que exijam comparação entre métodos;
problemas com dados incompletos ou excesso de dados;
avaliação da capacidade de modelagem;
avaliação da capacidade de verificar a resposta;
rubricas que valorizem raciocínio, não apenas resultado final;
acompanhamento do desempenho em disciplinas posteriores;
avaliação longitudinal de competências;
menor dependência de aprovação como métrica principal;
feedback detalhado;
monitoria orientada por dificuldade conceitual;
integração entre disciplinas;
revisão de pré-requisitos reais;
tolerância institucional à reprovação academicamente justificada;
formação docente voltada a avaliação de transferência.

O objetivo é fazer com que a estratégia racional deixe de ser imitar.

A avaliação precisa recompensar compreensão transferível. Enquanto ela recompensar reprodução previsível, o jogo continuará produzindo imitação.

Um exemplo simples

Vamos voltar a disciplina de Cálculo, comum a todas as engenharias.

No jogo da imitação, o professor ensina uma técnica de derivação, resolve dez exemplos parecidos e cobra na prova cinco exemplos quase iguais. O aluno treina a lista, identifica o padrão e aplica a regra.

Ele pode ser aprovado sem compreender profundamente taxa de variação, aproximação linear, comportamento local de funções ou modelagem de fenômenos.

Em uma avaliação orientada à transferência, o aluno ainda precisaria saber derivar. Mas também precisaria:

interpretar o significado da derivada;
decidir quando a derivada é o instrumento adequado;
explicar o comportamento da função;
relacionar cálculo simbólico e interpretação geométrica;
verificar se a resposta faz sentido no contexto;
adaptar a técnica a um problema menos familiar.

A técnica permanece. O que muda é o jogo.

Outro exemplo: programação

Em programação introdutória, o jogo da imitação aparece quando o professor ensina um padrão de código e cobra uma variação mínima.

O aluno aprende a trocar nomes de variáveis, alterar constantes e reorganizar comandos. Mas pode não aprender a decompor problemas, escolher estruturas de dados, testar hipóteses, depurar, justificar decisões ou analisar casos extremos.

Nesse caso, a aprovação pode sinalizar familiaridade com modelos de código, mas não necessariamente competência algorítmica.

A diferença é esta:

\[\text{imitar código} \neq \text{pensar algoritmicamente}\]

O aluno treinado por imitação pergunta:

qual código parecido eu já vi?

O aluno formado em pensamento computacional pergunta:

qual é a estrutura deste problema e que algoritmo a resolve?

A tese central

O jogo da imitação é um equilíbrio educacional no qual professores, alunos e instituições otimizam sinais de aprendizagem em vez de aprendizagem transferível.

O professor ensina procedimentos reproduzíveis. O aluno treina padrões próximos aos exemplos. A instituição interpreta aprovação como evidência de formação. O arranjo reduz conflito, aumenta previsibilidade e melhora indicadores imediatos.

Mas o custo é alto: o aluno perde autonomia diante de problemas novos.

Pela ótica da teoria dos jogos, trata-se de uma caça ao cervo (stag hunt) repetida e distorcida por incentivos institucionais, com sinalização imperfeita, risco moral, bem público subfinanciado e equilíbrio de baixa transferência. A compreensão profunda é coletivamente desejável, mas individualmente custosa no curto prazo.

Por isso, o sistema pode produzir má aprendizagem mesmo sem incompetência individual, preguiça generalizada ou intenção institucional de formar mal.

Conclusão

O jogo da imitação é uma forma de empobrecimento estrutural do ensino.

Ele não elimina a aula, a prova, a nota ou a aprovação. Pelo contrário, ele preserva todos esses elementos. O que ele altera é a relação entre aprovação e competência.

O aluno aprovado parece ter aprendido. O professor parece ter ensinado. A instituição parece ter funcionado. Mas, quando o conhecimento precisa ser transferido para uma situação nova, a fragilidade aparece.

A teoria dos jogos permite compreender esse fenômeno sem recorrer a explicações simplistas. O problema não está apenas no professor, no aluno ou na instituição. Está no arranjo de incentivos que torna racional ensinar para a prova, estudar por padrão e medir sucesso por aprovação.

Se o jogo recompensa imitação, o sistema produzirá imitação.

Se desejamos compreensão, autonomia e capacidade de resolver problemas novos, então é necessário redesenhar o jogo. Isso significa mudar avaliações, métricas, incentivos, critérios de aprovação e expectativas institucionais.

A questão decisiva não é se o professor explicou a técnica. A questão decisiva é se o aluno consegue usar o conhecimento quando a técnica não aparece claramente indicada no enunciado.

Enquanto a resposta for negativa, a aprovação continuará sendo apenas um sinal frágil de aprendizagem.

E o jogo da imitação continuará funcionando.

03 Jun 2026

« A Engenharia, o Núcleo Comum e a Teoria dos Jogos