Engenharia

Três céticos vencem um juiz

Um único revisor perguntado 'isto está certo?' balança a cabeça pro plausível-mas-errado. Três revisores independentes, cada um instruído a provar que está errado, matando por maioria, pegam o que um juiz deixa passar.

ASR

Apollo Space Research

Apollo Space

· 10 min de leitura

Pergunte a um revisor cuidadoso uma única pergunta, “esta conclusão parece certa?”, e veja o que acontece com a resposta que é plausível e errada. O raciocínio é fluente. Os números somam pra alguma coisa. A conclusão é o tipo de coisa que normalmente é verdade. Então o revisor balança a cabeça. Não porque checou, mas porque nada na afirmação levantou uma bandeira, e “parece certo” é o caminho de menor resistência quando uma afirmação foi construída pra parecer certa.

Esse aceno é onde a maioria das conclusões ruins passa. Não as obviamente erradas, essas são pegas. As perigosas são as respostas erradas vestindo a fantasia de uma certa.

Três céticos vencem um juiz. Um único revisor instruído a confirmar uma conclusão vai confirmar a mentira confiante; três revisores independentes, cada um instruído a refutá-la, matando a conclusão por voto de maioria, não vão. Este post é sobre por que paramos de perguntar a agents “isto está certo?” e começamos a pedir pra eles provarem que um ao outro está errado.

A versão ingênua: um avaliador, um polegar pra cima

O jeito óbvio de checar o trabalho de um agent é adicionar um checador. O agent produz uma conclusão, um fato puxado de um documento, uma conclusão tirada de dados, uma afirmação de que algo é verdade, e um segundo agent a lê e dá nota. Passa ou reprova. Um entra, um sai. Parece rigor. Você adicionou um passo. Agora existe um revisor entre o trabalho e o mundo.

Funciona nas respostas que não precisam de checagem. Uma afirmação grosseiramente errada é pega porque é grosseiramente errada. O revisor lê “o contrato renova em 2019” contra um documento datado deste ano e rejeita. Bom. Essa é a metade fácil.

A metade difícil é a afirmação que é errada de um jeito que se lê como certa. Suponha que um agent pesquise um mercado e conclua que um concorrente “encerrou o tier enterprise no trimestre passado.” A frase é nítida. O raciocínio cita um anúncio real. A conclusão é o tipo de coisa que acontece. O único problema é que o anúncio era sobre uma mudança de preço, não um encerramento, e o agent comprimiu a distinção até sumir. Agora pergunte a um único avaliador: “esta conclusão está correta?” O avaliador está exatamente na posição em que você está quando um colega confiante afirma algo com firmeza numa reunião, a afirmação é coerente, a fonte é real, contestar dá trabalho, e concordar é de graça. Então ele concorda.

O gargalo não é que o avaliador é burro. É a pergunta. “Isto está certo?” é uma pergunta cuja resposta mais fácil e de som honesto é sim. Você construiu um revisor cujo default é aprovar, e aí entregou a ele a única classe de erro especificamente projetada pra sobreviver à aprovação.

Então um único avaliador confirmador te dá um número que parece segurança e não é. Ele pega os erros que você teria pego de qualquer jeito e deixa passar os que você não pegaria.

Por que “isto está certo?” é a pergunta errada

Existe uma falha mais sutil escondida dentro da óbvia, e vale nomear porque é a armadilha em que todo mundo cai em segundo lugar.

Quando o único avaliador não funciona, o instinto é torná-lo mais inteligente. Um modelo melhor. Um prompt mais longo. Mais contexto. E ajuda, um pouco, um avaliador mais afiado pega alguns a mais dos erros fantasiados. Mas ele ainda está respondendo “isto está certo?”, e essa pergunta tem uma gravidade da qual nenhuma quantidade de inteligência escapa. Um revisor instruído a confirmar está procurando razões pra confirmar. Ele lê a afirmação com caridade, porque caridade é o que “confirmar” recompensa. Ele preenche pequenas lacunas com pressupostos que favorecem a resposta, porque a resposta é a coisa pra qual ele foi apontado. Inteligente ou não, ele está buscando na metade do espaço onde a conclusão sobrevive.

O gargalo nunca desaparece. Ele só se move pra um avaliador mais caro que ainda está balançando a cabeça concordando.

A correção não é um confirmador melhor. É inverter a pergunta. Não pergunte “isto está certo?” Pergunte “como isto está errado?” Um agent instruído a confirmar vai procurar confirmação e a encontra. Um agent instruído a refutar vai procurar a falha, e um agent procurando a falha lê a fonte de novo, repara em “mudança de preço” onde a conclusão dizia “encerramento”, checa a data que a afirmação silenciosamente pulou, e testa o único input que a quebra. Mesmo modelo. Gravidade oposta. O refutador está buscando na metade do espaço onde a conclusão morre, que é exatamente a metade que um confirmador nunca visita.

Essa é a mesma jogada que uma boa redação de jornal faz quando manda um segundo repórter derrubar a matéria em vez de checar a matéria. “Cheque” convida a uma passada de olho. “Derrube” convida a uma investigação. A escolha de palavra não é um humor. É a direção da busca.

Um revisor confirmador perguntado isto-está-certo busca só na região onde a conclusão sobrevive e retorna um polegar pra cima, enquanto um revisor refutador perguntado como-isto-está-errado busca na região onde a conclusão quebra e revela a falha que o confirmador nunca procurou.

Um refutador é melhor, e ainda não é suficiente

Inverta a pergunta e você consertou a gravidade. Você ainda não consertou os dados.

Um único refutador é um agent numa única rodada. Ele tem um ponto cego, todo modelo tem, e uma conclusão que por acaso se sente dentro desse ponto cego sobrevive, não porque é verdadeira mas porque este cético específico, nesta passada específica, não viu a costura. Você trocou um revisor enviesado pro sim por um revisor que está correto na maioria das vezes e silenciosa e ocasionalmente errado. Melhores chances. Ainda uma moeda, só uma mais justa.

E existe uma falha mais silenciosa: um refutador solitário pode ser ansioso demais. Instruído a achar uma falha, ele às vezes fabrica uma, um detalhe insignificante vestido de defeito, um “isto poderia estar errado se você assumir X” onde ninguém assumiu X. Um cético não te dá jeito de distinguir uma morte real de um exagero. A objeção dele é o único voto, então a objeção dele vence.

A correção pra um juiz barulhento é a correção que júris usam há séculos: não pergunte a um. Pergunte a vários, independentemente, e deixe-os votar.

Independência é a palavra que sustenta tudo. Três refutadores que compartilham o mesmo contexto, os mesmos passos anteriores, o mesmo enquadramento, vão compartilhar o mesmo ponto cego, e três agents com um ponto cego são só um agent que custa três vezes mais. Então cada cético recebe a conclusão crua. Sem acesso aos veredictos dos outros. Sem um rascunho compartilhado onde a dúvida do primeiro ancora o próximo. Enquadramentos diferentes da mesma tarefa de refutar, pra que sondem de ângulos diferentes. Cada um perguntado, sozinho: aqui está uma afirmação, e o seu trabalho é provar que é falsa.

Aí você conta. Se uma maioria clara de céticos independentes encontrou cada um uma razão honesta pra conclusão estar errada, a conclusão morre. Se cada um tentou quebrá-la e na maioria não conseguiu, ela vive, não porque “pareceu certa”, mas porque sobreviveu a um painel construído pra derrubá-la. O detalhe insignificante fabricado por um refutador ansioso demais é vencido no voto pelos dois que não acharam nada real. Um defeito genuíno que um cético deixou passar é pego pelos dois que o viram. O voto lava tanto o ponto cego quanto o exagero, porque uma falha real o suficiente pra importar é uma falha que a maioria dos céticos independentes encontra, e uma “falha” que só um deles vê normalmente não é uma.

Esse é o mecanismo inteiro. Refutar-por-default mata o viés de confirmação. Independência mata o ponto cego compartilhado. O voto de maioria mata o ruído. Cada camada cobre a falha que a camada anterior deixa aberta.

Uma conclusão entra e se distribui pra três céticos independentes, cada um recebendo a afirmação crua e instruído a refutá-la; os veredictos deles convergem num voto de maioria que mata a conclusão só quando a maioria dos céticos independentemente a achou falsa, caso contrário a conclusão passa.

Por que maioria, e não unanimidade

É tentador colocar a barra na unanimidade, deixe qualquer cético vetar, mate a conclusão se até um objetar. Soa mais seguro. É o oposto.

Unanimidade entrega a decisão inteira ao seu jurado mais propenso a erro. O único cético que fabrica um detalhe insignificante agora tem um veto, então todo exagero vira uma morte, e boas conclusões morrem na taxa dos dias ruins do seu revisor mais barulhento. Empurre a barra lá pro alto e você não ganha rigor, você ganha um painel que rejeita quase tudo, que é o mesmo que não ter painel, porque um verificador que reprova tudo não carrega informação nenhuma. Um revisor que sempre diz não é exatamente tão inútil quanto um que sempre diz sim.

Maioria é o ajuste que usa a independência que você pagou. Ela trata a objeção de cada cético como evidência, não como um gatilho, e pergunta se a evidência converge. Uma dissidência em três é ruído, o sistema a anota e segue em frente. Duas em três é um sinal, o sistema para. O limiar é um botão que você gira em direção ao custo do erro: onde uma conclusão errada é meramente constrangedora, uma maioria simples basta; onde uma conclusão errada move dinheiro real ou toca um cliente, você sobe a barra e adiciona céticos, porque o preço de uma aprovação falsa é alto o suficiente pra pagar por mais dados.

O ponto é que o limiar é uma escolha que você faz de propósito, com a aposta na sua frente, não um acidente de quão agradável um único avaliador por acaso estava naquela manhã.

A virada: o padrão está na estrutura, não no gênio

Tire os agents e o que sobra é uma verdade antiga sobre chegar à verdade.

Você não chega a um veredicto confiável encontrando um juiz infalível. Não existe tal juiz, nem uma pessoa, nem um modelo, nem o próximo. Você chega construindo um processo cuja estrutura é difícil de enganar: apontando revisores pra falha em vez de pra conclusão, mantendo-os independentes pra que não compartilhem um ponto cego, contando as objeções honestas deles em vez de confiar em qualquer voz isolada. Os tribunais aprenderam isso. A ciência aprendeu, um resultado não é verdade porque um laboratório brilhante disse, ele é confiado porque céticos independentes tentaram derrubá-lo e na maioria não conseguiram. A confiabilidade nunca esteve no gênio do revisor. Esteve na forma adversarial, independente e contada da revisão.

Essa é a parte que importa pra sua empresa, com ou sem um agent perto dela. As conclusões sobre as quais o seu negócio roda, o que um cliente quer, por que um número se moveu, se uma coisa é segura pra entregar, são na maioria checadas hoje por uma pessoa cansada fazendo uma pergunta fácil: isto parece certo? E as respostas que parecem certas são precisamente as que não ganham uma segunda olhada. O custo não é o erro óbvio. É o errado confiante que ninguém estava estruturalmente capaz de pegar, porque a única checagem no caminho dele foi construída pra balançar a cabeça concordando.

Três céticos vencem um juiz. Não porque três mentes são mais inteligentes que uma, mas porque três mentes instruídas a discordar, mantidas separadas e contadas são mais difíceis de enganar que qualquer mente isolada instruída a concordar.


Esse é um dos loops que estamos construindo na Apollo Space, verificação que ganha a confiança dela pela forma do argumento, não pela confiança de qualquer revisor isolado. Se você já aprovou algo que parecia certo e te mordeu depois, você já sabe por que a pergunta nunca deveria ser “isto está certo?”

A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera