Tese de Automação

Promoções estão mortas. Trust budgets as substituem.

Você não vai promover um agent; você vai ampliar seu trust budget uma tarefa verificada por vez, e o mesmo livro-razão deveria governar suas pessoas.

ASR

Apollo Space Research

Apollo Space

· 10 min de leitura

Uma promoção é um único evento que finge responder mil perguntas. Na sexta alguém é um engenheiro sênior que precisa de aprovação para tocar no código de billing. Na segunda ele é um staff engineer que não precisa. Nada mensurável mudou no fim de semana. O título se moveu porque um comitê decidiu que deveria, e a partir dessa única decisão a empresa agora infere o que essa pessoa pode ser confiada a fazer em dezenas de situações que ninguém de fato avaliou. Fazemos isso com pessoas. Estamos prestes a fazer algo muito mais estranho: tentar fazê-lo com software agents, onde o gap entre “ganhou o título” e “conquistou a confiança” é mais largo e mais perigoso do que já foi.

Existe uma unidade melhor que o título. Achamos que a promoção sempre foi um substituto desajeitado para ela.

Você não vai promover um agent; você vai ampliar seu trust budget uma tarefa verificada por vez, e o mesmo livro-razão deveria governar suas pessoas.

O que uma promoção de fato está tentando fazer

Uma promoção agrupa três coisas que não têm nada a ver umas com as outras: mais pagamento, um novo rótulo, e mais permissão para agir sem perguntar. As duas primeiras são reais. A terceira é a que de fato muda como a empresa roda, e é a que mais erramos.

Pense em “permissão para agir sem perguntar” como um budget, um saldo corrente de quanto a organização vai te deixar comprometer, decidir ou mover antes que outra pessoa tenha que abençoar. Uma pessoa júnior tem um budget pequeno: ela pode gastar algumas horas num palpite, rascunhar uma resposta ao cliente, sugerir uma abordagem. Uma pessoa sênior tem um maior: ela pode aprovar uma arquitetura, aprovar um reembolso, enviar o contrato. O budget é a coisa real. O título é só um snapshot grosseiro e ocasional dele.

O título é um rótulo que colamos na confiança uma vez por ano. A confiança em si se move todo santo dia.

E aqui está o problema de tirar snapshot de uma coisa contínua uma vez por ano: o snapshot está sempre errado. Está errado na subida, a pessoa conquistou o budget mais amplo meses antes do comitê alcançar. E está errado na descida, alguém mantém um budget que os últimos três trimestres de evidência dizem que ele não deveria ter. O título atrasa a confiança em ambas as direções, porque confiança é um fluxo e uma promoção é uma fotografia.

A forma ingênua de dar autonomia a um agent

Então agora você traz um software agent para isso. O instinto ingênuo, e vimos times espertos recorrerem a ele toda vez, é tratar autonomia como uma configuração. Um toggle. Você constrói o agent, testa algumas vezes, ele parece competente, e você o vira para “autônomo”. Título concedido. Ele agora pode agir por conta própria.

A dor sentida chega cerca de uma semana depois, e é sempre do mesmo formato. O agent faz noventa e sete coisas corretamente e a nonagésima oitava é uma ação confiante, fluente e completamente errada tomada com autoridade total, uma mensagem enviada para a lista errada, um registro atualizado que não deveria ter sido, uma decisão tomada num caso que ele nunca tinha de fato visto antes. O toggle não tinha memória de como o agent conquistou a confiança, então não tinha ideia de onde a confiança acabava. Um interruptor binário não consegue codificar “bom em aprovações de reembolso abaixo de um certo valor, não testado em nada acima disso”. Ele só sabe ligado ou desligado. E desligado-ou-ligado é exatamente a resolução na qual uma nova contratação é mais propensa a te machucar.

Este é o bug da promoção, portado para software. Pegamos a pior propriedade de como confiamos em pessoas, a concessão grosseira, de uma vez só, e a automatizamos. O agent não conquistou seu budget ao longo de cem tarefas verificadas. Ele ganhou um título de um comitê de um, numa terça, porque o demo pareceu bom.

À esquerda um único toggle de autonomia vira um agent não testado direto para autoridade total e a primeira tarefa não familiar falha; à direita um trust budget se amplia tarefa por tarefa conforme cada resultado verificado é registrado, então a autoridade só cobre terreno que o agent já provou.

A correção não é um agent mais esperto. Um agent mais esperto virado para “ligado” só comete erros confiantes mais rápido. A correção é parar de conceder confiança como um evento e começar a medi-la como um saldo.

O trust budget: confiança como medidor, não interruptor

Aqui está a unidade que achamos que substitui a promoção. Você não vai promover um agent; você vai ampliar seu trust budget uma tarefa verificada por vez, e o mesmo livro-razão deveria governar suas pessoas.

Um trust budget é um saldo corrente, escopado a um tipo específico de trabalho, que cresce com resultados verificados e encolhe com falhas. Ele tem três propriedades que o toggle não tem.

Primeiro, é conquistado, não concedido. O budget começa perto de zero e só sobe quando uma ação que o agent tomou é checada e confirmada como correta. Não “pareceu plausível”. Verificada, um humano confirmou, ou um sistema downstream confirmou, ou o resultado fechou limpo. Cada tarefa verificada é um depósito. Cem depósitos em aprovações de reembolso compram um budget amplo ali e nada em qualquer outro lugar.

Segundo, é escopado, não global. Um agent pode ter um budget generoso para ordenar e rascunhar e um perto de zero para qualquer coisa que mova dinheiro ou fale com um cliente em seu nome. A grande mentira da promoção é que competência se transfere entre domínios, que ser bom numa coisa te dá autoridade sobre tudo. Um budget recusa essa mentira. Confiança é sempre confiança em algo.

Terceiro, é reversível, e quietamente assim. Quando uma falha verificada cai, o budget se contrai para aquele escopo automaticamente, sem reunião constrangedora e sem cerimônia de rebaixamento. O agent simplesmente volta para o rascunhar-e-confirmar onde antes ele estava agir-e-reportar, e começa a reconquistar. Confiança que não pode cair não é confiança. É só uma permissão que alguém esqueceu de revogar.

Você pode imaginar os níveis concretamente. No fundo, o agent pode só ler e sugerir. Conquiste o bastante ali e ele pode rascunhar, e você confirma. Conquiste o bastante ali e ele pode agir, e depois te contar. E no topo, para a faixa estreita de tarefas que ele acertou cem vezes, ele pode simplesmente fazer, e você lê o resultado depois. Ninguém virou um interruptor. A coleira se alongou, uma tarefa verificada por vez, exatamente até onde a evidência alcançou e nem uma tarefa além.

A autoridade sobe uma escada de quatro degraus, ler e sugerir, rascunhar e confirmar, agir e reportar, e então fazer e revisar, onde cada degrau acima é pago com resultados verificados, e uma falha verificada derruba o agent um degrau para reconquistá-lo.

Por que isto precisa ser o mesmo livro-razão para pessoas e agents

A tentação é construir o trust budget como uma feature de governança de agents, uma forma esperta de manter os robôs na coleira, e deixar os humanos no velho ciclo de promoção. Achamos que isso é um erro, e o erro é instrutivo.

A razão pela qual você consegue rodar um agent num budget medido, escopado e reversível é que toda ação que ele toma é registrada e verificável. Você sabe o que ele fez, quando, em qual input, e se o resultado se sustentou. Essa é a razão inteira de o budget poder ser conquistado honestamente em vez de concedido por vibe. Mas repare: não há nada nessa propriedade que seja especial para software. Um reembolso que uma pessoa aprovou ou se sustentou ou não. Uma decisão de arquitetura que uma pessoa tomou ou envelheceu bem ou causou um incidente. A evidência existe para pessoas também. Nós só nunca nos demos ao trabalho de manter o livro-razão, então recorremos à fotografia anual.

Quando agents e pessoas trabalham nos mesmos problemas, e dentro de um OS de empresa, eles trabalham, rodar dois sistemas de confiança diferentes é incoerente. Um lado conquista autoridade continuamente a partir de resultados verificados; o outro a ganha numa parcela anual de um comitê. O budget do agent será mais honesto que o título do humano dentro de um trimestre, e todo mundo vai sentir isso. A correção não é rebaixar o sistema do agent para igualar o do humano. É dar às pessoas a mesma dignidade que estamos prestes a dar ao software: confiança que acompanha o que você de fato fez, escopada ao que você de fato fez, que sobe no dia em que você conquista em vez da sexta em que um comitê arruma tempo.

Dê às pessoas o livro-razão que estamos construindo para os agents. É mais honesto que um título, e nunca te faz esperar um ano para ser acreditado.

Isso não é um downgrade para humanos. É o oposto. A promoção anual é o sistema que te faz esperar, que deixa um trimestre brilhante ficar sem recompensa por onze meses porque o calendário não está pronto. Um trust budget que se move no dia em que você conquista é a coisa mais respeitosa que uma empresa pode fazer com a evidência do seu trabalho.

A virada: o que você deixa de ser

Toque uma empresa em títulos e alguém tem que ser o comitê. Alguém faz a reunião, pesa a política, decide quem está pronto, e absorve o ressentimento quando a fotografia sai errada. Para a maioria dos founders esse alguém é eles, e é um dos trabalhos mais ingratos e menos alavancados que fazem, adjudicar confiança por intuição, uma vez por trimestre, para pessoas e agora para software, sem livro-razão em que se apoiar e sem forma de estar certo.

Um trust budget aposenta esse trabalho, e o aposenta para os dois tipos de trabalhador de uma vez. Você para de ser a intuição que decide quem está pronto. A evidência decide, continuamente, à vista de todos, da mesma forma para o agent que rascunha a proposta e para a pessoa que fecha o deal. O que sobra para você é a parte que o livro-razão nunca consegue computar: decidir o que conta como um resultado verificado, para começar. O que “bom” significa aqui. Quais falhas são fatais e quais são como qualquer um aprende. O que você de fato quer que esta empresa seja confiada, pelo mundo, a fazer.

Esse julgamento, em que vale a pena conquistar confiança, é o núcleo humano do sistema inteiro. Um budget pode medir confiança impecavelmente e ainda assim não ter ideia do que vale a pena confiar a alguém para fazer. Essa parte continua sua, e é a única parte que sempre foi o trabalho de verdade.


É isso que estamos construindo na Apollo Space, um sistema operacional de empresa onde autoridade é um budget que você conquista à vista de todos, não um título que um comitê concede de cima, e o agent e a pessoa são submetidos ao mesmo livro-razão honesto. Se você já viu um trimestre ótimo esperar um ano por um rótulo alcançar, você já sabe que o título nunca foi a coisa real. A confiança era. Vamos começar a manter os livros sobre ela.

A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera