Seu primeiro agente deveria te envergonhar
Um agente de uma ferramenta rodando em produção esta semana vale mais que um plano brilhante de seis meses que não toca em nada.
Apollo Space Research
Apollo Space
A forma mais comum de um projeto de IA morrer não é o fracasso. É a ambição. Alguém mapeia o departamento inteiro, desenha o agente que vai ler cada caixa de entrada, reconciliar cada registro e responder cada pergunta, e então passa quatro meses construindo uma versão que nunca está pronta o bastante para chegar perto de um cliente de verdade. O plano é lindo. O organograma de agentes é lindo. Nada roda.
Enquanto isso, o agente que de fato teria mudado alguma coisa esta semana era pequeno o suficiente para envergonhar. Ele faz uma coisa só. Lê a fila de suporte e classifica cada chamado por área de produto. É isso. Sem cadeia de raciocínio para exibir, sem enxame, sem diagrama. Ele perderia uma demonstração para o plano grandioso diante de qualquer plateia. E é justamente ele que deveria ir para produção.
Pequeno não é uma fase, é a estratégia
O instinto é tratar o agente minúsculo como andaime, um passo descartável no caminho para a coisa de verdade. Esse instinto é o bug. O agente minúsculo não é uma versão pior do plano grandioso. É uma aposta diferente, e melhor, porque te paga de volta na única moeda que importa: contato com a realidade.
Um agente de uma ferramenta em produção te ensina coisas que o plano não consegue. Ele mostra que as classificações estão erradas em metade das vezes porque duas áreas de produto se sobrepõem de um jeito que ninguém documentou. Mostra que a caixa de entrada tem uma categoria que você esqueceu que existia. Mostra qual passo ainda precisa de um humano, e por quê. O plano grandioso descartou tudo isso num quadro branco. O agente pequeno descobre na terça-feira, pelo preço de uma única chamada de ferramenta, enquanto ainda dá tempo de errar barato.
É esse o argumento inteiro. Errar rápido é recuperável. Errar devagar, depois de quatro meses construindo em cima de um palpite, é o tipo caro. O agente pequeno não é menos ambicioso. É ambição que aceitou ser corrigida.
Tem um segundo benefício, mais discreto, mas maior. O agente pequeno conquista o direito de crescer. Depois de classificar dez mil chamados corretamente, ninguém discute se ele pode ser confiado para fazer o passo dois. Ele tem histórico. Você o estende porque a evidência diz que pode, não porque um slide disse que devia. O plano grandioso pede confiança adiantada, antes de ter feito qualquer coisa, que é exatamente quando confiança é mais difícil de conceder. O agente pequeno compra confiança uma tarefa chata de cada vez, e confiança comprada assim é do tipo que se sustenta.
A armadilha é que pequeno não parece progresso. Uma única ferramenta que classifica chamados não tem cara do futuro do trabalho. Tem cara de script. Então os times pulam essa etapa, correm para o diagrama de arquitetura e confundem o tamanho do plano com o tamanho do resultado. Mas o resultado do plano grandioso, por meses, é zero. O resultado do agente pequeno, até sexta-feira, é uma fila que se triagem sozinha. Um dos dois está em produção. O outro é uma reunião.
Escolha o agente que pode estar em produção esta semana. Dê a ele uma ferramenta e uma tarefa que não tenha como dar muito errado. Deixe rodar contra dados reais, na frente de uma pessoa real, e observe o que ele te ensina. Aí, e só aí, adicione a segunda tarefa, porque agora você sabe qual é a segunda tarefa de verdade. Isso não é começar pequeno por falta de coragem. É começar pequeno porque é o caminho mais rápido para algo real, e real vence impressionante todas as vezes.
A empresa que ganha não é a que tem o agente mais elaborado no roteiro. É aquela cujo menor agente já está fazendo um trabalho que ninguém mais precisa fazer.
A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.
Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.
Entrar na lista de esperaPromoções estão mortas. Trust budgets as substituem.
Você não vai promover um agent; você vai ampliar seu trust budget uma tarefa verificada por vez, e o mesmo livro-razão deveria governar suas pessoas.
Tese de AutomaçãoA descrição de cargo está virando um arquivo de spec
Para um agent, um cargo vira uma spec versionada e testável, e isso muda como você desenha cada trabalho, inclusive os humanos.
Tese de AutomaçãoPare de medir output. Comece a medir outcomes que a empresa não pode esquecer.
Um OS que lembra de toda decisão e seu resultado deixa você avaliar o outcome, não a atividade.