Tese de Automação

O unicórnio de dez pessoas roda sobre specs, não sobre headcount

Quando cada pessoa comanda uma fleet, a pergunta deixa de ser quantos você consegue contratar, e passa a ser com quanta clareza você consegue dizer o que é "bom".

ASR

Apollo Space Research

Apollo Space

· 11 min de leitura

Por quarenta anos, o jeito de fazer mais foi contratar mais. Você queria o dobro do resultado, encontrava o dobro de pessoas, e pagava pelas reuniões, pelos gestores e pelos meses que elas levavam pra aprender onde os corpos estavam enterrados. O quadro de pessoal era o acelerador. Pisava nele, o resultado subia; o custo de pisar subia mais rápido ainda.

Esse acelerador acabou de se soltar do painel. E a coisa que o substituiu não é um time maior. É uma frase que você ou consegue escrever com clareza, ou não.

O unicórnio de dez pessoas não é uma previsão. É uma equação de alavancagem que já tem todos os seus termos, e o termo limitante não é mais quantas pessoas você consegue contratar. É com quanta clareza você consegue especificar o que é “bom”.

A matemática antiga: o resultado era limitado por corpos

O modelo ingênuo de uma empresa é uma multiplicação. Uma pessoa faz o trabalho de uma pessoa. Dez pessoas fazem o trabalho de dez pessoas, menos o atrito de fazer dez pessoas concordarem com qualquer coisa. Você escalava o resultado escalando o denominador de todo problema: mais mãos, mais olhos, mais horas.

Funcionava, e tinha um teto rígido embutido. Cada novo contratado era um custo fixo e grosso, um salário, uma cadeira, uma rampa de adaptação, a atenção de um gestor, e chegava em unidades de um ser humano inteiro. Você não conseguia comprar um terço de uma pessoa pra uma terça-feira à tarde. Então o trabalho era picado pra caber nas pessoas: este cargo cuida daquilo, aquele cargo cuida disto, e as emendas entre eles viraram o lugar onde o trabalho ia morrer.

O teto não era talento. Era que resultado e quadro de pessoal estavam acorrentados um ao outro. Pra fazer mais, você crescia. Pra crescer, você gastava. E cada pessoa que você adicionava tornava a próxima mais difícil de adicionar, porque o imposto de coordenação compõe: o número de conversas que têm de acontecer cresce com o quadrado das pessoas que as têm. O acelerador que te dava mais resultado também limitava a sua velocidade.

A maior parte do organograma nunca foi sobre quem era inteligente. Era uma estratégia pra rotear trabalho a humanos lentos, caros e single-threaded, uma camada de cache pra um gargalo que ninguém conseguia remover.

A matemática nova: uma pessoa comanda uma fleet

Agora mude uma variável. Suponha que cada pessoa não faça mais o trabalho de uma pessoa. Suponha que cada pessoa dirija uma fleet de agents que fazem o fazer, pesquisa rascunhada durante a madrugada, uma primeira passada na análise, o outreach escrito, a reconciliação rodada, o relatório montado, e o trabalho da pessoa vire decidir o que deve ser feito e julgar se foi bem feito.

A multiplicação quebra. O resultado deixa de ser limitado pelo número de pessoas e passa a ser limitado por outra coisa completamente diferente.

Vamos colocar números nisso, com o aviso de que são ilustrativos, escolha os seus. Digamos que um único operador consiga segurar a intenção de cinco agents paralelos na cabeça, do jeito que um bom editor segura cinco rascunhos ou um bom gestor segura cinco reports. O resultado desse operador não é mais uma unidade. É cinco, ou quinze, ou o que os agents conseguirem carregar enquanto ficam dentro do julgamento do operador. Dez pessoas assim não fazem o trabalho de dez pessoas. Elas fazem o trabalho de um departamento que antes precisava de cem.

A estrutura de custo se inverte também. O novo trabalhador não chega em unidades de um ser humano inteiro. Você pode subir aquele terço-de-pessoa-pra-uma-terça que o modelo antigo proibia, uma rajada de capacidade pra uma rajada de necessidade, que some quando a necessidade some. Capacidade deixa de ser uma contratação com a qual você se compromete e vira uma coisa que você invoca.

Então o acelerador foi embora. O resultado não está mais acorrentado ao quadro de pessoal. Mas uma equação de alavancagem sempre tem um termo limitante, a única variável que, quando você empurra todo o resto pro infinito, ainda segura a resposta lá embaixo. Empurre o número de agents até o céu e uma coisa ainda limita o resultado: se o operador consegue dizer, com precisão, o que é “bom”.

A empresa antiga multiplica o resultado adicionando pessoas inteiras, cada uma um custo fixo que torna a próxima contratação mais difícil. A empresa nova tem um operador dirigindo uma fleet de agents, onde a restrição limitante não é mais o quadro de pessoal, mas a clareza da spec que o operador consegue escrever.

Por que a especificação vira o gargalo

Aqui está a falha que ensina a lição. Entregue a uma fleet de agents uma instrução vaga, “melhore o onboarding,” “limpe os dados,” “faça a análise competitiva”, e você não ganha alavancagem. Você ganha cinco rascunhos confiantemente errados, rápido, que agora você tem de ler, diagnosticar e refazer. A fleet não multiplicou o seu resultado. Ela multiplicou a sua ambiguidade e te devolveu em alta velocidade.

Essa é a parte que a história do quadro de pessoal erra quando simplesmente troca pessoas por agents. O gargalo nunca desaparece. Ele se move. Saiu do fazer, agents fazem o fazer agora, barato, em paralelo, e pousou direto em cima do dizer. Na especificação. No ato preciso e sem glamour de descrever o que “bom” significa com detalhe suficiente pra que o trabalho feito contra essa definição possa ser confiado sem que você o refaça.

Isso não é uma habilidade nova. É uma antiga que costumava ser opcional. Um grande gestor sempre teve: a capacidade de entregar uma tarefa a alguém e ver ela voltar certa, porque o handoff carregava a intenção, as restrições, a definição de pronto, e o único exemplo que desambiguava o resto. A maioria dos gestores nunca teve de ser ótima nisso, porque um report humano inteligente preenchia as lacunas com julgamento e uma conversa de corredor. O agent também preenche as lacunas, só que não com o seu julgamento. Ele as preenche com a coisa mais plausível, que é exatamente a coisa que parece pronta e não está.

Então a restrição que substitui o quadro de pessoal é uma restrição de escrita. Não prosa, precisão. Você consegue declarar os critérios de aceite? Você consegue nomear o edge case que importa antes dele te morder? Você consegue dizer o que fazer quando o dado está faltando, em vez de descobrir depois que a fleet chutou? Os operadores que conseguem a alavancagem de unicórnio-de-dez-pessoas não são os que têm mais agents. São os que conseguem escrever a spec mais clara, porque uma spec clara é a única coisa que transforma “cinco rascunhos rápidos” em “cinco unidades de resultado confiável”.

A pergunta deixa de ser quantos você consegue contratar e passa a ser com quanta clareza você consegue dizer o que é “bom”.

Clareza precisa de um lugar pra morar, e de um juiz

Existe uma correção ingênua pro problema da especificação, e ela falha de um jeito que vale a pena nomear. A correção é: simplesmente escreva prompts melhores. Seja mais cuidadoso na caixa de chat. Detalhe tudo toda vez.

Ela desaba por dois motivos. Primeiro, a spec não mora em lugar nenhum. Você disse o que era “bom” numa mensagem que rolou tela abaixo, então o próximo agent, na próxima semana, o próximo operador começa do zero e re-chuta. Um padrão que não está escrito não é um padrão, é um humor. Segundo, mesmo uma spec perfeita é só uma afirmação até que algo verifique o trabalho contra ela. Um agent que dá nota no próprio output contra a spec que recebeu sempre vai concluir que passou. O autor é o pior juiz de se o trabalho está pronto.

Então clareza precisa de duas coisas que a caixa de chat não consegue dar: um lugar pra morar, e um juiz que não seja o trabalhador.

Um lugar pra morar significa que a especificação é durável, escrita uma vez, anexada ao trabalho, legível por todo agent e toda pessoa que mexer nela em seguida. A definição de pronto pra “o update pro investidor” ou “o fechamento de mês” ou “a triagem de inbound” deixa de ser reinventada e passa a ser herdada. O cérebro da empresa a segura, do jeito que uma instituição segura um processo mesmo enquanto as pessoas giram. É assim que uma empresa de dez pessoas para de esquecer como ela funciona no dia em que alguém se afasta.

Um juiz que não seja o trabalhador significa que a spec é imposta por algo que não tem interesse no output. O trabalho volta, e antes de qualquer um confiar nele, um agent separado dá nota de novo contra os critérios escritos e tenta achar onde ele falha. Não “isso parece pronto?”, essa pergunta sempre responde sim, mas “isso atende à spec, e onde não atende?” A clareza que você escreveu lá no início vira a coisa contra a qual o juiz mede. Sem o juiz, a spec é um desejo. Com ele, a spec é um contrato, e o output da fleet é confiável sem que você leia cada linha.

Essa é a arquitetura inteira da nova alavancagem: escreva a spec com clareza, guarde onde ela mora pra sempre, e coloque um juiz entre o trabalho e a confiança. Tire qualquer uma das três e a fleet para de multiplicar e começa a gerar slop rápido e plausível.

O caminho ingênuo entrega um pedido vago a uma fleet e recebe cinco rascunhos confiantemente errados pra refazer. O caminho da alavancagem roda uma spec escrita com clareza pela fleet, depois por um juiz que dá nota de novo no output contra a spec, então o que volta é confiável sem um humano checando cada linha.

A virada: a habilidade mais valiosa é nomear o “bom”

Tire os agents e as fleets e a matemática, e o que sobra é uma mudança no que uma pessoa numa empresa serve pra ser.

A resposta antiga era: uma pessoa é uma unidade de fazer. Você contratava mãos porque o fazer era a coisa escassa. A escada de carreira inteira era uma escada-de-fazer, faça o trabalho, faça trabalho mais difícil, eventualmente dirija o trabalho dos outros, e as pessoas que conseguiam fazer mais valiam mais. Essa escada está sendo chutada debaixo dos nossos pés, e é tentador ler isso como uma perda. Não é. É uma promoção pra todo mundo que ainda está aqui.

Porque quando o fazer fica barato e paralelo, a coisa escassa vira o julgamento. O que devemos construir? Como é “excelente” pra pessoa que servimos? Qual dos cinco rascunhos está certo, e por que os outros quatro estão sutilmente errados? Onde está o edge case que vai nos custar um cliente? Essas sempre foram as perguntas de maior valor, e sempre foram as que tínhamos menos tempo pra responder, porque estávamos ocupados fazendo. Agora o fazer está resolvido, e as perguntas são tudo o que sobrou, o que significa que a coisa mais humana do trabalho é a única coisa que escala.

Essa é a forma real do unicórnio de dez pessoas. Não dez pessoas heroicamente moendo o trabalho de cem. Dez pessoas que recuperaram o próprio julgamento, que passam as horas decidindo o que é “bom” e segurando a fleet contra isso, em vez de montar o entregável à mão à meia-noite. A alavancagem não é que a máquina faz mais. É que a pessoa finalmente consegue fazer a parte que só uma pessoa consegue.

O acelerador do quadro de pessoal foi embora, e ainda bem, ele nunca foi uma medida de ambição, só de orçamento. O que o substitui é mais difícil e melhor: a disciplina de dizer, com precisão, o que você quer, e a coragem de recusar o trabalho que não atende.


É isso que estamos construindo na Apollo, um sistema operacional onde cada pessoa dirige uma fleet, a spec mora na memória da empresa em vez de na cabeça de alguém, e um juiz fica entre o trabalho e a confiança. O unicórnio de dez pessoas não está esperando um modelo mais inteligente. Está esperando pessoas que consigam dizer, com clareza, o que é “bom”, e esse sempre foi o trabalho que valia a pena manter.

A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera