Tese de Automação

Proativo sem permissão é só um robocaller

A linha entre um colega e spam não é com que frequência ele fala, é se ele conquistou o contexto para falar de jeito nenhum.

ASR

Apollo Space Research

Apollo Space

3 de março de 2026 · 10 min de leitura

Um robocaller é proativo. Ele entra em contato primeiro, toda vez, sem ser pedido. Ele tem iniciativa, persistência, disponibilidade perfeita, todo traço que dizemos querer de um AI coworker. E no momento em que ele fala, você desliga. Não porque ele estava errado. Porque ele não tinha o direito de saber seu número, nenhuma ideia de quem você é, e nada em jogo em se a ligação te ajudou.

Essa é a coisa desconfortável sobre “IA proativa.” Falar primeiro, por si só, não é uma virtude. Um robocaller fala primeiro. Um spam filter fala por último e salva sua semana.

Então a corrida que todo mundo está correndo, tornar o agent mais proativo, pingar o usuário mais, surfacing mais, está correndo no alvo errado. A coisa que transforma a iniciativa de um presente numa interrupção não é volume. É uma pergunta que quase ninguém está fazendo, e este post é sobre essa pergunta.

O traço que elogiamos é o traço que o arruína

Aqui está o modelo que se espalha rápido: um bom agent é um agent ocupado. Ele percebe coisas, ele cutuca, ele pinga, ele faz follow-up. Iniciativa é medida em mensagens enviadas. Mais surfacing é mais valor. Soa obviamente certo, que é exatamente por que vale a pena ir devagar nisso.

Porque medido desse jeito, o melhor agent do mundo e o pior parecem idênticos no momento em que falam. Ambos te interrompem. Ambos chegam não solicitados. Ambos exigem uma fatia da sua atenção antes de você ter concordado que vale a pena dá-la.

A versão ingênua de “IA proativa” é o agent que maximiza com que frequência ele entra em contato. Perceba um evento, dispare uma notificação. Veja um número se mover, mande um alerta. Parece produtivo, você pode ver a atividade se acumulando. Então você convive com isso por uma semana, e aprende o custo real: todo alarme falso gasta um pouco da sua confiança, e confiança não reabastece. Na quarta vez que ele te pinga sobre nada, você para de ler a quinta. Quando a que importava chega, você já se treinou a descartá-la com um gesto.

Um agent que te interrompe sem ter conquistado isso não é proativo. É um robocaller com uma voz mais simpática.

Esse é o failure mode, e não é um bug de volume que você conserta enviando menos. Envie menos da coisa errada e você só construiu um robocaller mais quieto. O defeito está a montante da frequência. É que o agent falou sem ter conquistado o direito de fazê-lo.

A coisa que você tem que conquistar é contexto

Então o que separa o colega do cold caller? Ambos falam primeiro. A diferença é tudo o que aconteceu antes de eles falarem.

Um bom colega que interrompe sua tarde conquistou isso através de uma centena de pequenos momentos: ele sabe no que você está trabalhando, ele sabe o que você sinalizou como urgente semana passada, ele sabe o deal que está pendurado, ele sabe que você especificamente não quer ouvir sobre o staging build às 18h mas absolutamente quer ouvir se um cliente dá churn. Ele acumulou a posição de te interromper. Quando ele diz “você vai querer ver isso,” você se vira, porque o histórico diz que ele geralmente está certo.

O robocaller não conquistou nada disso. Ele comprou seu número numa lista. Ele fala com máxima confiança e zero contexto, e essa combinação, alta confiança, nenhuma posição conquistada, é a assinatura exata de spam.

Dois agents ambos falam primeiro, mas um comprou sua atenção de uma lista com zero contexto enquanto o outro acumulou posição, o que você sinalizou, o que você ignorou, o que está em jogo, e conquistou o direito de interromper.

Isso reenquadra o problema inteiro. A pergunta não é “o agent deveria ser proativo?” Todo mundo quer isso. A pergunta é “este agent conquistou o contexto para ser proativo sobre isso, para você, agora?” Isso é uma permissão, e permissão não é um setting que você liga num toggle. É uma posição que o sistema acumula observando o que você se importa, aprendendo o que você ignora, e percebendo o que de fato está em jogo, muito antes de ele abrir a boca.

A linha entre um colega e spam não é com que frequência ele fala. É se ele conquistou o contexto para falar de jeito nenhum.

Contexto conquistado tem três partes, e pular qualquer uma faz spam

Quando digo que um agent “conquistou o contexto para falar,” isso não é um sentimento. Decompõe-se em três coisas concretas que ele tem que segurar antes de te interromper. Derrube qualquer uma e a interrupção degenera em ruído, e você geralmente consegue nomear qual parte estava faltando pelo jeito que o alerta te irritou.

A primeira é relevância para você: ele sabe que isso diz respeito a você especificamente, não um broadcast para todo mundo com seu cargo. Um robocaller tem seu número mas não sua situação. Um alerta que teria ido para qualquer um é um alerta que conquistou sua posição com ninguém.

A segunda é stakes que ele pode nomear: ele sabe por que isso importa e pode dizê-lo no mesmo fôlego. “Atenção, o gasto dobrou” é meio pensamento. “O gasto dobrou porque um job está dando retry em loop, e nesse ritmo ele estoura seu orçamento mensal até quinta” é uma razão sobre a qual você pode agir. Uma interrupção sem stakes anexados está te pedindo para fazer a triagem que ela deveria ter feito por você.

A terceira é uma leitura da sua tolerância: ele sabe o que você descartou antes e o que você agradeceu. O colega que interrompe bem é o que aprendeu, das suas reações, onde está sua linha. Um agent que pinga identicamente sobre a coisa que você disse “nunca me diga isso de novo” e a coisa que poderia afundar um deal não aprendeu nada sobre você, e um agent que não aprende nada não conquistou nada.

Segure as três e a interrupção parece um bom colega batendo no seu ombro. Segure nenhuma e é um robocaller. Os casos interessantes estão no meio, e você sentiu cada um deles: o alerta que era relevante mas não conseguia dizer por quê (irritante), o com stakes claros que simplesmente não se aplicava a você (intrusivo), o aviso perfeitamente raciocinado sobre uma coisa que você já tinha explicitamente silenciado (enfurecedor). Cada parte faltante tem seu próprio sabor de errado.

Por que isso é um problema de arquitetura, não de polidez

A correção tentadora é tornar o agent mais educado, suavizar o texto, agrupar os alertas, adicionar um toggle de horas-de-silêncio. Nada disso toca o problema de verdade, porque o problema nunca foi tom. Foi posição.

Aqui está o failure mode em que todo time construindo uma frota de agents esbarra, e não tem nada a ver com modos. Você conecta um agent que pode detectar eventos e enviar notificações. Funciona no demo. Então você o aponta para a semana real de uma pessoa real, e em dias ele já gastou as boas-vindas, não porque foi rude, mas porque estava disparando só na detecção, sem memória do que esse usuário já descartou, sem modelo do que está em jogo para ele, sem registro de onde está a linha dele. O volume parece bom. A posição é zero. Então toda mensagem aterrissa como a primeira ligação de um estranho, porque para o sistema, é a primeira ligação. O agent não tem passado com você. Ele não pode conquistar o que não consegue lembrar.

Essa é a lição, e é universal: um agent que interrompe bem precisa de uma arquitetura que lembra, não de um vocabulário que é mais simpático. Contexto conquistado vive em três lugares que o sistema tem que de fato manter, uma memória das suas reações, um modelo do que está em jogo através do seu mundo, e um senso de quem você é versus todo mundo com seu cargo. Aparafuse uma feature de notificação num chatbot stateless e você construiu um robocaller que diz por favor.

Detecção sozinha dispara em todo evento e queima a confiança a zero; um agent conquista posição passando cada evento por memória, stakes e sua tolerância, e só os que passam pelos três te alcançam.

É por isso que “torne-o proativo” é a instrução errada para entregar a um engenheiro. Proatividade é a metade fácil, qualquer sistema pode disparar num evento. A metade que exige arquitetura de verdade é a contenção: o julgamento de ficar em silêncio nos noventa e nove eventos que não passaram pela barra, para que o centésimo ainda seja lido. O valor de um colega não está em quanto ele diz. Está no fato de que, quando ele finalmente fala, você escuta, e ele protegeu isso ficando quieto o resto do tempo.

A linha entre um colega e spam não é com que frequência ele fala. É se ele conquistou o contexto para falar de jeito nenhum.

A virada: confiança é a coisa que você não consegue entregar numa feature

Aqui está a parte que não é sobre arquitetura de jeito nenhum.

O que você está de fato protegendo, toda vez que o agent escolhe ficar em silêncio, é uma relação humana. A primeira vez que um agent te interrompe com algo que genuinamente importou, pegou a data antes de ela morder, sinalizou o deal esfriando, viu o gasto disparando, algo muda. Você começa a confiar nele. E confiança, uma vez que existe, é a coisa mais valiosa em todo o sistema, porque é a coisa que faz a próxima interrupção aterrissar. Um agent em que você confia ganha o direito de falar primeiro. Um em que você não confia é silenciado, e um agent silenciado é inútil não importa quão inteligente ele seja.

Essa confiança é conquistada exatamente do jeito que é conquistada com uma pessoa: lentamente, através de um track record, e pode ser gasta numa única interrupção ruim. Nenhum upgrade de modelo a instala. Nenhum prompt a conjura. Ela acumula uma boa decisão de cada vez e evapora na primeira vez que o agent grita lobo. O que significa que a coisa mais importante que um sistema proativo faz não é o falar. É a longa e invisível disciplina de não falar até ter certeza, a mesma disciplina que faz uma pessoa valer a pena ouvir.

Essa é a parte que você não consegue baixar. Você pode entregar detecção, memória, um modelo de stakes, um threshold de tolerância. Você não consegue entregar a relação a que essas coisas servem. Você só consegue construir o sistema paciente o suficiente para conquistá-la.

Onde isso deixa a coisa que você está prestes a comprar

Então quando você avalia um agent proativo, pare de contar com que frequência ele fala. Conte com que frequência você quis ouvi-lo. Esses são números diferentes, e a lacuna entre eles é o produto inteiro. Um robocaller pontua alto no primeiro e zero no segundo. Um colega inverte isso.

A linha entre um colega e spam não é com que frequência ele fala. É se ele conquistou o contexto para falar de jeito nenhum, relevância para você, stakes que ele pode nomear, uma leitura da sua tolerância, e se a arquitetura por baixo de fato lembra o suficiente para continuar conquistando. Acerte isso e a proatividade vira um presente. Erre e você automatizou a única experiência da qual todo mundo já desliga.

É isso que estamos construindo na Apollo Space: não um agent que pinga mais, mas um que conquista o direito de interromper, e então guarda esse direito ficando quieto até ter certeza. O objetivo nunca foi um assistente mais barulhento. Era a coisa mais rara: software de quem você fica de fato feliz em ouvir.

A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera