Casos de Uso

A Apollo consegue processar seus reembolsos? Só os que a política já decidiu

Um reembolso não é uma decisão de juízo, é uma política com uma trilha de auditoria. O agent resolve os dentro-da-política em segundos, roteia os casos de borda para um humano, e registra cada decisão de qualquer jeito.

ASR

Apollo Space Research

Apollo Space

5 de novembro de 2025 · 12 min de leitura

Digamos que um cliente escreva num sábado: “Cobrado duas vezes pelo mesmo pedido, por favor reembolsem um.” O pedido está lá. A cobrança duplicada está lá. Sua política diz que cobranças duplicadas são reembolsadas, sem perguntas. E ainda assim aquela mensagem fica numa fila até segunda, porque a pessoa que poderia aprovar está dormindo, e o sistema que poderia aprovar nunca foi avisado do que “aprovar” significa.

Esse atraso não é um problema difícil. É uma instrução não lida.

Aqui está a linha que este post inteiro orbita: um reembolso não é uma decisão de juízo, é uma política com uma trilha de auditoria. A maioria dos reembolsos já foi decidida no dia em que você escreveu a política. O trabalho do agent não é decidi-los. É reconhecer os que a política já decidiu, fazê-los em segundos, e entregar o resto a um humano, com um registro de cada escolha.

Por que “deixe a IA cuidar dos reembolsos” assusta as pessoas certas

O discurso ingênuo é o assustador: aponte um modelo esperto para sua inbox de suporte e deixe-o emitir reembolsos. A maioria dos operadores ouve isso e recua, corretamente. Dinheiro está saindo do prédio. Um modelo confiante que lê errado “gostaria de entender a política de reembolso” como “me emita um reembolso” não comete um typo. Ele comete uma transação.

Então o instinto é fazer o oposto, manter cada reembolso manual, rotear todos para uma pessoa, e tratar o modelo como uma caixa de sugestões glorificada. Seguro. Também lento, e caro de um jeito que ninguém coloca num dashboard: os reembolsos dentro-da-política, os noventa por cento entediantes de cobrança-duplicada, agora esperam na fila atrás dos genuinamente difíceis dez por cento. Seu juízo mais caro é gasto em casos que não precisavam de juízo nenhum.

Ambas as versões erram a mesma coisa. Elas tratam “processar um reembolso” como uma decisão com um nível de risco, quando na verdade são dois trabalhos completamente diferentes vestindo o mesmo rótulo.

O reembolso entediante e o reembolso arriscado não são a mesma tarefa. Tratá-los como um só é o erro inteiro.

Um trabalho é reconhecimento: este pedido casa com uma regra que já escrevemos? Esse trabalho é delimitado, verificável, e seguro de automatizar, porque o humano já tomou a decisão, meses atrás, na política. O outro trabalho é juízo: este caso está fora das regras; o que devemos fazer? Esse trabalho é genuinamente humano, e a única jogada correta do agent é parar e perguntar.

O truque não é deixar o modelo corajoso o suficiente para decidir reembolsos. É deixar o sistema honesto sobre qual dos dois trabalhos está olhando.

O jeito ingênuo: um modelo, uma inbox, um grande botão “emitir reembolso”

Vamos mostrar a versão burra primeiro, porque ela falha de um jeito instrutivo.

Você dá a um modelo capaz acesso à sua ferramenta de pagamentos e à sua inbox de suporte e um prompt que diz, grosso modo, “leia a mensagem, decida se um reembolso é justificado, e emita-o”. Funciona na demo. A demo sempre usa o caso de cobrança-duplicada, porque esse é fácil.

Aí a produção chega com as mensagens que a demo nunca mostrou. “Reembolse-me ou vou ligar para meu banco.” Um pedido de um pedido de quatorze meses atrás. Um reembolso de um item que foi claramente usado por três semanas e agora está sendo devolvido no dia anterior a uma promoção conhecida. Uma nota educada que, lida com atenção, está perguntando como reembolsos funcionam, não pedindo um. O modelo agora tem que ser um especialista em política, um analista de fraude, e uma voz de atendimento ao cliente tudo de uma vez, em cada mensagem, com dinheiro real em jogo e nenhum segundo leitor.

A falha não é que o modelo é burro. É que você pediu a um prompt que segurasse a política inteira na cabeça e a aplicasse sob pressão, e uma política segura num prompt é uma política que ninguém pode auditar. Quando o modelo erra um, você não consegue apontar a regra que ele quebrou, porque não havia regra. Havia um parágrafo de instruções e uma esperança.

Esse é o mesmo modo de falha por trás da maioria das histórias de “a IA fez algo estranho”. A inteligência não estava faltando. A estrutura estava. O modelo recebeu uma decisão que deveria ter sido uma consulta.

Um reembolso de cobrança-duplicada segue um loop fechado: o agent casa o pedido com a ordem, checa contra a política de reembolso escrita, acha claramente dentro das regras, emite o reembolso pela ferramenta de pagamentos, e escreve uma decisão na trilha de auditoria, tudo sem esperar por uma pessoa.

Nosso jeito: a política é o programa, o agent é o interpretador

Aqui está a reformulação que conserta. Pare de pedir ao modelo que decida reembolsos. Comece a dar ao modelo uma política que ele pode ler, e peça apenas que ele reconheça quando um pedido cai claramente dentro ou claramente fora dessa política.

A política é a parte que já está escrita: cobranças duplicadas são reembolsadas. Devoluções dentro da janela são reembolsadas. Itens fora da janela precisam de um motivo. Reembolsos acima de algum valor precisam de uma segunda olhada. Um cliente marcado por chargebacks repetidos recebe um humano, sempre. Nada disso é uma decisão do modelo. É a decisão da empresa, tomada uma vez, com antecedência, exatamente do jeito que você a escreveria para um novo contratado de suporte no primeiro dia dele.

O trabalho do agent, então, se divide com clareza em três resultados para qualquer pedido que chega:

Claramente dentro-da-política. O pedido casa com uma regra sem ambiguidade, a cobrança duplicada, a devolução dentro da janela. O agent emite o reembolso pela ferramenta de pagamentos, manda ao cliente uma nota clara, e registra a decisão com a regra que ela casou. Segundos, não dias.
Claramente fora-da-política. O pedido viola uma regra claramente, o pedido passou de toda janela, o valor está acima da linha de autoaprovação, a conta está marcada. O agent não reembolsa e não discute. Ele roteia para um humano com o caso montado: o pedido, a regra que falhou, o que o cliente pediu, e um rascunho de um reembolso ou de uma recusa gentil.
Ambíguo. O agent genuinamente não consegue dizer. Ele roteia para um humano também, mas nunca chuta com dinheiro. O padrão para incerteza é perguntar, nunca agir.

Repare no que mudou. Na versão ingênua, cada mensagem era uma decisão de alto risco. Aqui, a maioria das mensagens é uma consulta, e só as genuinamente difíceis chegam a uma pessoa. O tempo do humano para de ser gasto em triagem de cobrança-duplicada e passa a ser gasto nos casos que de fato precisam de um humano: o irritado, o limítrofe, o em que dizer sim é bom negócio mesmo que a política diga não.

E criticamente, o agent nunca é a última palavra sobre deixar dinheiro sair para qualquer coisa de que não tenha certeza. A política é o teto. O agent trabalha estritamente abaixo dele.

A parte que os operadores de fato perguntam: a trilha de auditoria

Todo operador que já foi queimado tem as mesmas duas perguntas, e são as certas. Como sei que ele seguiu as regras? E o que acontece quando ele erra um?

A resposta para ambas é a mesma: um reembolso não é uma decisão de juízo, é uma política com uma trilha de auditoria. A trilha de auditoria não é um luxo acoplado depois. É a coisa que torna automatizar qualquer parte disso defensável.

O log ingênuo que você viu por aí é um feed de atividade plano: “Reembolso emitido, R$40, 14h14.” Isso te diz que algo aconteceu. Não te diz nada sobre o porquê, que é a única coisa que importa quando você está revisando se deve confiar no sistema. Um log que registra a ação mas não o motivo é um recibo, não uma auditoria.

A Apollo é construído para que cada decisão de reembolso escreva um registro com a forma que de fato responde à pergunta: qual pedido chegou, qual ordem ele casou, qual regra de política disparou, o que o agent fez sobre isso, e, quando roteou para uma pessoa, quem decidiu e o que escolheu. Lido de cima a baixo, o log reconstrói o raciocínio, não só o resultado. Você pode amostrar dez reembolsos ao acaso e, para cada um, ver a regra exata que o sistema afirma ter seguido, e então checar essa regra contra sua política real.

É isso que transforma “confie na IA” em algo que um operador de fato pode conceder. Você não está confiando nas boas intenções do modelo. Você está auditando as decisões dele contra uma política escrita, do mesmo jeito que um líder de finanças confere por amostragem as aprovações de despesa de um júnior. A confiança mora no registro, não na confiança do modelo.

Você não confia no agent. Você confia na política, e audita o agent contra ela.

E os errados? Quando um reembolso é depois julgado um erro, você não recebe um dar de ombros. Você recebe o registro exato: a regra que o agent casou, o pedido que ele casou com ela. Isso te diz se o agent leu errado o pedido, um bug de reconhecimento que você pode consertar, ou se a própria política o deixou passar, o que significa que sua regra estava errada e nenhum revisor humano a teria pego também. A maioria dos “a IA pisou na bola” acaba sendo o segundo tipo quando inspecionado: a política disse sim, e a política era a coisa que precisava ser editada.

Onde a linha fica, e quem a desenha

A parte honesta disso é que a linha entre “o agent cuida” e “o humano cuida” não é fixa, e você não deveria fingir que é.

No primeiro dia você a desenha conservadoramente. Talvez só cobranças duplicadas reembolsem automaticamente, e todo o resto roteie para uma pessoa enquanto você observa. Você lê a trilha de auditoria por algumas semanas. Você vê que as devoluções dentro-da-janela foram entediantemente corretas todas as vezes, e move essa regra para baixo da linha também. Você vê que reembolsos acima de certo valor ocasionalmente te surpreenderam, então mantém esses acima da linha, onde um humano sempre olha. A política é um botão giratório, e a trilha de auditoria é como você o gira de olhos abertos.

Isso é o oposto do discurso “configure e esqueça”, e esse é o ponto. Um sistema de reembolsos que você não consegue observar é um que você não deveria ter ligado. Um sistema de reembolsos que te mostra seu raciocínio, decisão por decisão, é um que você pode expandir baseado em evidência em vez de fé. Você começa estreito, lê o registro, amplia a pista onde o registro a mereceu.

O caso do cliente-marcado-por-chargebacks nunca se move para baixo da linha, não importa quão limpo o log pareça. Algumas decisões são humanas por design, não por limitação, e um bom sistema sabe a diferença entre “ainda não tenho permissão para decidir isso” e “ninguém deveria jamais deixar software decidir isso sozinho”.

A virada: o objetivo nunca foi automatizar reembolsos

Recue da ferramenta de pagamentos e da trilha de auditoria e olhe o que de fato mudou para a pessoa que roda o suporte.

Antes, o melhor juízo dela era gasto nos casos errados. O reembolso de cobrança-duplicada, que não precisava de juízo, só de atenção, consumia a mesma fila, a mesma fadiga, o mesmo sábado, que a chamada genuinamente difícil em que um cliente leal pede uma exceção que a política não cobre. O trabalho entediante espremia o trabalho que só um humano consegue fazer. Esse é o imposto de verdade, e ele nunca apareceu como um item de linha. Ele apareceu como as boas pessoas estando ocupadas demais com consultas para lidar com os momentos que decidem se um cliente fica.

Um reembolso não é uma decisão de juízo, é uma política com uma trilha de auditoria. Quando o sistema finalmente acredita nisso, os noventa por cento entediantes desaparecem numa pista registrada, auditável, instantânea, e a pessoa que costumava limpar aquela fila recebe apenas os casos que sempre foram dela: a exceção que vale a pena fazer, o cliente irritado que vale a pena salvar, a chamada limítrofe em que a resposta certa é uma pequena gentileza que a política não antecipou. Isso não é um trabalho menor. É o trabalho de verdade, finalmente sem aglomeração.

É isso que estamos construindo na Apollo Space, não um agent corajoso o suficiente para gastar seu dinheiro, mas um sistema honesto o suficiente para saber quais decisões você já tomou, e disciplinado o suficiente para deixar o resto com você. Se você já viu um reembolso de cobrança-duplicada esperar três dias atrás de uma fila, você já sabe que a maioria dos reembolsos foi decidida muito antes de o pedido chegar. A única coisa que faltava era algo que lesse a política e não precisasse dormir.

A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera