Um agent de IA realmente consegue aprender uma voz de marca específica?

Sim, mas leva meses de treinamento iterativo. A chave é fornecer não apenas exemplos positivos mas anti-patterns explícitos, regras de voz e feedback contínuo. A maioria dos times desiste cedo demais porque os primeiros outputs são genéricos.

Quantas amostras de treinamento um agent de conteúdo precisa?

Encontramos retornos decrescentes após cerca de 200 amostras. Mas a qualidade das amostras importa mais que quantidade, 50 exemplos bem anotados com raciocínio explícito sobre o que torna cada peça on-brand eram mais valiosos que 200 amostras não anotadas.

Que métricas você deveria usar para avaliar conteúdo gerado por IA?

Encontramos que a taxa de leitura interna, se seu próprio time voluntariamente lê o conteúdo, é o melhor indicador antecipado. Se seu time não quer ler, seu público também não vai. Métricas externas como engajamento e conversão também importam, mas ficam defasadas por semanas ou meses.

Casos de Uso

Ensinando sua voz de marca a um agent de IA: lições de 6 meses de conteúdo

Ensinar o agent de conteúdo da Apollo Space a escrever como um time específico leva meses, e começa terrível. A taxa de leitura interna sobe de um dígito só para a casa dos 90% ao longo do caminho. Aqui está o que costuma dar errado, e o que realmente funciona.

ASR

Apollo Space Research

Apollo Space

29 de agosto de 2025 · 14 min de leitura

O Conteúdo Que Ninguém Leu

Treinar um agent de conteúdo para escrever como um time específico quase sempre começa do mesmo jeito. Você liga o agent, pede um blog post sobre operações baseadas em agents, e vinte minutos depois recebe 1.800 palavras de conteúdo tecnicamente preciso, estrategicamente sólido e completamente esquecível.

Começa com algo assim: “No cenário tecnológico em rápida evolução de hoje, agents de IA estão transformando como empresas operam.”

Ninguém termina de ler. Foi exatamente o que aconteceu com os primeiros rascunhos do agent de conteúdo da Apollo Space.

É um problema de conteúdo, e não do tipo que se resolve trocando de modelo ou reescrevendo prompts. O agent sabe escrever. Sabe estruturar argumentos, citar dados e produzir prosa gramaticalmente impecável. O que não sabe é escrever como você.

A métrica que melhor captura isso é a taxa de leitura interna: a porcentagem do time que realmente abre e lê o rascunho. No começo, ela vive nos dígitos únicos. As pessoas dão uma olhada no primeiro parágrafo e seguem em frente.

Essa taxa de leitura é a métrica mais importante a rastrear. Não porque mede qualidade de conteúdo diretamente, mas porque mede algo mais fundamental: o conteúdo tem uma voz que faz você querer continuar lendo?

No começo, não tem.

O Que Voz de Marca Realmente É

Antes de explicar como se conserta isso, é preciso definir o que é voz de marca, porque a maioria das pessoas confunde voz com tom, e são coisas diferentes.

Tom é situacional. Um email de suporte é caloroso. Um aviso de segurança é urgente. Um changelog é neutro. Tom muda baseado em contexto.

Voz é constante. Voz é o conjunto de padrões que tornam alguém reconhecível independentemente do assunto. É distribuição de tamanho de frases. É a proporção de exemplos concretos para afirmações abstratas. É se você usa “nós” ou “nosso time” ou “a empresa.” É se começa parágrafos com evidência ou com opiniões. São centenas de pequenas escolhas que se acumulam em algo reconhecível.

Quando as pessoas dizem “isso não soa como a gente,” estão falando de voz, não de tom.

A voz que um time desenvolve organicamente ao longo de um ano escrevendo blog posts, emails para clientes e updates para investidores costuma ter características específicas que nunca foram formalizadas. No caso da Apollo Space, eram estas:

Frases declarativas curtas misturadas com frases analíticas mais longas. Não consistentemente curtas (isso é cosplay de Hemingway). Não consistentemente longas (isso é acadêmico). Um ritmo que alterna.
Concreto antes do abstrato. Sempre liderar com um exemplo específico, dado ou anedota. Depois extrair o princípio. Nunca o inverso.
Honestos sobre fracassos. Não compartilhar apenas vitórias. Compartilhar o que deu errado, onde se errou e o que se faria diferente. Não performativamente, não o “fracasso é aprendizado disfarçado” do LinkedIn. Honestamente.
Sem linguagem de hedge. Nada de “é possível que” ou “pode-se argumentar que” ou “alguns diriam.” Fazer afirmações e defendê-las.
Sem superlativos de marketing. Nada de “revolucionário,” “game-changing,” “cutting-edge” ou “state-of-the-art.” Se a coisa é boa, as especificidades devem tornar isso óbvio.

Nada disso costuma estar escrito. Vive na cabeça do time e no corpus de coisas já publicadas. E esse é exatamente o problema.

A Armadilha do Template

A primeira coisa que todo time tenta é a coisa óbvia: dar ao agent exemplos. Vinte dos melhores blog posts, cinco updates para investidores, dez emails para clientes. O equivalente de dizer a um novo funcionário “leia isso e escreva assim.”

Não funciona.

O agent lê os exemplos e produz conteúdo estilisticamente mediado entre todos. Pega alguns padrões, parágrafos mais curtos, algumas citações de dados, mas produz uma versão achatada da voz que parece uma cover band tocando suas músicas. Tecnicamente correto, emocionalmente vazio.

A taxa de leitura sobe um pouco, mas continua ruim.

O problema é que exemplos sozinhos não transmitem voz. Transmitem output. E você pode produzir output similar através de escolhas de voz muito diferentes. O agent fica fazendo pattern matching em características de superfície, tamanho de parágrafo, vocabulário, estrutura, sem entender os princípios subjacentes que geram essas características.

É a mesma razão pela qual você não pode aprender a pintar estudando fotografias de pinturas. Precisa entender as pinceladas, a teoria de cores, as escolhas composicionais. O output é consequência do processo, e o processo é o que importa.

Escrevendo as Regras

O passo seguinte parece ridículo na hora: passar um dia inteiro escrevendo as regras de voz.

Não brand guidelines. Não uma apresentação de “voz e tom” com adjetivos como “confiante, acessível, autoritário.” Esses são inúteis para treinamento de IA porque são subjetivos e ambíguos. “Confiante” para uma pessoa é “arrogante” para outra.

O que funciona são regras operacionais. Específicas, testáveis, inequívocas. As que a Apollo Space escreveu ficaram assim:

Regra 1: Todo post abre com uma história específica, exemplo ou dado. Nunca com uma afirmação abstrata.
Regra 2: Frases alternam entre menos de 15 palavras e mais de 25 palavras. No máximo três frases consecutivas do mesmo tamanho.
Regra 3: Primeira pessoa do plural (“nós”) ao descrever ações do time. Primeira pessoa do singular (“eu”) apenas quando o autor compartilha uma opinião pessoal.
Regra 4: Toda afirmação deve ser seguida em até dois parágrafos por um exemplo de suporte, dado ou anedota.
Regra 5: Nenhuma frase começando com “No cenário atual de,” “Não é segredo que,” “Como todos sabemos,” ou qualquer outra abertura genérica.
Regra 6: Nenhuma palavra da lista proibida: revolucionário, game-changing, cutting-edge, state-of-the-art, alavancar (como verbo), sinergia, desbloquear (como verbo em contexto de negócios), empoderar.
Regra 7: Ao discutir fracassos, incluir o que especificamente deu errado, qual foi o impacto e o que mudou. Nenhum vago “aprendemos muito.”
Regra 8: Headers de seção são declarações ou perguntas, nunca rótulos vagos de tópico. “O Que Erramos” em vez de “Desafios.” “Os Dados Dizem o Contrário” em vez de “Análise de Dados.”
Regra 9: Terminar seções com uma declaração voltada para o futuro ou uma pergunta. Nunca terminar uma seção com um resumo do que acabou de ser dito.
Regra 10: Nenhuma lista com mais de cinco itens. Se tiver mais de cinco itens, priorize ou agrupe.

No total, cerca de duas dúzias de regras. Algumas estilísticas, algumas estruturais, algumas sobre o que não fazer. Todas entregues ao agent junto com o corpus de exemplos.

Os resultados melhoram na hora. O agent começa a abrir posts com anedotas em vez de platitudes. O ritmo das frases melhora. As palavras proibidas desaparecem. A taxa de leitura salta para a casa dos 40.

Mas isso ainda significa que mais da metade do time não está lendo o conteúdo. E o feedback de quem lê é consistente: “Está melhor. Não parece genérico mais. Mas ainda não parece como a gente.”

O Avanço dos Exemplos Negativos

O avanço costuma vir de uma descoberta acidental.

Um dos engenheiros, que vinha ignorando os rascunhos de conteúdo, lê um e responde com uma única linha: “Este parágrafo é a coisa mais Apollo Space que já li.” Ele cita um parágrafo sobre uma falha de deploy que era cru, específico e levemente autodepreciativo.

No dia seguinte, ele flagga outro parágrafo: “Isso é a coisa mais anti-Apollo Space que já li.” Era um parágrafo genérico sobre “o poder da IA de transformar processos de negócio.”

Isso dá a ideia. Em vez de apenas dar ao agent exemplos positivos, você começa a dar exemplos negativos, especificamente rotulados como “não escreva assim.” Passa pelo corpus de conteúdo existente e pelos próprios rascunhos do agent, anotando parágrafos como “on-brand” ou “off-brand” com explicações específicas do porquê.

As anotações ficam assim:

On-brand: “O agent enviou 847 emails no primeiro mês. 312 foram abertos. 23 tiveram respostas. 12 viraram reuniões. Uma taxa de conversão de 1,4%, respeitável para cold outbound, mas nada para contar para os amigos.” Por quê: Dados específicos, narrativa concreta, avaliação honesta, leve understatement.

Off-brand: “Nossa solução de outreach powered by IA demonstrou melhorias significativas em indicadores-chave de performance em múltiplas métricas de engajamento.” Por quê: Vago, sem dados, linguagem de marketing, construção passiva, “indicadores-chave de performance” é exatamente o tipo de abstração que se evita.

Anotar dezenas de pares de parágrafos, versões on-brand e off-brand de ideias similares, é a parte mais demorada de todo o processo de treinamento.

O impacto é dramático. Depois de incorporar os exemplos negativos, o conteúdo do agent tem um caráter qualitativamente diferente. Ele começa a evitar construções genéricas sem precisar ser instruído regra por regra. Parece ter internalizado o princípio por trás das regras, não apenas as regras em si.

Aqui a taxa de leitura dá seu maior salto, para a casa dos 60.

O Feedback Loop

O passo seguinte é formalizar o processo de feedback. Cada peça de conteúdo que o agent redige passa por uma revisão estruturada:

Primeira passada: A abertura te faz querer continuar lendo? Sim/não. Se não, por quê?
Segunda passada: Destaque qualquer frase ou parágrafo que pareça “off-brand.” Explique por quê em uma frase.
Terceira passada: Destaque qualquer seção que pareça genuinamente boa, melhor do que um humano escreveria num primeiro rascunho.

As revisões levam cerca de dez minutos por peça. O agent recebe o feedback e o incorpora à sua memória de trabalho para rascunhos futuros.

Três padrões emergem dos dados de feedback:

Padrão 1: O agent recorre à segurança sob incerteza. Quando não tem certeza de como fazer um ponto, reverte para linguagem genérica e cheia de hedges. Esse é o flag off-brand mais comum. A correção é uma meta-regra: “Quando incerto, seja específico e concreto. Nunca recue para a generalidade.”

Padrão 2: Ele exagera nos dados. Depois que se enfatiza escrita baseada em dados, o agent começa a enfiar estatísticas em cada parágrafo, mesmo quando uma anedota seria mais eficaz. Entra uma regra: “Dados suportam histórias. Histórias carregam significado. Lidere com a história.”

Padrão 3: Ele tem dificuldade com humor e autodepreciação. A voz natural de um time costuma incluir um humor seco, não piadas, mas disposição para ser ligeiramente irreverente sobre os próprios erros. O agent ou evita humor inteiramente (seguro mas sem graça) ou tenta de formas que parecem forçadas. O melhor é tratar isso como um elemento apenas-humano e parar de pedir ao agent para ser engraçado. Em vez disso, marcar pontos específicos onde um editor humano pode adicionar voz.

A taxa de leitura chega à casa dos 80.

A Biblioteca de Anti-Patterns

O passo seguinte é construir o que dá pra chamar de biblioteca de anti-patterns. É um documento vivo de construções específicas que o agent nunca deveria usar, pareadas com alternativas preferidas.

Alguns exemplos da biblioteca:

Anti-Pattern	Por Que É Ruim	Alternativa Preferida
”No cenário [adjetivo] de hoje…”	Abertura morta. Sinaliza conteúdo genérico.	Comece com um momento, métrica ou decisão específica.
”Vale notar que…”	Hedge. Se vale notar, simplesmente note.	Delete a frase. Declare a coisa diretamente.
”[Coisa] é uma ferramenta poderosa para [resultado]“	Vazio. Tudo é uma “ferramenta poderosa.”	Mostre a coisa produzindo o resultado com dados específicos.
”Isso possibilita que times…”	Voz de marketing. Passivo. Abstrato.	”Usamos isso para [resultado específico]. O resultado: [dados]."
"Os principais pontos incluem…”	Condescendente. Leitores podem identificar pontos-chave.	Termine com uma afirmação voltada para o futuro ou uma pergunta.

A biblioteca cresce continuamente. Cada vez que um revisor flagga uma construção off-brand, ela é adicionada à biblioteca com a correção.

Essa é a parte menos glamourosa do processo e, em retrospecto, possivelmente a mais valiosa. A biblioteca de anti-patterns é essencialmente uma versão formalizada de julgamento editorial. Ela captura as decisões específicas que tornam a escrita boa versus medíocre, e faz isso num formato que um agent pode operacionalizar.

A taxa de leitura beira a casa dos 90.

Onde Isso Chega

Com meses de iteração, o agent de conteúdo passa a produzir primeiros rascunhos que requerem edição mínima de voz. A edição estrutural, fluxo de argumentos, seleção de evidências, ordenação de seções, às vezes precisa de ajuste humano. Mas a voz fica certa.

A taxa de leitura interna estabiliza na casa dos 90. A parcela que sobra costuma ser gente que não lê conteúdo de blog independentemente da qualidade, o que é justo.

Aqui está como um antes e depois parece. Mesmo tópico, mesmos dados, meses de diferença.

Antes (taxa de leitura baixa): “Agents de IA estão transformando operações de negócio ao automatizar tarefas rotineiras e possibilitar que times foquem em atividades de maior valor. Nossos dados mostram que organizações implementando workflows baseados em agents veem melhorias significativas em eficiência operacional, com algumas reportando até 40% de redução no tempo gasto em processos repetitivos.”

Depois (taxa de leitura alta): “Automatizamos nossa revisão semanal de operações. Costumava levar quatro pessoas 90 minutos toda segunda. Agora leva zero pessoas zero minutos, o agent de observabilidade compila o relatório durante a noite, o agent de team intelligence flagga o que precisa de discussão, e na segunda de manhã há um brief esperando no Slack. Três meses de dados: o time recuperou 78 horas. A reunião nunca voltou.”

Mesma mensagem subjacente. Voz completamente diferente. A segunda versão é específica, concreta, baseada em experiência real, e honesta sobre o escopo (é uma reunião semanal, não uma transformação da civilização).

O Que Realmente Importa

Ordenando as intervenções por impacto:

Exemplos negativos com anotações. O maior fator isolado. Mostrar ao agent o que não escrever é mais poderoso que mostrar o que escrever. Restrições parecem ser mais aprendíveis que aspirações.
Regras operacionais de voz. As regras específicas e testáveis dão ao agent um framework. Não descrições subjetivas de voz, mas padrões concretos.
A biblioteca de anti-patterns. Incremental mas composta. Cada nova entrada previne uma classe de output ruim para sempre.
O feedback loop. Importante para pegar drift e edge cases, mas os grandes ganhos vêm do treinamento estruturado, não do feedback iterativo.

O corpus de exemplos, a coisa com que a maioria dos times começa e muitos param, contribui quase nada sozinho. Exemplos sem anotação são dados sem rótulos. O agent pode fazer pattern matching em exemplos, mas não consegue extrair os princípios por trás dos padrões sem orientação explícita.

A Verdade Desconfortável Sobre Conteúdo com IA

Aqui está a verdade desconfortável que a maioria das discussões sobre conteúdo com IA evita: a parte difícil não é gerar texto. Modelos de linguagem já geravam milhares de palavras de prosa coerente há anos. A parte difícil é gerar texto que um ser humano específico queira ler.

Isso é um problema de voz, não de geração. E voz não é uma feature que você pode baixar ou configurar. É o acúmulo de milhares de pequenas decisões editoriais, formalizadas em regras, exemplos e anti-patterns, e refinadas através de meses de feedback.

Pesquisas do setor apontam consistentemente que manter a voz de marca é o principal desafio de quem usa IA para conteúdo, acima de precisão, acima de SEO, acima de volume. E que poucas organizações têm um processo formalizado de treinamento de voz para suas ferramentas de IA.

Quem não formaliza o treinamento de voz acaba produzindo conteúdo que soa como todo outro blog post gerado por IA na internet. E os públicos percebem. A autenticidade percebida, se o conteúdo parece ter sido escrito por alguém com uma perspectiva, tende a ser o preditor mais forte de engajamento, à frente de relevância do tópico, otimização de SEO e tamanho do conteúdo.

O Que Faria Diferente

Sabendo o que se sabe no fim, dá pra pular a primeira etapa inteira. Não comece com exemplos sozinhos. Comece com as regras de voz e os exemplos negativos desde o primeiro dia. O tempo gasto tentando treinar o agent apenas com exemplos é tempo desperdiçado.

Também vale investir mais no processo de anotação desde o início. Os pares de parágrafos anotados custam relativamente pouco tempo e entregam a maior melhoria individual. Começar com um volume maior de pares anotados pode alcançar taxas de leitura altas muito mais cedo.

E vale aceitar mais cedo que alguns elementos de voz são apenas-humanos. O humor seco, a metáfora inesperada, a autodepreciação perfeitamente cronometrada, essa fração de voz o agent não consegue aprender. Em vez de perseguir perfeição, construa a etapa de edição humana no workflow desde o início e deixe o agent dominar a maior parte, que ele faz bem.

O agent de conteúdo não escreve o conteúdo. Ele redige o conteúdo na voz do time, e um humano faz cantar. Essa divisão de trabalho, máquina para consistência e escala, humano para brilho, é o modelo sustentável. Qualquer um dizendo o contrário está te vendendo algo que ainda não existe.

Receba ensaios sobre operações com IA, assine o blog da Apollo Space

Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.

Entrar na lista de espera