Spawn do seu kind-of-Hermes-agent, a tese da Apollo
O gap entre 'IA é uma ferramenta' e 'IA é um colega de trabalho' é o wedge do AI-OS. Aqui está o que estamos construindo na Apollo para fechá-lo, e por que achamos que o resto do mercado ainda está construindo a metade errada.
Apollo Space Research
Apollo Space
O momento em que a ficha caiu
Algumas semanas atrás eu estava do outro lado da cidade, sem laptop, quando um colega me chamou no Telegram: uma regressão em uma das nossas ferramentas internas, um bug que afetava clientes, do tipo que normalmente te puxa de volta para uma mesa por uma hora.
Encaminhei a mensagem para o meu Hermes Agent pessoal, um agent self-hosted, single-user, que vive numa instância EC2 que eu rodo. Dois minutos depois o Hermes tinha clonado o repo, aberto o log da falha, rastreado a regressão até o commit que a causou, esboçado um patch e estava me perguntando no Telegram se devia abrir o PR. Eu disse sim. Ele abriu o PR, chamou o engenheiro de plantão e ficou na thread respondendo perguntas de follow-up na voz do engenheiro enquanto eu voltava ao que estava fazendo.
Não toquei num laptop. Não digitei código. Nem abri um browser. Um colega de trabalho tinha cuidado disso.
Esse é o momento que muitos de nós estão tendo discretamente em 2026, no Telegram ou Slack ou WhatsApp, com um agent single-user de side-project, e então voltando para a nossa empresa de produto de verdade e percebendo que não temos nada nem remotamente parecido para o nosso time. Esse gap é a razão inteira pela qual a Apollo existe.
”IA como ferramenta” vs “IA como colega de trabalho”
O frame dominante hoje ainda é IA como ferramenta. Você abre o Cursor, você pergunta, ele responde, você fecha. Você abre o Notion AI, resume uma página, fecha. Você chama um bot do Slack, ele responde, a thread acaba. Cada ferramenta é excelente no que faz, mas cada uma é invocada, fica dormente até você convocá-la, e então vai embora.
Um colega de trabalho é diferente. Um colega roda enquanto você dorme. Um colega tem opiniões, um jeito de trabalhar, um tom, coisas que ele vai e não vai fazer. Um colega tem memória que se acumula ao longo de dias e projetos. Um colega tem permissões com escopo, o seu CFO não tem o acesso ao GitHub do seu engenheiro. Um colega pode ser pausado, realocado ou demitido, e a próxima pessoa que assume aquela cadeira herda o mesmo contexto.
O gap entre essas duas imagens não é mais um gap de capacidade de modelo. É um gap de sistema operacional. O modelo é o cérebro. O harness é o corpo. O que falta é o local de trabalho, o runtime multi-tenant que transforma um cérebro mais um corpo num funcionário numa folha de pagamento.
A equação agora-canônica de Mitchell Hashimoto tem sido Agent = Model + Harness por um ano. A realidade de 2026 é que você precisa de um terceiro termo: Agent em produção = Model + Harness + Workplace. O workplace é a parte onde as empresas de fato vivem.
Por que a geração atual de ferramentas não fecha esse gap
Vale a pena ser preciso sobre por que as coisas no mercado hoje, por melhores que sejam, não cruzam de ferramenta para colega de trabalho.
- Notion AI, Linear AI, Slack AI são large language models parafusados num único documento, board ou canal. Não têm identidade persistente, nem credenciais próprias com escopo, nem memória que cruze superfícies, nem jeito de agir fora do app onde vivem.
- Cursor, Copilot, Claude Code são pair programmers. São espetaculares na tarefa para a qual foram desenhados, você, no seu laptop, escrevendo código, e são deliberadamente efêmeros. Não foram desenhados para rodar num domingo de tarde enquanto você está na praia.
- Sierra, Decagon, Harvey são agents verticais. Cada um domina bem um workflow, suporte ao cliente, revisão jurídica, e cada um é um produto fechado, não um substrato para o resto do trabalho de uma empresa. Eles não são o OS; são os primeiros apps no OS.
- Hermes Agent (o agent open-source que usei na história de abertura) é uma peça magnífica de software para uma pessoa. Seu design center, segundo suas próprias notas de arquitetura, é um agent pessoal single-user, residente no servidor, com profiles como home directories separados no host. Esse é o design certo para o caso de uso pessoal. É estruturalmente a primitiva errada para uma empresa com usuários concorrentes, conhecimento compartilhado, funcionários que saem e revogação de credenciais.
O que falta, e o que toda empresa já tentando deployar agents internamente está redescobrindo do jeito difícil, é a camada que transforma qualquer um desses numa capacidade organizacional: agents por pessoa com estado isolado, agents que conversam entre si dentro de uma org sem vazar entre orgs, arquivos ETHOS que você pode ler e editar, memória observável que você pode auditar, grants de ferramentas que você pode revogar quando alguém sai.
O que estamos construindo na Apollo
A Apollo é o AI-OS para empresas. Não um agent vertical, não um produto de chat, não um wrapper. A camada de OS sobre a qual a próxima geração de empresas movidas por agents vai rodar. A tese se decompõe em quatro peças load-bearing.
1. Um agent runtime multi-tenant, por pessoa. Cada usuário na Apollo dá spawn no seu próprio kind-of-Hermes, um agent pessoal isolado por row-level security no banco de dados, cobrado por organização, observável de ponta a ponta. O agent runtime delega a camada commodity (o loop do modelo, MCP tool-calling, compaction, execução em sandbox) aos Managed Agents da Anthropic e a runtimes gerenciados similares, veja Scaling Managed Agents: Decoupling the brain from the hands da Anthropic, de 6 de maio de 2026, para o padrão arquitetural que seguimos. Não fazemos fork de uma base de código de agent pessoal e fingimos que é multi-tenant. Construímos o control plane multi-tenant em cima de um substrato gerenciado.
2. ETHOS-as-markdown. Cada agent da Apollo, um Chief of Staff, um CMO, um Coding Specialist, carrega um arquivo markdown editável descrevendo sua personalidade, seus guardrails, a informação que tem permissão de compartilhar com agents irmãos, o jeito como soa quando escreve. O ETHOS é legível por humanos, versionado e dogfoodable. Se você não gosta do jeito como o seu agent CMO escreve copy de LinkedIn, você abre o ETHOS dele e muda um parágrafo. O próximo post sai na sua voz.
3. Ferramentas com escopo e memória observável. Cada ação que um agent da Apollo toma flui através de uma camada de conectores (Composio para o caminho de 1.000+ ferramentas de terceiros) com escopo de credenciais por org, por agent. Cada memória que o agent escreve vive numa única tabela observável, pesquisável, exportável, revogável. Não acreditamos em agents cujo estado interno é uma caixa-preta. O trace flywheel, capturar trajetórias estruturadas de cada execução de agent, é o moat sobre o qual Harrison Chase tem escrito há um ano, e só funciona se memória e ferramentas forem observáveis desde o dia um.
4. Um kanban central para humanos. Os agents da Apollo não trabalham no escuro. Eles reivindicam tarefas de um board que os humanos conseguem ver, abrem PRs, postam num group chat, e os humanos revisam o que entregam. O agent opera do jeito que um funcionário júnior opera, na frente de um gerente, com entregáveis estruturados, com um loop de feedback. Autonomia de nível founder é o destino de longo prazo; júnior-revisado é o ponto de partida crível.
Somos explícitos sobre o que não construímos. Não construímos o modelo. Não construímos o roteador de inferência. Não construímos o agent loop, o protocolo MCP, a compaction básica ou o sandbox de execução de código. Isso é encanamento commodity, veja “From System of Record to System of Intelligence” da a16z (a16z, 2024–2025) para o frame estratégico no qual a indústria convergiu. Nós construímos o workplace.
Três momentos concretos
Abstração é barata. Aqui está como o workplace se parece quando você de fato usa.
O briefing matinal do Chief-of-Staff. São 7:00 da manhã. O seu Apollo Chief of Staff já puxou sua agenda, escaneou os traces de ontem de todos os outros agents do seu time, leu os canais do Slack da madrugada e postou no seu group chat um brief de 200 palavras, o que entregou, o que atrasou, o que você precisa decidir hoje, o que está bloqueado em você. Quando você termina o café, você sabe mais do que sabia ontem e não abriu uma única aba.
O agent CMO tocando o LinkedIn. Você dá ao agent CMO uma Mission (“buzz pré-lançamento do WSR-2026, 7–9 de junho”). O CMO abre uma conversa em grupo com três agents irmãos, um Brand Guardian, um Composer, um Publisher, e eles passam as próximas dez trocas brigando sobre o post. O Brand Guardian rejeita dois rascunhos por estarem fora da voz. O Composer puxa assets visuais. O Publisher agenda o corte final. Você vê a conversa inteira na Apollo. Você aperta aprovar. O post vai ao ar sem nenhum humano digitando nada.
O Coding Specialist reivindicando uma tarefa. Um agent Coding Specialist pega uma tarefa de Foundational Structure com um orçamento fixo, cost_cap_usd: 5, wall_clock_max_minutes: 60, write-boundary: um repo, uma branch. Ele dá spawn num runner em sandbox (Vercel Sandbox ou Cloudflare Sandboxes, ambos lançados em 2026 como o tier “sandbox-as-tool” do padrão agent-outside / sandbox-as-tool que a Anthropic ratificou), escreve o código, roda os testes, abre um PR e espera. Uma frota de reviewers de cinco lentes, segurança, dev, negócio, adversarial, custo, roda contra o PR em paralelo. O humano dá merge ou rejeita. O agent aprende com o veredito na próxima tarefa.
Nenhum desses momentos requer AGI. Eles requerem um sistema operacional que deixe agents e humanos compartilharem trabalho, compartilharem contexto e compartilharem accountability.
Por que agora
O mercado decidiu que agents importam. A pergunta não é mais se, é qual camada vence.
- 8 de abril de 2026: a Anthropic lançou os Managed Agents, um runtime hospedado com execução em sandbox, sessões duráveis, roteamento de ferramentas MCP, cofre de credenciais OAuth e cobrança por sessão. Construir o seu próprio harness agora compete diretamente com a infraestrutura da Anthropic. Essa é a briga errada.
- 6 de maio de 2026: a Anthropic deu sequência com Dreaming, Outcomes, and Multiagent orchestration, pruning de memória agendado, grader agents separados com rubrics, e fan-out de subagents lead-and-specialist. A Harvey teria visto um aumento de ~6× na taxa de completação atribuível especificamente ao Dreaming. O “managed substrate” agora é genuinamente bom.
- Março de 2026: a Cognition adquiriu a Windsurf por US$ 10,2 bilhões, consolidando a camada de coding-agent residente na IDE.
- 2025–2026: a Sierra levantou a US$ 15,8 bilhões, a Harvey a US$ 11 bilhões, a Decagon a US$ 4,5 bilhões, três empresas de agents verticais, cada uma dona de um workflow, cada uma comandando o tipo de múltiplo que antes pertencia a plataformas.
- O frame dos investidores também está afiando, veja a thread pública no X de Tobi Lütke sobre comércio agentic e o padrão DeepAgents da LangChain para a postura arquitetural na qual o lado open-source convergiu.
Cada um desses sinais aponta para a mesma coisa. O agent loop está resolvido. Os agents verticais estão sendo comprados ou ricamente precificados. O substrato está se consolidando. A camada que ainda está totalmente aberta, o workplace, o AI-OS, a coisa que transforma um enxame de agents numa empresa, é o próximo wedge. E é a camada para a qual a Apollo foi construída.
O que vem a seguir
A Apollo está sendo construída agora mesmo, em público, por um time pequeno usando a Apollo para construir a Apollo. Toda semana o sistema roda mais do nosso próprio trabalho, e toda semana entregamos as partes dele que conquistaram seu lugar. O customer-zero somos nós, não há outro jeito de saber se você está de fato construindo um colega de trabalho ou só uma ferramenta mais sofisticada.
O primeiro momento público é no Web Summit Rio no início de junho de 2026. Se você é um founder AI-native, um líder de função numa empresa rápida, ou qualquer pessoa que teve o mesmo momento de “acabei de mandar uma mensagem no Telegram e um colega de trabalho fez o resto” que tivemos, venha nos encontrar. A lista de early-access vive em apollospace.ai.
O próximo post desta série aprofunda no trace flywheel, como memória observável e traces estruturados de agents se acumulam no tipo de vantagem de system-of-intelligence que não é arbitrada por um lançamento de modelo.
Fontes e leitura adicional (todas acessadas em 2026-05-20):
- Anthropic, lançamento do Managed Agents, https://www.anthropic.com/news/managed-agents
- Anthropic, Scaling Managed Agents: Decoupling the brain from the hands (maio de 2026), https://www.anthropic.com/research/managed-agents
- a16z, From System of Record to System of Intelligence, https://a16z.com/system-of-intelligence-ai/
- Tobi Lütke sobre comércio agentic (X), https://x.com/tobi/status/1857893987856846896
- LangChain, Deep Agents, https://blog.langchain.com/deep-agents/
- Composio toolkits (camada MCP de 1.000+ ferramentas), https://composio.dev/
- Vercel Sandbox, https://vercel.com/docs/vercel-sandbox
- Cloudflare Sandboxes (GA abril de 2026), https://blog.cloudflare.com/cloudflare-sandboxes-ga/
- Hermes Agent (Nous Research, open source), https://github.com/NousResearch/hermes-agent
- Valuations de Sierra, Harvey, Decagon, reportagem pública via The Information e Bloomberg, 2025–2026
A Apollo cuida da operação repetitiva da sua empresa pro seu time não precisar.
Entre na lista de espera: acesso antecipado, preço de usuário fundador e um lugar na primeira fila enquanto a gente constrói.
Entrar na lista de esperaPromoções estão mortas. Trust budgets as substituem.
Você não vai promover um agent; você vai ampliar seu trust budget uma tarefa verificada por vez, e o mesmo livro-razão deveria governar suas pessoas.
Tese de AutomaçãoA descrição de cargo está virando um arquivo de spec
Para um agent, um cargo vira uma spec versionada e testável, e isso muda como você desenha cada trabalho, inclusive os humanos.
Tese de AutomaçãoPare de medir output. Comece a medir outcomes que a empresa não pode esquecer.
Um OS que lembra de toda decisão e seu resultado deixa você avaliar o outcome, não a atividade.