Quase fui sherlocked pela Anthropic • a[7]t

Em 8 de abril de 2026, lancei o Three-Body Agent. Um pipeline autônomo de desenvolvimento que pega issues do GitHub, implementa com Claude, conserta as próprias falhas de CI, mergea as PRs verdes e mantém o board honesto. Sem humano no meio.

No mesmo dia, a Anthropic anunciou o Claude Managed Agents. Sessões autônomas de Claude hospedadas na cloud, com execução em sandbox, agendamento e integração com GitHub.

Um dev solo e um lab de fronteira, trabalhando no mesmo problema ao mesmo tempo, sem saber um do outro.

É o que essa convergência significa.

O problema que os dois lados viram

Claude consegue programar. Isso já é verdade faz tempo. Mas “Claude consegue programar” e “Claude lança feature sozinho” estão separados por uma montanha de orquestração que ninguém comenta.

Para sair de uma issue do GitHub até uma PR mergeada sem humano, você precisa de uma fila (qual issue o agente pega agora, com que prioridade, com que dependência). Precisa de disciplina de branch e merge, com rebase para as issues que dependem de outras. Precisa de recuperação de falha para quando o CI quebra, para quando reviewer pede mudança, para quando dá conflito. Precisa de uma noção de “realmente pronto” que vá além de “o check verde ficou verde”. Precisa de gestão de sprint para que o trabalho fique no escopo da semana. Precisa de coordenação para agentes não pisarem um no outro.

O modelo é o motor. Ninguém tinha construído o carro. Esse é o gap que os dois lados viram. Sem essa camada, um agente é um autocomplete caro que precisa de humano apertando todo botão.

O que eu lancei

Three-Body Agent são seis workflows do GitHub Actions que formam um pipeline auto-regulado. O nome vem do problema de três corpos da mecânica orbital: três sistemas em atração gravitacional constante, cada um produzindo um resultado estável que nenhum sozinho atingiria.

O Implementer roda toda hora. Pega a issue TODO de maior prioridade no milestone da semana, classifica os candidatos por label de prioridade e qualidade da spec, detecta “Depends on: #N”, e entrega o trabalho para CLI do Claude Code numa sessão de 500 turnos e noventa minutos. O Fixer roda a cada trinta minutos, junta o contexto completo de qualquer falha (log de CI, comentário de review, estado de merge) e pede um patch para o Claude. O Merger roda a cada duas horas e mergea as PRs que de fato passaram pelas portas, com o Claude lendo a conversa para confirmar que o feedback foi resolvido.

A coisa toda é shell e GraphQL. Sem framework, sem SDK, sem dependência além de gh, jq e curl. Depois de algumas semanas: 240 issues implementadas, 232 PRs abertas, 95% de taxa de sucesso. A arquitetura completa está no deep dive do Three-Body Agent.

O que a Anthropic lançou

Claude Managed Agents é o mesmo problema resolvido pelo lado da infraestrutura. Sessões de Claude hospedadas rodando no metal da Anthropic. Agendamento via /schedule que dispara mesmo com o computador desligado. Execução em sandbox com acesso a escrita de arquivo e shell. Sessões que sobrevivem a desconexão, com checkpointing. Acesso nativo a MCP para GitHub, Sentry, Slack. Um harness de orquestração embutido cuidando de roteamento de tool, contexto e recuperação.

Engenharia de verdade. Execução de código em sandbox, checkpointing, gestão de credencial, permissões escopadas, tracing ponta a ponta. Meses de trabalho de infra, produtificados no preço padrão da API mais um adicional por hora de sessão.

Fui sherlocked?

Em parte. A pergunta interessante é qual camada.

A Anthropic resolveu o problema de infraestrutura: como rodar Claude de forma autônoma, num cron, com acesso ao GitHub, num sandbox? Resolveram bem, e lançaram um produto limpo em volta disso.

O que o Managed Agents não traz é a camada de workflow em cima: seleção de issue por prioridade com desempate por qualidade da spec, detecção de dependência entre issues, coordenação multi-agente, merge sequencial com re-verificação consciente de conflito, inteligência de review antes de mergear, máquina de estados para o board, virada de sprint, fronteiras de segurança que mantêm os agentes longe das branches humanas.

Managed Agents te dá uma sessão de Claude que faz qualquer coisa. Three-Body Agent te dá um pipeline que sabe o que fazer, quando fazer e como coordenar a entrega com segurança.

Managed Agents é o motor. Three-Body Agent é o carro autônomo em volta dele.

Por que o mesmo dia importa

Infraestrutura de agente está sendo commoditizada. Rápido. A Anthropic está construindo, todo cloud provider grande também vai. Dentro de um ano, “rodar Claude num cron com acesso ao GitHub” vai ser table stakes.

O valor está subindo na stack. Rodar um agente é a parte resolvida. A parte não resolvida é fazer agentes trabalharem juntos sem pisar um no outro, saber quando eles estão realmente prontos (não só verdes), e manter o humano informado sem mantê-lo envolvido.

É onde o trabalho de verdade está agora. É onde o Three-Body Agent existe.

Complementar, não concorrente

A piada final é que o Three-Body Agent pode rodar em cima do Managed Agents.

Troca os triggers de cron do GitHub Actions por /schedule. Troca o runner por um sandbox gerenciado. A lógica de workflow fica idêntica: o ranqueamento de prioridade, a detecção de dependência, o merge sequencial, a máquina de estados do board.

Ou roda os dois: Managed Agents para as sessões de Claude, GitHub Actions para orquestração. O modelo e o loop são preocupações separadas. Cada camada pode ser a melhor versão de si mesma, e você não precisa escolher.

A Anthropic construiu a plataforma. Eu construí o workflow em cima.