Geobloqueado da fronteira: por que rodo meus próprios modelos
Em uma semana, dois laboratórios lançaram seus melhores modelos e desenharam uma fronteira em volta deles. O preview do GPT-5.6 da OpenAI saiu para um pequeno grupo de parceiros nos EUA a pedido do governo. O modelo de uso geral da Anthropic foi desligado e continua fora do ar; o único modelo da Anthropic liberado para rodar é um de cibersegurança, limitado a organizações americanas que defendem infraestrutura crítica. Eu desenvolvo fora dos EUA, o que significa que as ferramentas mais capazes do planeta agora são justamente as que não posso rodar legalmente. Não estou chocado, e não vou ficar amargo com isso. Faz meses que venho construindo para este caso.
Em uma única semana, dois dos laboratórios de IA mais fortes lançaram seus melhores modelos e desenharam uma fronteira em volta deles. A fronteira não é técnica. É legal, e passa bem pelo meio de quem pode usar o frontier.
Eu desenvolvo fora dos EUA. Isso costumava ser uma nota de rodapé. Nesta semana virou a história inteira.
A semana em que a fronteira ganhou uma cerca
No dia 26 de junho, a OpenAI apresentou o GPT-5.6 como um preview limitado: o Sol, o novo carro-chefe, mais o Terra e o Luna para trabalho mais barato e de maior volume. Os modelos não foram para todo mundo. Foram para um pequeno grupo de parceiros de confiança dentro do Codex e da API, “a pedido do governo dos EUA”, com disponibilidade geral prometida “nas próximas semanas”. Hoje, 27 de junho, a Anthropic disse que o governo americano havia autorizado a implantação do Mythos 5, que ela chama de seu modelo de cibersegurança mais forte, em um conjunto de organizações dos EUA que operam e defendem infraestrutura crítica. O Mythos 5 nunca esteve amplamente disponível: só um pequeno grupo de empresas, sob um programa chamado Project Glasswing, chegou a rodá-lo. O Fable 5, a versão com salvaguardas desse modelo, é o que o público de fato tinha, e foi ele que desligaram, no começo do mês; desde 12 de junho a Anthropic vem negociando com o governo para trazê-lo de volta, e ele continua fora do ar.
Ler esses dois anúncios lado a lado e o formato fica claro. A restrição sobre os modelos mais capazes não é mais o quão bons eles são nem quanto custam. É quem você é e onde você está. A OpenAI vai vender o Sol a cinco dólares por milhão de tokens de entrada e trinta por milhão de saída, e eu pagaria isso hoje. O bloqueio não é a fatura. É o passaporte.
Geofenced AI is here. Mythos 5 is back, but only for select US orgs.
O argumento a favor da cerca, e onde ele quebra
Aquele tweet foi o reflexo. A versão pensada começa dando ao outro lado o melhor argumento dele, então aqui está. Um modelo que um laboratório chama de seu modelo de cibersegurança mais forte é, pela mesma medida, seu modelo de ciberataque mais forte: a capacidade que encontra e corrige uma falha é a capacidade que a encontra e a transforma em arma. Modelos de frontier são de uso duplo no sentido mais literal que o termo já teve, então um governo se interessar por quem roda o mais capaz deles não é, à primeira vista, irracional. Essa é a versão mais forte do argumento, e eu quis ela inteira na página antes de dizer por que não compro o resultado.
Porque olhe o que de fato aconteceu. O Mythos 5, o modelo de cibersegurança, nunca esteve amplamente disponível: só um pequeno grupo de empresas avaliadas, sob o Project Glasswing, chegou a rodá-lo. O Fable 5, a versão com salvaguardas que o público tinha, é o que ficou fora do ar desde o começo do mês. Esse é o mecanismo que vale encarar. Eles mantiveram o modelo bruto rodando para uma lista curta de empresas aprovadas e desligaram a versão com salvaguardas, da qual as pessoas comuns dependiam.
Eu entendo o medo. Não aceito que ele justifique tirar do público um modelo que as pessoas já tinham, nem deixar os mais capazes voltarem só por uma lista de aprovados nos EUA, e não vou chamar o precedente de tranquilo só porque o comunicado foi educado. A própria OpenAI, no mesmo post que anuncia o preview limitado, diz que não acredita que esse tipo de processo de acesso via governo deva virar o padrão de longo prazo. As empresas que vivem sob isso também não querem. Um laboratório de frontier acabou de perder o controle do próprio lançamento para uma ordem do governo, e, de fora dos EUA, a porta de volta está na mão de outra pessoa.
Como isso se parece de fora da fronteira
De fora dos EUA, “disponível nas próximas semanas” é uma frase sem data nenhuma. Quando o preview da OpenAI saiu, citei o lançamento num tweet com a mesma frustração:
The next leap models are here, but they are also restricted by US export regulations.
Most developers outside the US will not even have the opportunity to test them. The most advanced AI tools are now being gated by compliance, not by their actual capabilities.
Welcome to the era of geo-fenced AI models.
Foi o desabafo do momento, e metade da timeline estava postando alguma versão disso naquele dia.
A história completa complica esse tweet, e a meu favor. O próprio texto da OpenAI diz que o Sol não cruza o limiar Cyber Critical do Preparedness Framework deles; ele encontrou as peças de um exploit, mas não um exploit funcional, e a empresa está escalonando o lançamento por cautela diante de um salto de capacidade que não consegue delimitar por completo. Então o bloqueio é cautela transformada em processo, e esse processo não tem entrada para quem está fora dos EUA.
Um tweet é onde a reclamação para. O trabalho começa em outro lugar. Então a pergunta mais útil, a que eu venho de fato respondendo com código, é esta: se o frontier pode ser desligado para mim por uma regulação na qual não tenho voto, em cima do que eu construo?
Por que eu já tinha ido para o local
Eu rodo meus modelos em um Mac Studio na minha própria mesa. Um roteador de requisições local que escrevi, o Jano, fica na frente do servidor de modelo e dobra uma rajada de requests variados em um único swap de modelo. O modelo que ele serve é um Qwen Mixture-of-Experts quantizado que faz trabalho de verdade a cerca de 70 tokens por segundo; eu medi o tradeoff contra a versão densa e tornei o MoE meu modelo do dia a dia. Semana passada dei ao roteador a própria telemetria para que eu consiga ver o que a máquina está fazendo sem o dashboard de ninguém. Nada disso foi construído como protesto. Foi construído porque ser dono do caminho de inferência se paga em custo, latência e privacidade, e o geobloqueio só promoveu mais um desses dividendos para o topo da lista.
O modelo na minha mesa não pode ser revogado. Não há lista de parceiros da qual ele possa cair, nem plano de exportação do qual ele possa sair, nem “próximas semanas”. Ele roda às 3 da manhã num feriado com a minha internet caída. Para quem constrói sozinho, essa propriedade passou silenciosamente de boa a estrutural.
É também por isso que venho construindo um app de central de comando para servidores de modelo self-hosted que eu rodo do celular. Se a máquina na minha mesa vai ser o meu frontier, eu quero operá-la do bolso: olhar a fila, trocar o modelo, reiniciar um backend travado, tudo de fora de casa. O geobloqueio é o que transformou isso de projeto de fim de semana em algo do qual eu quero depender.
A diferença que eu não escondo
Eu não vou dizer que um Qwen quantizado num Mac Studio é o GPT-5.6 Sol. Não é. O frontier é o frontier por um motivo, e no raciocínio mais difícil e nas cadeias agênticas mais longas a distância é real e visível. O enquadramento honesto é outro, mais discreto: para uma fatia grande e crescente do trabalho real, os modelos abertos que eu consigo rodar já são bons o bastante, e “atrás, mas meu” ganha de “frontier, mas proibido” em toda tarefa em que o fator decisivo é se o modelo responde ou não. A distância também está encurtando pelo lado aberto mais rápido do que o frontier avança. A cada mês, o modelo que eu consigo rodar faz mais do que no mês passado ainda exigia o modelo que eu não consigo.
O que o geobloqueio mudou de fato para mim
O plano não mudou; o argumento que preciso usar para defendê-lo, sim. Local-first costumava ser uma preferência que eu sustentava por custo e latência, o tipo de coisa da qual uma pessoa razoável poderia me dissuadir. Agora é resiliência de cadeia de suprimentos: a parte do stack que ninguém mais consegue desligar é a parte em cima da qual vale a pena construir. Mês passado isso era gosto. Nesta semana é só verdade.
Os anúncios me fizeram um favor. Traçaram uma linha dura entre as ferramentas que você aluga e as que você possui, alto o bastante para ninguém conseguir desviar o olhar. Quando a fronteira subiu, eu conferi minha própria infraestrutura e achei a maior parte dela já do meu lado da linha, mais porque a máquina já era o melhor negócio em velocidade e custo muito antes de virar o mais seguro.
O que estou observando
Algumas coisas vão me dizer para que lado isso assenta. Se “as próximas semanas” virarem uma data real para desenvolvedores fora dos EUA ou continuarem indefinidas. Se o framework da ordem executiva de cibersegurança que os dois laboratórios citaram endurecer em camadas permanentes baseadas em geografia ou ficar num escalonamento único. Se os modelos de peso aberto continuarem encurtando a distância rápido o suficiente para que a fronteira do frontier pare de importar no trabalho do dia a dia. E se outros laboratórios seguirem a OpenAI e a Anthropic aqui ou tratarem a disponibilidade global como uma vantagem que vale a pena manter. Se a fronteira endurecer, o argumento pelo local deixa de ser só meu. Ele vira o padrão para todo mundo de fora da cerca.