O Jogo Mudou — e Rápido
Modelos de IA de fronteira — como o Mythos (hipotético) ou o GPT-4o (real) — não inventaram novos tipos de ataque. Reconhecimento, acesso inicial, movimento lateral, persistência e exfiltração ainda precisam acontecer. O que mudou foi a velocidade e escala de cada etapa.
Um modelo pode escanear milhares de bibliotecas open source, encontrar uma vulnerabilidade alcançável, construir uma cadeia de exploração e gerar código de prova de conceito em uma fração do tempo que uma equipe humana levaria. Trabalho que antes era lento e metódico agora é rápido e indiscriminado.
Para os defensores, isso significa três coisas:
- Velocidade de descoberta — Atacantes encontram vulnerabilidades antes dos mantenedores conseguirem revisar o uso downstream.
- Volume e adaptação de exploits — Modelos geram milhares de variações e adaptam payloads para contornar regras baseadas em assinatura.
- Impacto quando a exploração é bem-sucedida — Se uma credencial dá acesso a tudo, a arquitetura ao redor da vulnerabilidade é o verdadeiro problema.
A abordagem da Cloudflare, detalhada no post sobre defesa contra modelos de fronteira, é um estudo de caso de como construir um stack que sobrevive a essas novas pressões. Vamos explorar cada camada.
![]()
A Arquitetura ao Redor da Vulnerabilidade
Camada 1: WAF + Pontuação de Ataque com ML
WAFs tradicionais dependem de assinaturas. O problema com modelos de fronteira é que eles geram variações de payload mais rápido do que as regras podem ser escritas. A resposta da Cloudflare é uma abordagem de duas camadas:
- Regras baseadas em assinatura capturam padrões maliciosos conhecidos imediatamente.
- Modelo de machine learning pontua cada requisição de 1 a 99 com base em quão próximo ela se parece com formas de ataque, não com assinaturas exatas.
# Exemplo simplificado de como o WAF Attack Score funciona conceitualmente
def classificar_requisicao(payload, modelo_ml, regras_assinatura):
# Primeiro: verificar assinaturas conhecidas (caminho rápido)
for regra in regras_assinatura:
if regra.coincide(payload):
return "BLOQUEAR"
# Segundo: pontuar com modelo ML
pontuacao_ataque = modelo_ml.prever(payload) # 1-99, menor = mais suspeito
if pontuacao_ataque < 30:
return "BLOQUEAR"
elif pontuacao_ataque < 60:
return "DESAFIAR" # ex.: CAPTCHA
else:
return "PERMITIR"
Isso captura cadeias novas de SQL injection ou RCE mesmo quando o exploit específico é inédito, porque o modelo já viu a forma subjacente do ataque antes.
Camada 2: Modelo de Segurança Positivo com API Shield
Em vez de tentar bloquear toda requisição ruim, o API Shield descreve como é uma requisição válida. Isso neutraliza a vantagem dos modelos de fronteira: gerar milhares de novas variações de ataque não adianta se elas não se encaixam no esquema permitido.
# Exemplo de definição de esquema API Shield (simplificado)
openapi: "3.0.0"
info:
title: "API de Usuários"
version: "1.0.0"
paths:
/usuarios:
get:
parameters:
- name: limite
in: query
schema:
type: integer
minimum: 1
maximum: 100
responses:
'200':
description: "OK"
Apenas requisições que correspondem a esse esquema passam. Todo o resto é descartado.
Camada 3: Bot Management
O Bot Management pontua cada requisição quanto à probabilidade de ser automatizada, usando sinais de toda a rede da Cloudflare: fingerprinting do navegador, padrões de comportamento e atributos de conexão. Isso impede que modelos de fronteira mapeiem a superfície de ataque antes de lançar um exploit direcionado.
Camada 4: Zero Trust Network Access (ZTNA)
Cada aplicação interna exige identidade e política explícitas por requisição. Não existe confiança implícita por estar na rede corporativa. Quando uma ferramenta mal configurada é implantada, a exposição para na própria ferramenta — não em todo o segmento.
Camada 5: AI Gateway e MCP Server Portal
Para agentes de IA internos, a Cloudflare usa:
- MCP Server Portal — acesso gerenciado centralmente a sistemas empresariais, com cada ação registrada.
- AI Gateway — aplica a mesma pontuação e visibilidade a ferramentas de IA internas, ajudando as equipes a ver o que os engenheiros estão construindo antes de escrever políticas.
Isso é especialmente importante à medida que mais equipes criam ferramentas internas rapidamente. A abordagem Waypoint-1.5 para construir mundos interativos em GPUs de consumo mostra o quão rápido o desenvolvimento impulsionado por IA pode ser — e por que o controle de acesso precisa acompanhar.

Limitações e Cuidados
- Não existe bala de prata. A detecção baseada em ML reduz falsos negativos, mas introduz falsos positivos. Ajustar o limite da pontuação de ataque requer ajustes contínuos.
- Modelos de segurança positivos são frágeis para APIs altamente dinâmicas. Toda mudança legítima na API exige atualização do esquema.
- Zero Trust adiciona latência. Cada requisição precisa ser avaliada contra a política. Para cargas de trabalho sensíveis a latência, decisões em cache ou no edge são necessárias.
- A visibilidade do AI Gateway é tão boa quanto os logs. Se as equipes ignorarem o gateway, você perde o panorama.
Por Onde Sua Equipe Pode Começar
- Coloque inspeção na frente de aplicações públicas. Comece com um WAF, mesmo que baseado em regras. Depois adicione detecção ML.
- Defina como é o tráfego válido da sua API. Se você não consegue descrevê-lo, não consegue defendê-lo.
- Use detecção de bots para limitar sondagens automatizadas antes que atacantes mapeiem sua superfície.
- Exija identidade e política de acesso antes que qualquer ferramenta interna seja alcançável.
- Registre tudo que os agentes de IA fazem. Você não pode escrever política sobre o que não vê.
O objetivo não é parar todos os ataques — isso é impossível. O objetivo é garantir que, quando uma camada falha, a próxima limite o que o atacante pode ver, alcançar ou alterar. A arquitetura ao redor da vulnerabilidade determina até onde um ataque pode ir.
Próximos Passos
- Aprofunde-se no RCCLX da Meta para comunicação em GPUs AMD — uma história paralela de inovação em infraestrutura.
- Explore a documentação da Cloudflare sobre WAF Attack Score e API Shield para detalhes de implementação.
- Realize seus próprios exercícios de red team assumindo que o perímetro já foi violado.

Conclusão
Modelos de fronteira mudam a linha do tempo do atacante, mas não mudam a física da segurança de rede. Os mesmos princípios — defesa em profundidade, privilégio mínimo, modelos de segurança positivos — ainda se aplicam. O que muda é a urgência e a necessidade de automação na detecção e resposta.
A arquitetura da Cloudflare é uma referência para qualquer equipe construindo segurança para a era da IA: camadas de detecção, esquemas positivos, identidade em todo lugar e uso de IA para defender contra IA. A vulnerabilidade pode iniciar o ataque, mas a arquitetura determina até onde ele pode ir.