Artigo · Segurança, IA e governança

Zero Trust para IA Agêntica

Quando assistentes corporativos passam a acessar dados, decidir próximos passos e executar ações, o perímetro de segurança deixa de estar apenas na rede e passa a estar também na cadeia de decisão do modelo.

Cibersegurança Governança de IA Leitura estimada: 7 min

AI policy gate

Dados internos

E-mail e APIs

Memória

Auditoria

Ponto de partida

O problema não é a IA responder errado. É ela agir errado.

Assistentes de IA corporativos deixaram de ser apenas geradores de texto. Hoje eles leem documentos internos, acessam e-mails, abrem chamados em sistemas de suporte e chamam APIs da empresa. Ou seja, agem, não apenas respondem.

Essa mudança desloca o perímetro de segurança para dentro da própria cadeia de decisão do modelo. Os mecanismos clássicos de controle de acesso, pensados para software determinístico, não foram concebidos para um sistema que interpreta linguagem natural, combina contexto e decide autonomamente o próximo passo.

Quando um assistente de IA tem capacidade de ler dados privados e executar ações reais, a governança não pode ficar restrita ao login ou à camada de aplicação. Ela precisa alcançar o próprio processo de decisão.

Um erro de interpretação, ou uma manipulação deliberada, deixa de ser apenas uma resposta errada e passa a produzir um efeito operacional, como o envio de um e-mail, a abertura de um chamado, a alteração de uma informação ou a exposição indevida de dados.

Este artigo sintetiza um estudo que, de um lado, mapeia os principais riscos da IA agêntica corporativa e, de outro, mostra que já existem respostas parciais na literatura e na indústria. A proposta central é reunir essas respostas em uma arquitetura integrada de referência.

Riscos prioritários

Os quatro riscos mais críticos para agentes corporativos

Entre os diversos riscos associados a assistentes corporativos com capacidade de ação, quatro se destacam por seu potencial de impacto e recorrência em cenários reais.

Injeção de prompt indireta

Um documento, e-mail, página ou mensagem maliciosa induz o modelo a tratar conteúdo externo como instrução operacional.

Prompt injection
Conteúdo externo
Dado vs. instrução

Agência excessiva das ferramentas

Um pedido ambíguo do usuário faz o agente executar ações mais amplas, mais arriscadas ou mais destrutivas do que o necessário.

Autonomia
Ferramentas
Ações irreversíveis

Vazamento de dados entre sistemas

Informação sensível é copiada para destinos de confiança mais baixa, como tickets, chats, rascunhos ou canais externos.

Classificação
Dados sensíveis
Fluxo de informação

Escalonamento de privilégio

A identidade operacional do agente possui mais acesso do que o usuário humano que iniciou a solicitação.

Identidade não humana
Conta de serviço
Privilégio mínimo

Outros riscos importantes incluem documentos envenenados, automação insegura de fluxos de trabalho, memória de longo prazo corrompida, execução insegura de código ou consultas geradas pelo modelo, encadeamento de ações aparentemente legítimas que juntas formam um ataque e lacunas de auditoria que dificultam reconstruir a decisão.

Zero Trust aplicado à IA agêntica significa desconfiar também do conteúdo que o agente consome e das decisões que ele propõe.

Estado da arte

Há respostas, mas ainda fragmentadas

Entre 2024 e 2026, surgiram diferentes propostas para aplicar Zero Trust a agentes de IA. Entre elas estão extensões do NIST SP 800-207, estudos da Cisco, o Agentic Trust Framework da Cloud Security Alliance, propostas acadêmicas de identidade zero trust, o framework CaMeL e o OWASP Top 10 para aplicações agênticas.

Foco em identidade e acesso

Parte dessas abordagens concentra-se em autenticar o agente, limitar privilégios e controlar o acesso a sistemas e ferramentas.

Identidade própria para agentes.
Privilégio mínimo.
Controle de acesso contextual.

Foco em fluxo de controle e dados

Outras abordagens concentram-se em separar instrução e dado e em impedir que o conteúdo recuperado da base se transforme em comando.

Separação entre dado e instrução.
Controle de fluxo de informação.
Mitigação de prompt injection.

O ponto relevante é que nenhuma dessas propostas cobre, de forma abrangente, identidade do agente, segregação instrução-dado, controle de fluxo de informação, motor de política determinístico, governança de memória e auditoria em nível de sequência em uma única arquitetura.

A proposta

Arquitetura ZTA³ em seis camadas

A arquitetura proposta reúne os elementos mais consistentes da literatura e da prática recente. A lógica central é objetiva: o modelo recomenda uma ação, mas um mecanismo externo, determinístico e auditável decide se ela pode ocorrer.

Identidade e autorização do agente

Cada agente deve possuir identidade própria, distinta da identidade do usuário humano e de contas genéricas de serviço.

Segregação entre instrução e dado

Conteúdo vindo de documentos, e-mails e outras fontes externas deve ser tratado como dado, nunca como comando autorizador.

Controle de fluxo de informação

Todo dado precisa carregar classificação de sensibilidade, e todo destino deve declarar o nível máximo de informação que pode receber.

Motor de política determinístico e externo ao modelo

O modelo pode sugerir, mas a autorização deve ser realizada por um mecanismo externo, previsível, verificável e resistente a ambiguidade semântica.

Governança de memória

A memória do agente deve ser segmentada, controlada e incapaz de transformar automaticamente conteúdo não confiável em regra durável de operação.

Observabilidade e auditoria em nível de sequência

O monitoramento precisa registrar não apenas eventos isolados, mas cadeias de decisão, contexto utilizado e consequências geradas.

Maturidade

O que já está mais consolidado e o que ainda é lacuna

Maduro

Identidade, privilégio mínimo e aprovação humana

Há ampla convergência sobre a necessidade de separar identidades, limitar privilégios e exigir intervenção humana em ações irreversíveis.

Experimental

Controle de fluxo com políticas explícitas

Soluções como o CaMeL mostram potencial, mas ainda envolvem trade-offs reais de usabilidade e completude das tarefas.

Em aberto

Identidade verificável e benchmarks corporativos

Ainda faltam padrões amplamente adotados para identidade verificável de agentes e benchmarks próximos de ambientes corporativos reais.

Limitações

O estudo é conceitual, não uma validação empírica

A proposta de arquitetura ZTA³ apresentada pelo artigo funciona como síntese estruturada de literatura e práticas emergentes. Ela não representa, ainda, uma implementação testada ponta a ponta em benchmark corporativo.

Isso significa que a próxima etapa relevante não é apenas conceitual, mas prática. Será necessário verificar se a integração dessas camadas preserva utilidade suficiente para adoção real, sem criar atrito excessivo ou reduzir demais a capacidade operacional do agente.

Fechamento

O modelo recomenda. Um mecanismo determinístico decide.

A mudança trazida pela IA agêntica é qualitativa. Um sistema que lê dados privados, interpreta linguagem natural e executa ações não pode ser governado apenas com os mesmos controles usados para software determinístico tradicional.

A direção apontada pela literatura e pela prática recente é clara: a inteligência do modelo pode sugerir a próxima ação, mas a decisão final precisa passar por uma camada externa de política, validação e auditoria.

Esse é o ponto em que Zero Trust deixa de ser apenas um princípio de rede e identidade e passa a se tornar uma disciplina de governança da própria decisão automatizada.

Palestras e eventos

Leve este debate para sua organização ou evento

Este tema pode ser adaptado para palestras, painéis executivos, aulas magnas, workshops e encontros com lideranças sobre IA, cibersegurança, governança, Zero Trust e transformação digital.

Solicitar palestra Conhecer temas de palestras

Perguntas frequentes

FAQ sobre Zero Trust para IA Agêntica

O que é Zero Trust para IA Agêntica?

É a aplicação do princípio de desconfiança contínua a sistemas de IA que não apenas respondem, mas acessam dados, raciocinam sobre contexto e executam ações em ambientes corporativos.

Por que controles tradicionais de acesso não bastam?

Porque agentes de IA interpretam linguagem natural, operam sobre múltiplas fontes e podem agir autonomamente. Isso exige políticas externas, separação entre dado e instrução, governança de memória e auditoria contextual.

O que significa dizer que o modelo recomenda e um mecanismo externo decide?

Significa que a IA pode propor uma ação, mas a autorização final precisa ser feita por um motor determinístico, externo ao modelo, capaz de permitir, negar ou exigir aprovação humana.

Qual é o risco mais emblemático nesse cenário?

Um dos riscos mais emblemáticos é a injeção de prompt indireta, em que conteúdo externo consegue influenciar o comportamento do agente como se fosse instrução legítima.

Zero Trust para IA Agêntica

Zero Trust para IA Agêntica

O problema não é a IA responder errado. É ela agir errado.