Why AI Agents Are a Different Class of Security Problem?

AI agents introduce new security risks because they can make autonomous decisions, use powerful tools, and perform real-world actions at high speed. Their access to sensitive systems, non-deterministic behavior, and broad permissions make failures harder to predict, audit, and contain.

How Competitors Turn MCP Security Into a Revenue Line?

Many vendors package essential MCP security features—such as identity-aware access, least-privilege controls, and human approval for sensitive actions—as premium offerings. This turns critical security capabilities into paid add-ons, increasing the operational cost of running production AI systems.

What is MCP security?

MCP security entails mechanisms that govern how AI agents access tools using the Model Context Protocol. Due to MCP allowing dynamic tool access, security must extend beyond basic API protection. It includes identity propagation, schema validation, and audit trails. TrueFoundry provides this through a central gateway that manages identity, security controls, and execution logs.

What are the security risks of MCP?

MCP security poses risks because agents dynamically interact with APIs. Security risks include prompt injection attacks, tool schema manipulation, and overprivileged service tokens. Multi-agent pipelines can propagate compromised context across sensitive systems. To mitigate these threats, tool calls must be validated and identity-based permissions enforced. TrueFoundry provides a secure gateway to govern these interactions.

Is Model Context Protocol safe to use?

MCP is a neutral protocol standardizing how AI models interact with tools. Whether it is safe depends on the security measures applied. Agents can gain elevated permissions and access private databases. However, by providing robust security infrastructure, such as the gateway provided by TrueFoundry, the protocol can be safely implemented to avoid exposing corporate resources.

How does Zero Trust apply to AI Agents using MCP?

Zero Trust assumes no entity is trustworthy. For an AI Agent using MCP, this means all tool calls must be authenticated and validated before execution to stop a malicious server. Agents must execute with the same privileges as the initiating user. TrueFoundry enforces Zero Trust by requiring identity propagation and monitoring all tool calls.

What is a confused deputy attack with respect to an AI-based Agent?

A confused deputy attack occurs when an AI Agent with high privileges is tricked into performing actions on behalf of a malicious actor, potentially leading to data leaks. Since the AI Agent holds valid privileges, the system may not detect the attack. Preventing this requires scoping agent privileges and validating tool call outputs.

Why is a standard API gateway not sufficient for an MCP system?

Conventional API gateways handle deterministic calls where endpoints are known. MCP-based agents behave differently; they discover tools and dynamically create parameters. Security must be enforced at the tool schema level, not just at the network level, to block malicious code. TrueFoundry extends traditional gateways to meet new security needs related to MCP.

Segurança MCP Explicada: Guia para Zero Trust em IA Agente

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

Tudo começou com uma ideia: deixar um agente de IA lidar com uma tarefa de pesquisa de várias etapas. Conectá-lo a algumas ferramentas via MCP, dar-lhe acesso às fontes de dados corretas e deixá-lo funcionar.

O que realmente aconteceu foi mais instrutivo. O agente tinha mais acesso do que a tarefa exigia. Ele chamou ferramentas em sequências que ninguém antecipou, e não havia registros para explicar o que ele havia acessado ou por quê.

Esse mesmo token que fez a demonstração funcionar poderia ter apagado o drive compartilhado da empresa se o modelo alucinasse ou encontrasse um prompt malicioso incorporado no documento que lhe foi pedido para ler.

Este é o desafio fundamental da segurança MCP. À medida que o Protocolo de Contexto do Modelo se torna o padrão para conectar LLMs a ferramentas e bancos de dados externos, proteger essas conexões exige medidas de segurança rigorosas.

Este guia explica por que a segurança tradicional de APIs falha para agentes de IA, como são os vetores de ataque reais e o que Zero Trust significa neste contexto. Ele também detalha como algumas plataformas cobram um valor premium por controles de segurança que deveriam ser padrão.

Secure every MCP tool call across your enterprise infrastructure with TrueFoundry

Por que os Agentes de IA Representam uma Categoria Diferente de Problema de Segurança

Ao contrário do software tradicional que executa fluxos de trabalho determinísticos, agentes de IA tomam decisões dinâmicas sobre quais ferramentas MCP usar e como usá-las. Essa autonomia muda a forma como o risco se propaga pelos ambientes MCP e introduz novas classes de exposição que impactam sua postura de segurança.

Os Agentes de IA representam um novo tipo de risco que é fundamentalmente diferente dos sistemas de software tradicionais. Sua combinação única de autonomia, acesso e velocidade cria riscos de segurança únicos, especialmente em sistemas baseados em MCP.

De Sistemas Somente Leitura para Sistemas de Leitura e Escrita: Ao contrário dos sistemas de IA anteriores, usados principalmente para gerar saídas via linguagem natural, Agentes de IA podem executar código malicioso, enviar e-mails, modificar bancos de dados e excluir dados. Essa mudança fundamental no comportamento da ferramenta, de passivo para ativo, amplia o raio de impacto de qualquer falha ou uso indevido.

O Problema do Token com Privilégios Excessivos: Agentes de IA frequentemente recebem acesso via contas de serviço ou tokens de API que concedem amplos privilégios sobre recursos corporativos. Isso contrasta com o software tradicional, onde o princípio do menor privilégio é comum. Agentes de IA recebem tokens com privilégios excessivos, que são altamente valiosos para atores maliciosos e propensos à exploração.

O Problema da Execução em Caixa Preta: Agentes de IA, especialmente LLMs, são dinâmicos. Eles decidem quais chamadas de API fazer, definem parâmetros e executam código de maneira não determinística e não transparente. Isso cria um risco porque é difícil antecipar ou auditar tal comportamento, prejudicando a segurança eficaz na nuvem.

A Velocidade da Exploração: Em caso de falha ou uso indevido malicioso, Agentes de IA podem acionar múltiplas chamadas de ferramentas e executar código em segundos, causando danos graves.

MCP security attack surface compared to traditional API security model

Os Vetores de Ataque Que o MCP Realmente Introduz

O Protocolo de Contexto do Modelo permite uma orquestração poderosa de ferramentas, mas também cria novas superfícies de ataque em prompts, metadados de ferramentas e fluxos de execução de agentes. Ao contrário das APIs tradicionais, os agentes interpretam instruções e metadados dinamicamente, o que torna a manipulação sutil muito mais perigosa.

As seções abaixo descrevem os principais vetores de ataque introduzidos por sistemas habilitados para MCP.

Injeção Indireta de Prompt

A injeção de prompt não é novidade, mas o MCP a leva a uma escala mais ampla. Como o agente se conecta a ferramentas ativas, prompts maliciosos, mesmo dentro de conteúdo externo, podem desencadear ações reais. O invasor inclui instruções maliciosas em um documento, página da web ou resposta de API que o agente processa.

O agente processa as instruções como legítimas e age de acordo com elas, sem saber que vêm de uma fonte maliciosa. Essa injeção indireta de prompt é uma ameaça grave para as implementações de MCP.

Envenenamento de Ferramentas e Manipulação de Esquemas

Enquanto as equipes se concentram em proteger o uso de dados pelo agente, poucos se concentram em proteger a própria ferramenta. O envenenamento de ferramentas ocorre no nível em que o agente mais confia. O invasor manipula as descrições das ferramentas, os esquemas de parâmetros ou os manifestos das ferramentas, fazendo com que o agente realize chamadas de função maliciosas disfarçadas de legítimas.

O agente confia nos metadados da ferramenta, e é aí que a exploração acontece, criando riscos de segurança significativos para a empresa.

Exfiltração Não Autorizada de Dados Através do Encadeamento de Ferramentas

O risco não é apenas a chamada maliciosa da ferramenta, mas o seu encadeamento. Os agentes encadeiam várias ferramentas para executar uma determinada tarefa, onde a exfiltração de dados ocorre com permissões abertas.

Um agente com acesso direto a dados internos de clientes e funcionalidade de pesquisa web externa pode ser explorado para resumir dados internos e transmiti-los através de consultas de pesquisa.

Não é necessário um comando específico de "enviar dados"; o agente é explorado através de combinações legítimas de ferramentas, colocando sistemas sensíveis em risco.

TrueFoundry infographic detailing common enterprise MCP security vulnerabilities

Envenenamento de Contexto em Pipelines Multiagente

O limite de confiança expandiu-se com sistemas multiagente orquestrados. Cada interação entre agentes é um ponto potencial para ataques de injeção, à medida que o contexto passa de um agente para outro.

Em sistemas onde os agentes passam informações, um cliente MCP upstream comprometido passa um contexto falso para o estado compartilhado.

O agente downstream trata o contexto comprometido como confiável e continua a propagação sem interação com o usuário original, corrompendo as operações de negócios.

Tokens Estáticos em Arquivos de Configuração

Embora a higiene de credenciais seja um problema conhecido, os sistemas MCP introduzem novos pontos de pressão. A velocidade da prototipagem de agentes supera as práticas de segurança, e os tokens estáticos em arquivos de configuração tornam-se vítimas.

Os sistemas MCP frequentemente incluem credenciais de nuvem codificadas em arquivos de configuração que se propagam para sistemas de controle de versão e ambientes.

Tokens estáticos sem rotação e sem escopo estão entre as falhas mais comumente documentadas na arquitetura MCP.

Os Princípios de Confiança Zero Aplicados ao MCP

Execução com Reconhecimento de Identidade, em Nome de: Os agentes nunca devem usar contas de serviço globais. Cada uso de ferramenta deve ser executado com as permissões exatas do usuário iniciador, prevenindo acesso não autorizado.
Menor Privilégio ao Nível do Servidor: Um servidor MCP deve ter um escopo restrito para que os agentes acessem apenas as ferramentas que sua função específica realmente exige para funcionar, e nada mais.
Controles com Intervenção Humana para Ações Destrutivas: Qualquer ferramenta capaz de alterar o estado do sistema deve exigir aprovação humana síncrona antes da execução, criando um bloqueio para ações irreversíveis e limitando a superfície de ataque.

Block prompt injection attacks before they reach your agent with TrueFoundry

Confiança Zero vs. Segurança Tradicional para MCP — Lado a Lado

Os modelos convencionais de segurança de API dependem fortemente de defesas de perímetro e de atores internos confiáveis. Agentes habilitados para MCP operam de forma diferente, invocando ferramentas dinamicamente e encadeando ações entre sistemas. Essa mudança exige um modelo de segurança de Confiança Zero, onde identidade, acesso e execução são continuamente verificados.

Dimension	Traditional API Security	Zero Trust MCP Security
Trust Model	Perimeter-based, internal actors trusted by default	No implicit trust; every request verified regardless of origin
Identity Scope	Human users and service accounts	Includes autonomous agent identities with lifecycle tracking
Token Management	Static tokens with periodic rotation	Short-lived, scoped tokens with automatic refresh per session
Audit Coverage	Request-level logging	Tool call, agent decision, input, and output logging
Anomaly Detection	Network and access pattern monitoring	Behavioral monitoring across full agent action chains

Como os Concorrentes Transformam a Segurança MCP em uma Fonte de Receita?

À medida que a adoção de MCP cresce, uma nova categoria de ferramentas surgiu para proteger o acesso de agentes a ferramentas e dados. No entanto, muitos fornecedores empacotam recursos de segurança fundamentais como funcionalidades premium, criando barreiras operacionais e de custo para equipes que implantam sistemas de IA em produção.

Execução com Reconhecimento de Identidade, em Nome de: Os agentes nunca devem usar contas de serviço globais. Cada chamada de ferramenta deve ser executada com as permissões exatas do usuário iniciador, em vez de credenciais compartilhadas.
Menor Privilégio ao Nível do Servidor: Os servidores MCP devem ter um escopo limitado, permitindo que os agentes acessem apenas as ferramentas exigidas pela função específica que desempenham, e nada mais.
Controles com Intervenção Humana para Ações Destrutivas: Qualquer ferramenta com potencial destrutivo deve ser aprovada por um humano antes da execução, criando um bloqueio para tais ações.

TrueFoundry strategy for establishing robust zero-trust MCP security

Como a TrueFoundry Oferece Segurança MCP de Confiança Zero Sem o Custo Adicional para Empresas

A TrueFoundry é uma plataforma de IA empresarial projetada para ajudar equipes de segurança a construir, implantar e operar sistemas de IA em produção com segurança. À medida que as organizações adotam agentes baseados em MCP, a TrueFoundry fornece a infraestrutura necessária para aplicar governança, identidade e controle de acesso em todas as interações.

A plataforma incorpora a segurança MCP de Confiança Zero na camada de execução para que as equipes possam implantar agentes sem adicionar gateways de segurança separados ou complementos empresariais.

Um Gateway MCP Central: O Gateway MCP da TrueFoundry atua como o único ponto de entrada governado para todo o tráfego de agente para ferramenta, prevenindo ações não autorizadas e não intencionais. Cada servidor MCP deve ser registrado em um registro verificado antes que os agentes possam acessá-lo, eliminando vulnerabilidades de configuração dispersas.
Execução Nativa em Nome de: Os agentes herdam as permissões exatas do usuário que iniciou a tarefa. A integração nativa com Okta e Azure AD garante uma aplicação consistente e auditável em todos os fluxos de trabalho.
Salvaguardas Pré e Pós-Chamada: A TrueFoundry valida cada chamada de ferramenta contra esquemas definidos antes da execução e inspeciona as saídas posteriormente. Isso impõe o Zero Trust na camada de protocolo, evitando riscos graves de segurança do MCP.
Observabilidade Completa e Recursos de Segurança Incluídos como Padrão: Cada chamada de ferramenta e ação de agente é registrada com metadados estruturados dentro da sua própria VPC, resolvendo grandes preocupações de segurança. Registros de auditoria e RBAC vêm como padrão, não estão bloqueados por caros níveis de atualização empresarial, garantindo uma cadeia de suprimentos segura.

Conclusão: Não Deixe os Agentes Corrigir o Próprio Dever de Casa

A taxa de adoção do MCP é tal que a maioria das equipes opera sob pressão e, sob pressão, elas tomam atalhos. Uma demonstração funciona, o agente é funcional, e a governança é um recurso a ser adicionado posteriormente, o que raramente vem de graça.

A questão é estrutural. Quando um agente pode fazer chamadas autonomamente entre sistemas internos e APIs externas, nenhuma quantidade de governança no nível do prompt pode mitigar um gateway que nunca foi projetado para tal realidade. Você não está apenas protegendo uma solicitação, você está protegendo um processo de tomada de decisão que pode levar a dezenas de ações antes mesmo que um humano seja apresentado a um resultado.

As equipes que se arrependerão da sua adoção do MCP não são as equipes que foram muito rápido. São as equipes que acreditam que sua pilha de segurança existente se adaptará e ajustará sem mudanças significativas. Gateways de API tradicionalmente não entendem esquemas de ferramentas. Modelos de autenticação tradicionalmente não foram projetados para cenários "em nome de" envolvendo agentes autônomos. E paywalls para empresas onde o controle de acesso baseado em função básico é um recurso premium não são um modelo de segurança; são um modelo de receita.

Zero Trust para MCP não é uma caixa de seleção; é um compromisso. Cada chamada de ferramenta é verificada, cada ação de agente é registrada e cada permissão é baseada no usuário que iniciou o fluxo de trabalho. A diferença entre as equipes que acertam isso e aquelas que o fazem após uma violação é simplesmente se a governança foi uma parte central do gateway desde o primeiro dia. A TrueFoundry torna isso o padrão, não um recurso.

Transition your AI agents from risky prototypes to secure enterprise production deployments

Perguntas Frequentes

O que é segurança MCP?

A segurança MCP envolve mecanismos que governam como os agentes de IA acessam ferramentas usando o Protocolo de Contexto do Modelo. Devido ao MCP permitir acesso dinâmico a ferramentas, a segurança deve ir além da proteção básica de API. Inclui propagação de identidade, validação de esquema e trilhas de auditoria. A TrueFoundry oferece isso através de um gateway central que gerencia identidade, controles de segurança e logs de execução.

Quais são os riscos de segurança do MCP?

A segurança MCP apresenta riscos porque os agentes interagem dinamicamente com APIs. Os riscos de segurança incluem ataques de injeção de prompt, manipulação de esquema de ferramenta e tokens de serviço com privilégios excessivos. Pipelines multiagente podem propagar contexto comprometido por sistemas sensíveis. Para mitigar essas ameaças, as chamadas de ferramenta devem ser validadas e as permissões baseadas em identidade devem ser aplicadas. A TrueFoundry oferece um gateway seguro para governar essas interações.

É seguro usar o Protocolo de Contexto do Modelo?

MCP é um protocolo neutro que padroniza a interação de modelos de IA com ferramentas. A sua segurança depende das medidas de segurança aplicadas. Agentes podem obter permissões elevadas e aceder a bases de dados privadas. No entanto, ao fornecer uma infraestrutura de segurança robusta, como o gateway oferecido pela TrueFoundry, o protocolo pode ser implementado com segurança para evitar a exposição de recursos corporativos.

Como a Confiança Zero se aplica a Agentes de IA que usam MCP?

A Confiança Zero assume que nenhuma entidade é confiável. Para um Agente de IA que usa MCP, isso significa que todas as chamadas de ferramenta devem ser autenticadas e validadas antes da execução para impedir um servidor malicioso. Os agentes devem ser executados com os mesmos privilégios do utilizador iniciador. A TrueFoundry impõe a Confiança Zero ao exigir a propagação de identidade e o monitoramento de todas as chamadas de ferramenta.

O que é um ataque de "confused deputy" em relação a um Agente baseado em IA?

Um ataque de "confused deputy" ocorre quando um Agente de IA com altos privilégios é enganado para realizar ações em nome de um ator malicioso, o que pode levar a fugas de dados. Como o Agente de IA possui privilégios válidos, o sistema pode não detetar o ataque. A prevenção disso exige a delimitação dos privilégios do agente e a validação das saídas das chamadas de ferramenta.

Por que um gateway de API padrão não é suficiente para um sistema MCP?

Gateways de API convencionais lidam com chamadas determinísticas onde os endpoints são conhecidos. Agentes baseados em MCP comportam-se de forma diferente; eles descobrem ferramentas e criam parâmetros dinamicamente. A segurança deve ser aplicada ao nível do esquema da ferramenta, e não apenas ao nível da rede, para bloquear código malicioso. A TrueFoundry estende os gateways tradicionais para atender às novas necessidades de segurança relacionadas ao MCP.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now