O Problema da Proliferação de Agentes: Por que as Empresas Precisam de Controle Antes da Autonomia

By Sarthak Singh

Published: May 21, 2026

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

Líderes de tecnologia corporativa já viram esse padrão antes.

A proliferação de SaaS deu velocidade às equipes de negócios, mas criou duplicação, TI sombra, risco de acesso e complexidade de fornecedores. A proliferação de APIs melhorou a reutilização, mas introduziu endpoints não gerenciados e controles inconsistentes. A proliferação da nuvem deu flexibilidade aos desenvolvedores, então forçou as empresas a reconstruir a disciplina em torno de identidade, custo, conformidade e observabilidade.

Os agentes de IA são a próxima versão desse problema.

A diferença é que os agentes não são apenas aplicativos, APIs ou infraestrutura. Eles são atores de software. Eles podem raciocinar, usar ferramentas, acessar dados, acionar fluxos de trabalho e agir em nome de usuários ou processos de negócios.

Isso torna a proliferação de agentes mais complexa do que as ondas anteriores de tecnologia empresarial. Um aplicativo SaaS armazena e processa dados. Uma API expõe uma capacidade. Um serviço de nuvem executa infraestrutura. Um agente pode coordenar os três.

A questão para as empresas não é mais se elas construirão agentes. Elas o farão. A verdadeira questão é se elas os governarão antes que se multipliquem.

Os agentes se espalharão mais rápido do que a governança

Agentes são fáceis de prototipar.

Uma equipe pode conectar um modelo a um framework, adicionar recuperação, expor algumas ferramentas e automatizar um fluxo de trabalho em dias. Os resultados iniciais são convincentes: um agente de suporte que resume tickets, um agente de vendas que prepara resumos de contas, um agente de engenharia que revisa código ou um agente de operações que tria incidentes.

Essa facilidade de criação é exatamente por que a proliferação é provável.

Cada função desejará seus próprios agentes. Cada equipe de produto desejará agentes incorporados. Cada equipe de engenharia testará agentes de codificação e operacionais. Cada equipe de dados explorará agentes analíticos. Este é o resultado natural do desenvolvimento democratizado de IA.

O mercado já está se movendo nessa direção. A Forrester observa que as plataformas de IA estão cada vez mais focadas em IA agêntica, com fornecedores apoiando o desenvolvimento e a implantação de assistentes de IA, agentes e aplicativos de IA. Mas a mesma mudança levanta um desafio de produção: a IA de nível empresarial ainda exige observabilidade, governança contínua, conformidade, gerenciamento do ciclo de vida e otimização de custos.

Essa tensão define a próxima fase da IA empresarial: a capacidade de construir agentes está se espalhando mais rápido do que o modelo operacional para gerenciá-los.

Por que a proliferação de agentes é diferente

Os agentes combinam múltiplas camadas de comportamento.

Um único agente pode envolver um modelo de base, prompts, instruções de sistema, pipelines de recuperação, APIs, servidores MCP, memória, identidade do usuário, permissões, caminhos de aprovação humana, rastreamentos, conjuntos de dados de avaliação e políticas de custo.

Isso significa que o risco não está isolado em um único componente. Ele se move por todo o caminho de execução.

Um agente pode falhar porque o modelo alucinou, o prompt era fraco, o contexto recuperado estava errado, o esquema da ferramenta era ambíguo, o usuário tinha permissões excessivas, o fluxo de trabalho não tinha uma etapa de aprovação, ou a lógica de repetição gerou custos descontrolados.

O software tradicional é governado pelo controle de código, acesso e implantação. Sistemas de agentes exigem controle sobre o comportamento.

A Gartner define agentes de IA como entidades de software autônomas ou semiautônomas que percebem, tomam decisões, agem e alcançam objetivos em ambientes digitais ou físicos. Também observa que muitos agentes atuais baseados em LLM permanecem mais próximos de fluxos de trabalho aumentados por LLM do que de sistemas totalmente adaptativos, e que a prontidão varia significativamente por tipo de agente.

Isso importa porque o mercado já está usando a linguagem de agentes antes que muitos sistemas atinjam a maturidade operacional de agentes. Mesmo antes de os agentes se tornarem totalmente autônomos, eles já são complexos o suficiente para criar lacunas de governança.

A primeira lacuna: inventário

O primeiro sintoma da proliferação de agentes será a falha no inventário.

A maioria das empresas não saberá inicialmente quantos agentes existem, quem os possui, quais modelos eles usam, quais dados eles acessam, quais ferramentas eles podem chamar ou quanto custam.

Na era SaaS, a pergunta sobre o inventário era: “Quais aplicativos os funcionários estão usando?”

Na era dos agentes, a pergunta sobre o inventário torna-se:

Quais agentes existem?
Quem possui cada agente?
Qual é o seu propósito e nível de autonomia?
Quais usuários ou sistemas podem invocá-lo?
Quais modelos, fontes de dados e ferramentas ele pode acessar?
Quais ações ele pode realizar?
Quais políticas se aplicam?
Quanto custa por tarefa ou fluxo de trabalho?
Quando foi avaliado pela última vez?

Isso não é catalogação. É a base para a responsabilização.

O Panorama de Soluções de Governança de IA da Forrester identifica o inventário de IA como um grande ponto problemático e afirma que as organizações estão buscando visibilidade e controle sobre os ativos de IA para atingir objetivos de negócios, regulatórios e de IA responsável.

Os agentes tornam esse problema de inventário mais urgente porque não são ativos passivos. Eles agem.

O acesso a ferramentas é onde o risco se torna real

Um agente que redige conteúdo apresenta um nível de risco. Um agente que pode chamar ferramentas apresenta outro.

No momento em que um agente pode consultar um banco de dados, atualizar um CRM, acionar um fluxo de trabalho, enviar uma mensagem, modificar a infraestrutura, criar um ticket ou executar código, ele se torna parte da superfície de controle empresarial.

Padrões como o Protocolo de Contexto de Modelo facilitam a conectividade de ferramentas. Mas uma conectividade mais fácil não cria automaticamente a prontidão empresarial.

A pesquisa do Gartner sobre o MCP Gateway observa que empresas que adotam o MCP encontraram lacunas em torno de registro, descoberta, autenticação forçada, autorização, contabilidade e auditoria. Também afirma que as empresas precisam de uma forma de registrar, descobrir e observar centralmente milhares de servidores MCP em potencial.

A lição mais ampla é simples: toda ferramenta que um agente pode usar deve ser registrada, ter permissões atribuídas, ser observável e auditável.

O futuro não pode ser “agentes conectados a tudo”. Tem que ser “agentes conectados a capacidades aprovadas através de pontos de controle governados”.

A curva de custos irá surpreender as equipes

A proliferação de agentes também criará risco de custos.

Uma interação de chatbot pode envolver uma ou algumas chamadas de modelo. Um fluxo de trabalho agêntico pode envolver planejamento, recuperação, seleção de ferramentas, execução de ferramentas, validação, novas tentativas, sumarização e geração de resposta final. Um único pedido do usuário pode se transformar em uma longa cadeia de chamadas de modelo e chamadas de ferramentas.

É por isso que a economia dos agentes pode surpreender as equipes. O Gartner observa que fluxos de trabalho agênticos podem transformar um único pedido do usuário em dezenas ou centenas de chamadas de LLM, especialmente quando os agentes planejam, usam ferramentas, tentam novamente ou entram em loop. Sem políticas e salvaguardas, os agentes não consideram naturalmente o custo dessas ações.

Isso quebra a simplicidade da geração de relatórios em nível de token.

A melhor métrica não é apenas o custo por token. É o custo por resultado:

‍

Old metric	Better agent-era metric
Cost per token	Cost per completed task
Cost per model call	Cost per resolved workflow
Monthly AI spend	Unit economics by workflow
Cost by provider	Cost by agent, team, and outcome

‍

O risco de custos não é teórico. O Gartner prevê que, até 2028, pelo menos 50% dos projetos de GenAI excederão os custos orçados devido a escolhas arquitetônicas inadequadas e falta de know-how operacional. Também prevê que a inferência representará pelo menos 70% dos custos totais de vida útil do modelo até 2028.

A proliferação de agentes amplificará esse risco porque os gastos se originarão de muitas equipes, fluxos de trabalho, ferramentas e modelos. Sem controles de custo em tempo de execução, os líderes descobrirão a conta depois que a arquitetura já estiver fragmentada.

A observabilidade deve evoluir para responsabilização

A observabilidade tradicional informa às equipes se os sistemas estão disponíveis, lentos, saturados ou falhando.

A observabilidade do agente precisa explicar por que o agente se comportou como o fez.

Para cada ação importante do agente, as equipes precisam saber o objetivo original, a versão do prompt, o modelo utilizado, o contexto recuperado, a ferramenta selecionada, os argumentos passados, as salvaguardas aplicadas, a decisão de política tomada, os tokens consumidos, a latência por etapa, o custo por etapa, o status de aprovação humana e o resultado final.

O Guia de Mercado da Gartner para Plataformas de Avaliação e Observabilidade de IA afirma que o não-determinismo em GenAI e IA agêntica torna difícil medir e melhorar a confiabilidade e a confiança. Ele define essas plataformas como ferramentas que combinam avaliações com logs, métricas e rastreamentos para melhorar a confiabilidade e o alinhamento.

Isso importa porque as falhas do agente nem sempre são falhas de infraestrutura.

Um agente pode estar disponível e ainda assim estar errado. Pode ser rápido e ainda assim inseguro. Pode concluir uma tarefa e ainda assim violar a política. Pode chamar uma ferramenta permitida pelo motivo errado.

Na era dos agentes, a observabilidade não é apenas para depuração. É para responsabilização.

A avaliação não pode permanecer manual

Muitas equipes ainda avaliam sistemas de IA por meio de revisão manual, testes ad hoc ou qualidade de demonstração. Isso não escala quando dezenas ou centenas de agentes estão mudando prompts, modelos, ferramentas e fontes de contexto.

Testes tradicionais funcionam bem quando as saídas são determinísticas. As saídas do agente são probabilísticas e dependentes do contexto. A questão nem sempre é se uma resposta exata foi produzida. É se a resposta ou ação foi boa o suficiente, segura o suficiente, fundamentada o suficiente e alinhada o suficiente para o uso pretendido.

A lacuna de avaliação ainda é grande. A Gartner relata que apenas 18% dos entrevistados usam ferramentas de avaliação de IA para testar as saídas e comportamentos de agentes de IA personalizados hoje. Isso importa porque, à medida que os agentes se multiplicam, a revisão manual e a confiança baseada em demonstrações não escalarão.

Empresas que escalam agentes precisarão de avaliação contínua em toda a conclusão de tarefas, fundamentação, uso de ferramentas, segurança, conformidade com políticas, custo e confiabilidade.

O padrão crítico é um ciclo de feedback: rastreamentos de produção se tornam conjuntos de dados de avaliação, falhas se tornam testes de regressão e correções humanas melhoram o comportamento futuro.

Sem esse ciclo, cada equipe aprende isoladamente, e a proliferação de agentes se torna incontrolável.

A governança precisa se tornar executável

A governança de IA tem sido frequentemente tratada como uma função de documentação e revisão: cartões de modelo, avaliações de risco, listas de verificação de conformidade, comitês de aprovação e evidências de auditoria.

Isso continua sendo necessário, mas não é suficiente para agentes.

Agentes tomam decisões em tempo de execução. Eles encontram contextos em mudança, usam ferramentas, geram custos e interagem com sistemas dinamicamente. Processos de aprovação estáticos não conseguem antecipar todas as ações que um agente pode tentar.

O relatório Wave da Forrester sobre Soluções de Governança de IA destaca que ferramentas de governança ajudam as empresas a ir além das limitações da governança por planilhas e comitês à medida que escalam casos de uso de IA, propriedade, avaliações de risco, auditorias de conformidade e confiança em IA de terceiros.

A governança não deve ser vista como um freio à adoção da IA. A Forrester relata que 79% dos tomadores de decisão em IA concordaram que a governança de IA ajuda suas organizações a se adaptarem rapidamente às mudanças nas condições de mercado e regulatórias. A era dos agentes testará se essa governança pode passar da intenção política para o controle em tempo de execução.

A IA agêntica leva isso ainda mais longe. A governança deve se tornar executável.

Policy intent	Runtime control
Prevent sensitive data exposure	Redact, block, or restrict context access
Control spend	Apply budgets, quotas, routing, and loop limits
Govern tool use	Allow, deny, scope, or require approval
Maintain reliability	Fail over, retry, degrade, or stop
Ensure auditability	Log model calls, tool calls, and policy decisions
Manage autonomy	Escalate based on risk, confidence, or action type

‍

Esta é a diferença entre governança como supervisão e governança como infraestrutura.

A proliferação de agentes não será resolvida pedindo a cada equipe que preencha mais formulários. Será resolvida tornando o caminho governado mais fácil do que o caminho não controlado.

A questão da liderança: quanta autonomia é apropriada?

A decisão mais importante sobre agentes empresariais não é qual modelo ou framework usar. É quanta autonomia permitir.

Um agente de sumarização de documentos, um agente de pesquisa de vendas, um agente de geração de código, um agente de aprovação financeira e um agente de remediação de infraestrutura não devem ter a mesma autoridade. Cada um carrega um nível diferente de risco de negócio, segurança, conformidade e custo.

O caminho certo é a autonomia progressiva: comece com casos de uso delimitados, instrumente tudo, avalie continuamente e expanda a autoridade apenas onde o agente se mostrar confiável, econômico e governável.

Antes de escalar agentes, as equipes de liderança devem perguntar:

Question	What it reveals
Do we know every agent running across the organization?	Inventory maturity
Are tools and MCP servers registered, permissioned, and audited?	Tool governance
Can we trace every model call, tool call, and policy decision?	Observability maturity
Can we evaluate behavior before and after deployment?	Quality discipline
Can we enforce budgets by team, workflow, and agent?	Cost governance
Can high-risk actions require human approval?	Autonomy control
Can we prove what happened after an incident?	Audit readiness

Se a resposta for não para a maioria destas, a organização pode estar pronta para experimentação de agentes, mas não para uma ampla implantação de agentes.

‍

O que os líderes devem fazer agora

A proliferação de agentes não é inevitável, mas preveni-la exige decisões arquitetônicas precoces.

Primeiro, crie um modelo de inventário para agentes, ferramentas, modelos, prompts e fluxos de trabalho. Propriedade, propósito, nível de autonomia, acesso a dados, acesso a ferramentas e status de avaliação devem ser visíveis desde o início.

Segundo, centralize o acesso ao modelo. Não permita que cada equipe gerencie suas próprias credenciais, lógica de provedor, roteamento, orçamentos e logs.

Terceiro, governe o acesso a ferramentas antes que se torne incontrolável. Agentes não devem se conectar diretamente a ferramentas arbitrárias. As ferramentas devem ser registradas, permissionadas, monitoradas e auditadas.

Quarto, torne a observabilidade e a avaliação obrigatórias para agentes em produção. Todo agente importante deve produzir rastros que expliquem chamadas de modelo, contexto, uso de ferramentas, decisões de política, custo e resultados finais.

Em quinto lugar, defina níveis de autonomia com base no risco. Agentes de baixo risco podem agir mais rapidamente. Agentes de alto risco precisam de aprovações, diretrizes mais rigorosas e maior capacidade de auditoria.

Por fim, avalie a economia dos agentes com base nos resultados. Custo por token não é suficiente. Líderes precisam de custo por tarefa, custo por fluxo de trabalho, custo por decisão e custo por resultado de negócio.

Consideração final

Agentes se tornarão uma parte fundamental do software empresarial. Essa não é a questão.

A questão é se as empresas permitirão que os agentes se disseminem da mesma forma que SaaS, APIs e a nuvem fizeram um dia: rapidamente, de forma útil e, depois, caoticamente.

A proliferação de agentes é evitável, mas apenas se os líderes reconhecerem os agentes pelo que eles são: entidades de software que tomam ações e que exigem identidade, política, observabilidade, controle de custos e governança.

O futuro da IA empresarial não será definido pelo número de agentes que uma organização lança.

Será definido pela segurança com que esses agentes podem agir.

A autonomia criará valor. O controle a tornará escalável.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now

The fastest way to build, govern and scale your AI

How Can You Prevent GenAI Costs From Spiraling at Scale?

Gartner report on best practices for optimizing generative and agentic AI costs and projected statistics.

Access Full 2026 Report

Gartner Hype Cycle for Platform Engineering 2026

Access Full 2026 Report

One Layer of Control for All AI

Route and govern model and tool traffic with a centralized AI Gateway

Book Demo

Table of Contents

Text Link

One Gateway for Every LLM, Agent and MCP Server

Book a 30-min with our AI expert

Book a Demo

Summarize with

Blurry red snowflake on white background, symmetrical frosty design with soft edges and abstract shape.

Frequently asked questions

O que é a proliferação de agentes?

A proliferação de agentes ocorre quando as equipas criam agentes de IA em várias funções sem visibilidade centralizada, propriedade, governança, controlo de custos ou auditabilidade.

Por que a proliferação de agentes é mais arriscada do que a proliferação de SaaS ou API?

Agentes podem raciocinar, usar ferramentas, acessar dados, acionar fluxos de trabalho e atuar em nome dos usuários. Isso faz com que o risco seja comportamental, e não apenas operacional.

O que as empresas devem governar primeiro?

Comece com o inventário de agentes, acesso a modelos, permissões de ferramentas, rastreabilidade, avaliação, orçamentos e fluxos de trabalho de aprovação para ações de alto risco.

Por que o MCP aumenta a necessidade de governança?

O MCP facilita a conectividade das ferramentas, mas as empresas ainda precisam de registro, autenticação, autorização, observabilidade e auditoria para cada ferramenta que um agente pode acessar.

Como os líderes devem pensar sobre a autonomia dos agentes?

A autonomia deve ser progressiva. Comece com casos de uso delimitados, avalie o comportamento continuamente e expanda a autoridade apenas quando a confiabilidade, o custo e a governança forem comprovados.

O Problema da Proliferação de Agentes: Por que as Empresas Precisam de Controle Antes da Autonomia

Built for Speed: ~10ms Latency, Even Under Load

Os agentes se espalharão mais rápido do que a governança

Por que a proliferação de agentes é diferente

A primeira lacuna: inventário

O acesso a ferramentas é onde o risco se torna real

A curva de custos irá surpreender as equipes

A observabilidade deve evoluir para responsabilização

A avaliação não pode permanecer manual

A governança precisa se tornar executável

A questão da liderança: quanta autonomia é apropriada?

O que os líderes devem fazer agora

Consideração final

The fastest way to build, govern and scale your AI

One Layer of Control for All AI

One Gateway for Every LLM, Agent and MCP Server

The fastest way to build, govern and scale your AI

Discover More

Melhores Ferramentas de Observabilidade de LLM

Schema-Driven Forms in React: Building with TrueFoundry FormBuilder

Integração Pangea com o Gateway de IA da TrueFoundry

As 5 Melhores Alternativas ao LiteLLM para Empresas em 2026

Recent Blogs

Schema-Driven Forms in React: Building with TrueFoundry FormBuilder

Deterministic vs Agentic Workflows: Lessons from Building a Shopping Assistant

Bifrost vs Portkey: Pricing, Gateway Features, and Enterprise Fit Compared

Kong AI Reviews 2026: What Real Users Say About the Platform

LiteLLM Enterprise: What It Is and When to Consider an Alternative

7 Braintrust Alternatives Worth Considering in 2026

Helicone Pricing in 2026: Full Breakdown of Plans, Costs, and What Enterprises Need to Know

Helicone vs Braintrust: A Practical Comparison for Engineering Teams in 2026

OpenRouter Reviews 2026: What Real Users Say About the Platform and Where It Stops

Cross App Access on the TrueFoundry MCP Gateway: Identity-Governed Agent Access, Powered by Your IdP

Tool vs. Skill vs. Sub-agent: The Delegation Spectrum and Its Governance

The AI Agent Glossary, Mapped to Production Infrastructure

TrueFoundry + Seldon: One Control Plane for Enterprise AI

TrueFoundry + Seldon: Unified Control Plane for Enterprise AI

Braintrust Reviews 2026: What Users Actually Say and What Enterprises Need to Know

Frequently asked questions

O que é a proliferação de agentes?

Por que a proliferação de agentes é mais arriscada do que a proliferação de SaaS ou API?

O que as empresas devem governar primeiro?

Por que o MCP aumenta a necessidade de governança?

Como os líderes devem pensar sobre a autonomia dos agentes?

Recursos

Por que TrueFoundry?

Assine nossa newsletter