Série Gateway de Agentes (Parte 3 de 7) | A2A com tecnologia TrueFoundry: Padronizando o Monólogo Interno

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
No início dos anos 2010, a revolução dos microsserviços atingiu um obstáculo. Tínhamos quebrado nossos monólitos em centenas de serviços, mas não havíamos chegado a um acordo sobre como eles deveriam se comunicar. Algumas equipes usavam REST, outras XML-RPC, outras TCP puro. O resultado foi uma "Torre de Babel"—um ecossistema fragmentado onde a integração era dolorosa e a observabilidade, impossível.
A indústria resolveu isso com a padronização: gRPC para o transporte, Protobuf para o esquema, e OpenTelemetry para a observabilidade.
Hoje, o IA Agente ecossistema está exatamente nesse caos pré-padronização.
- Sua equipe de Ciência de Dados está construindo "Agentes de Raciocínio" em Python usando LangChain.
- Sua equipe de Frontend está construindo "Assistentes de UI" em Node.js usando Vercel AI SDK.
- Sua equipe de P&D está experimentando com Microsoft AutoGen enxames.
Estes agentes não conseguem colaborar naturalmente. Têm diferentes representações de estado, diferentes mecanismos de tratamento de erros e nenhum conceito de identidade partilhado.
Para resolver isto, a TrueFoundry introduz o suporte para Protocolo A2A (Agente-para-Agente). É uma camada de transporte rigorosa que normaliza a comunicação, transformando uma coleção fragmentada de scripts numa Malha Cognitiva.
O Conceito Central: O Envelope A2A
O erro fundamental em muitos designs iniciais de agentes é tratar a comunicação agente-para-agente como uma simples chamada de API (POST /chat { "prompt": "..." }). Isto é insuficiente porque carece de Metacognição.
Um agente não precisa apenas do texto da mensagem. Precisa de saber:
- Quem disse isto? (Identidade)
- Porquê estamos a fazer isto? (Rastreabilidade)
- Pode Consigo responder? (Orçamento)
O Protocolo A2A resolve isso encapsulando cada interação em um formato padronizado Envelope. Tratamos a lógica de negócios do agente (o prompt) como a Carga Útil, mas o encapsulamos em um rígido Plano de Controle.

Fig 1: O Envelope A2A e sua Estrutura Subjacente
Leia também: MCP vs A2A
Um Exemplo Concreto: A Sala de Negociações de "Fusões e Aquisições"
Para ilustrar o poder deste protocolo, vamos analisar um cenário complexo e multi-stack: Um Sistema de Due Diligence de F&A.
Este sistema requer três agentes altamente especializados, executando em pilhas de tecnologia completamente diferentes:
- O Líder da Negociação (Gerente): Desenvolvido em Python/LangChain. Ele orquestra o processo.
- O Revisor Jurídico: Construído em Node.js. Ele usa bibliotecas especializadas para analisar contratos em PDF.
- O Perito Contábil: Construído como uma Microsoft AutoGen Team. Ele realiza um debate multiagente para encontrar fraudes em planilhas Excel.
O Desafio da Interoperabilidade
Sem um protocolo, o Python Manager não consegue acionar facilmente a equipe AutoGen. O AutoGen espera um formato específico de histórico de conversação, enquanto o LangChain espera uma "Chain". Se o Revisor Jurídico (Node) lançar um erro, o Python Manager pode interpretá-lo como uma alucinação em vez de uma falha do sistema.
A Solução A2A
- Normalização: O Líder de Negócios envia uma mensagem A2A padrão: Tarefa: "Analisar Finanças do Alvo".
- Roteamento: O Gateway recebe isso. Ele sabe que o "Perito Contábil" é um enxame AutoGen.
- Tradução: O Adaptador de Protocolo do Gateway converte o JSON A2A no formato específico de mensagem user_proxy exigido pelo AutoGen.
- Injeção de Contexto: O Gateway injeta o NDA-Cleared-Token no contexto, provando ao Contabilista que lhe é permitido visualizar os ficheiros Excel confidenciais.

Fig. 2: O Fluxo Detalhado de um Processo de Revisão Legal
O Modelo de Roteamento Hub-and-Spoke
Numa malha de agentes peer-to-peer, o Agente A chama o Agente B diretamente. Isto é perigoso porque compromete a observabilidade e a segurança. Se o Agente A for comprometido, pode inundar o Agente B com pedidos, e ninguém saberá até que a fatura chegue.
O Protocolo A2A impõe um Hub-and-Spoke modelo.
- Sem Ligações Diretas: Os Agentes não podem comunicar diretamente entre si. Eles dirigem-se ao Gateway.
- O Intermediário de Confiança: O Gateway valida o envelope. Garante que o trace_id está presente. Verifica o budget_remaining.
- A "Prova de Falsificação": Como o Gateway injeta o contexto de Identidade, o Agente B sabe que o pedido realmente veio do Líder de Negócios, e não de um ator malicioso a fingir ser o líder.

Rastreamento Distribuído: A "Pilha de Pensamento"
Depurar um único LLM é difícil. Depurar uma cadeia recursiva de 5 agentes é impossível sem rastreamento distribuído.
Quando o "Líder de Negócios" não consegue fechar o negócio de M&A, você precisa saber o porquê. Foi um tempo limite no agente Jurídico? O Contador Forense ficou sem tokens?
O Protocolo A2A exige Propagação de Cabeçalhos. Quando o Gateway recebe a requisição inicial, ele gera um TraceID. Ele força cada agente a jusante a incluir este ID em suas subchamadas.
Isso nos permite visualizar a "Pilha de Pensamento"—um gráfico de Gantt temporal da cognição. Podemos ver que o Agente Jurídico levou 45 segundos (gargalo de latência) enquanto o Contador levou 2 segundos.

Fig. 3: Gráfico de Gantt deste Negócio de M&A
Agnosticismo de Framework: O Adaptador Universal
A peça final do Protocolo A2A é o Adaptador Universal.
Reconhecemos que os desenvolvedores sempre usarão ferramentas diferentes. Alguns adoram o LangGraph pelo seu controle; outros preferem o CrewAI pelas suas funcionalidades de interpretação de papéis.
O Gateway atua como uma Camada de Tradução.
- Entrada: Ele aceita a saída nativa desses frameworks (por exemplo, um LangChain AIMessage).
- Normalização: Ele o converte para o JSON Padrão A2A.
- Saída: Ele o converte para o formato de entrada esperado pelo receptor.
Isso permite que você construa uma Malha de Agentes Heterogêneos. Você não está preso a uma única biblioteca Python. Você pode escolher a melhor ferramenta para o trabalho de cada agente específico e deixar que o Protocolo lide com a comunicação.
Conclusão
A padronização é o pré-requisito para a escala. Assim como o TCP/IP permitiu que a internet conectasse diferentes computadores, o Protocolo A2A mais as capacidades de IA da TrueFoundry de gateway de agente permitem que a empresa conecte diferentes inteligências. Ele transforma uma coleção de "Chatbots" em uma coordenada, observável e segura Força de Trabalho Digital.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI













.webp)







.webp)

.webp)
.webp)





.png)



