Série Gateway de Agentes (Parte 3 de 7) | A2A com tecnologia TrueFoundry: Padronizando o Monólogo Interno

Published: May 21, 2026

Built for Speed: ~10ms Latency, Even Under Load

Blazingly fast way to build, track and deploy your models!

Handles 350+ RPS on just 1 vCPU — no tuning needed
Production-ready with full enterprise support

Get Started with Truefoundry Now Talk to the Expert

No início dos anos 2010, a revolução dos microsserviços atingiu um obstáculo. Tínhamos quebrado nossos monólitos em centenas de serviços, mas não havíamos chegado a um acordo sobre como eles deveriam se comunicar. Algumas equipes usavam REST, outras XML-RPC, outras TCP puro. O resultado foi uma "Torre de Babel"—um ecossistema fragmentado onde a integração era dolorosa e a observabilidade, impossível.

A indústria resolveu isso com a padronização: gRPC para o transporte, Protobuf para o esquema, e OpenTelemetry para a observabilidade.

Hoje, o IA Agente ecossistema está exatamente nesse caos pré-padronização.

Sua equipe de Ciência de Dados está construindo "Agentes de Raciocínio" em Python usando LangChain.
Sua equipe de Frontend está construindo "Assistentes de UI" em Node.js usando Vercel AI SDK.
Sua equipe de P&D está experimentando com Microsoft AutoGen enxames.

Estes agentes não conseguem colaborar naturalmente. Têm diferentes representações de estado, diferentes mecanismos de tratamento de erros e nenhum conceito de identidade partilhado.

Para resolver isto, a TrueFoundry introduz o suporte para Protocolo A2A (Agente-para-Agente). É uma camada de transporte rigorosa que normaliza a comunicação, transformando uma coleção fragmentada de scripts numa Malha Cognitiva.

O Conceito Central: O Envelope A2A

O erro fundamental em muitos designs iniciais de agentes é tratar a comunicação agente-para-agente como uma simples chamada de API (POST /chat { "prompt": "..." }). Isto é insuficiente porque carece de Metacognição.

Um agente não precisa apenas do texto da mensagem. Precisa de saber:

Quem disse isto? (Identidade)
Porquê estamos a fazer isto? (Rastreabilidade)
Pode Consigo responder? (Orçamento)

O Protocolo A2A resolve isso encapsulando cada interação em um formato padronizado Envelope. Tratamos a lógica de negócios do agente (o prompt) como a Carga Útil, mas o encapsulamos em um rígido Plano de Controle.

‍

Fig 1: O Envelope A2A e sua Estrutura Subjacente

Um Exemplo Concreto: A Sala de Negociações de "Fusões e Aquisições"

Para ilustrar o poder deste protocolo, vamos analisar um cenário complexo e multi-stack: Um Sistema de Due Diligence de F&A.

Este sistema requer três agentes altamente especializados, executando em pilhas de tecnologia completamente diferentes:

O Líder da Negociação (Gerente): Desenvolvido em Python/LangChain. Ele orquestra o processo.
O Revisor Jurídico: Construído em Node.js. Ele usa bibliotecas especializadas para analisar contratos em PDF.
O Perito Contábil: Construído como uma Microsoft AutoGen Team. Ele realiza um debate multiagente para encontrar fraudes em planilhas Excel.

O Desafio da Interoperabilidade

Sem um protocolo, o Python Manager não consegue acionar facilmente a equipe AutoGen. O AutoGen espera um formato específico de histórico de conversação, enquanto o LangChain espera uma "Chain". Se o Revisor Jurídico (Node) lançar um erro, o Python Manager pode interpretá-lo como uma alucinação em vez de uma falha do sistema.

A Solução A2A

Normalização: O Líder de Negócios envia uma mensagem A2A padrão: Tarefa: "Analisar Finanças do Alvo".
Roteamento: O Gateway recebe isso. Ele sabe que o "Perito Contábil" é um enxame AutoGen.
Tradução: O Adaptador de Protocolo do Gateway converte o JSON A2A no formato específico de mensagem user_proxy exigido pelo AutoGen.
Injeção de Contexto: O Gateway injeta o NDA-Cleared-Token no contexto, provando ao Contabilista que lhe é permitido visualizar os ficheiros Excel confidenciais.

‍

Fig. 2: O Fluxo Detalhado de um Processo de Revisão Legal

‍

O Modelo de Roteamento Hub-and-Spoke

Numa malha de agentes peer-to-peer, o Agente A chama o Agente B diretamente. Isto é perigoso porque compromete a observabilidade e a segurança. Se o Agente A for comprometido, pode inundar o Agente B com pedidos, e ninguém saberá até que a fatura chegue.

O Protocolo A2A impõe um Hub-and-Spoke modelo.

Sem Ligações Diretas: Os Agentes não podem comunicar diretamente entre si. Eles dirigem-se ao Gateway.
O Intermediário de Confiança: O Gateway valida o envelope. Garante que o trace_id está presente. Verifica o budget_remaining.
A "Prova de Falsificação": Como o Gateway injeta o contexto de Identidade, o Agente B sabe que o pedido realmente veio do Líder de Negócios, e não de um ator malicioso a fingir ser o líder.

‍

Rastreamento Distribuído: A "Pilha de Pensamento"

Depurar um único LLM é difícil. Depurar uma cadeia recursiva de 5 agentes é impossível sem rastreamento distribuído.

Quando o "Líder de Negócios" não consegue fechar o negócio de M&A, você precisa saber o porquê. Foi um tempo limite no agente Jurídico? O Contador Forense ficou sem tokens?

O Protocolo A2A exige Propagação de Cabeçalhos. Quando o Gateway recebe a requisição inicial, ele gera um TraceID. Ele força cada agente a jusante a incluir este ID em suas subchamadas.

Isso nos permite visualizar a "Pilha de Pensamento"—um gráfico de Gantt temporal da cognição. Podemos ver que o Agente Jurídico levou 45 segundos (gargalo de latência) enquanto o Contador levou 2 segundos.

Fig. 3: Gráfico de Gantt deste Negócio de M&A

‍

Agnosticismo de Framework: O Adaptador Universal

A peça final do Protocolo A2A é o Adaptador Universal.

Reconhecemos que os desenvolvedores sempre usarão ferramentas diferentes. Alguns adoram o LangGraph pelo seu controle; outros preferem o CrewAI pelas suas funcionalidades de interpretação de papéis.

O Gateway atua como uma Camada de Tradução.

Entrada: Ele aceita a saída nativa desses frameworks (por exemplo, um LangChain AIMessage).
Normalização: Ele o converte para o JSON Padrão A2A.
Saída: Ele o converte para o formato de entrada esperado pelo receptor.

Isso permite que você construa uma Malha de Agentes Heterogêneos. Você não está preso a uma única biblioteca Python. Você pode escolher a melhor ferramenta para o trabalho de cada agente específico e deixar que o Protocolo lide com a comunicação.

Conclusão

A padronização é o pré-requisito para a escala. Assim como o TCP/IP permitiu que a internet conectasse diferentes computadores, o Protocolo A2A mais as capacidades de IA da TrueFoundry de gateway de agente permitem que a empresa conecte diferentes inteligências. Ele transforma uma coleção de "Chatbots" em uma coordenada, observável e segura Força de Trabalho Digital.

TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.

Built for Speed: ~10ms Latency, Even Under Load

Schedule your Demo Now