Ações Web Colaborativas: Construindo um Copiloto de Filmes Inteligente com TrueFoundry e Google ADK

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
Pense na ginástica mental envolvida em uma simples reserva de filme. Alternar entre o chat do seu grupo de amigos, as listagens de cinemas, as críticas e os mapas de assentos dinâmicos. Equilibrar a localização com os horários das sessões, lidar com os preços dos ingressos em constante mudança. Não é apenas uma tarefa; é um fardo mental fragmentado e de várias etapas que muitas vezes leva a carrinhos abandonados ou a opções de 'contentar-se com menos'. Acabamos lutando contra a interface dinâmica de sites complexos, apenas tentando expressar uma única e simples intenção.
Em vez de navegar manualmente pelo terreno complexo de sites dinâmicos, imagine abrir uma única janela de chat focada e expressar essa intenção uma única vez. "Vamos reservar dois ingressos para o novo filme Duna no cinema IMAX mais próximo para amanhã à noite." Esta simples declaração desencadeia uma cadeia de eventos complexa e lindamente orquestrada. Um guia digital inicia imediatamente uma conversa resiliente, interpretando suas restrições, buscando dinamicamente opções em tempo real de um site ativo e conduzindo você sem esforço a uma ação decisiva.

Esta é a promessa da verdadeira IA orientada para a ação. Não é um chatbot estático; é uma orquestração dinâmica de inteligência e ação. Trata-se de criar uma transferência perfeita entre um guia digital e sua decisão humana. Para ajudar você a construir esse tipo de experiência de copiloto sofisticada, temos o prazer de lançar nosso mais novo e avançado Acelerador TrueFoundry: O Agente de Automação de Navegador para Reserva de Filmes.
Este acelerador fornece um projeto completo, pronto para produção, para um agente de IA que navega no site do Fandango em nome do usuário. Construído sobre uma arquitetura modular e resiliente, ele une o Google Agent Development Kit (ADK), uma configuração robusta de navegador headless do lado do servidor (CLI do agente-navegador), e o TrueFoundry LLM Gateway, tudo isso enquanto implementa um padrão de segurança único para as tarefas mais sensíveis.
Compreendendo o Fluxo Colaborativo: Do Chat ao Site Ativo
A parte mais desafiadora da automação de navegador com IA é gerenciar estados complexos e lidar com interações sensíveis, como o processamento de pagamentos. A natureza dinâmica das interfaces de usuário web modernas — onde os elementos mudam, carregam assincronamente e variam por usuário — quebra os scripts de automação tradicionais. Para construir um agente resiliente, você precisa de uma arquitetura projetada desde o início para se autocorrigir e colaborar inteligentemente com o usuário.
Nosso acelerador é único porque adota um modelo robusto e focado em segurança de transferência colaborativa. Neste modelo, a IA lida com todas as etapas tediosas e baseadas em regras para encontrar um filme, mas não chega a lidar com as informações de pagamento reais. O controle é perfeitamente transferido de volta para o navegador do próprio usuário na etapa mais crítica, garantindo a confiança do usuário e reduzindo a complexidade de conformidade PCI para sua aplicação.
Todo este ecossistema é encapsulado em um FastAPI Server e camada de API padrão, tornando-o fácil de implantar, proteger e monitorar. O diagrama que você vê aqui é esse projeto de orquestração, detalhando exatamente como o contexto se move da intenção do usuário para a ação do navegador.

Análise Aprofundada da Arquitetura: Gerenciamento de Estado Resiliente e Ações Colaborativas
Vamos detalhar os componentes técnicos e os quatro ciclos principais deste fluxo orquestrado por estado, fazendo referência direta ao nosso projeto técnico.
O Orquestrador: BookingAgent (Orquestrador de Estado)
Este componente é o coração do sistema. Rotulado como o "Orquestrador de Estado", o BookingAgent não apenas passa texto; ele transforma a intenção de alto nível em um fluxo de trabalho estruturado, confiável e conversacional. Ele usa uma série de ciclos interconectados para manter um estado preciso.
- Escolhas Guiadas Iniciais: O agente (informado pela lógica do Agente ADK) foi projetado para apresentar escolhas estruturadas ao usuário desde o início. Em vez de perguntar um vago "Que filme você gostaria de ver?", ele oferece imediatamente opções guiadas como "[Pesquisar por filme] [Pesquisar por gênero]". Quando o usuário faz uma seleção, ele não apenas recebe uma entrada de texto; ele define o contexto interno para o agente, direcionando toda a conversa subsequente. Essa estrutura inicial é crítica para manter o foco na tarefa.
- O Ciclo de Estado: Injeção de Contexto e Geração Dinâmica de Listas: Este ciclo (apontado na caixa cinza central do diagrama) é o que torna a conversa dinâmica.
- 1. Injeção de Contexto: O Gerenciador de Sessão preserva o estado, garantindo que cada turno da conversa conheça as restrições anteriores. O BookingAgent injeta este contexto completo (código postal do usuário, data, filme preferido) em seus prompts.
- 2. Execução de Chamada de Ferramenta: A camada de inteligência (apontada pela combinação Agente ADK + Gateway LLM) gera uma resposta JSON estruturada decidindo qual ferramenta chamar (por exemplo, Mapas, clique).
- 3. Geração Dinâmica de Listas: Isso é crucial. Quando o agente precisa que o usuário selecione uma data, ele não apenas pergunta. Ele usa suas ferramentas de navegador para obter o estado DOM real do Fandango. Em seguida, ele extrai a lista válida de datas diretamente da página e gera opções clicáveis e guiadas no chat, mantendo o usuário totalmente no caminho certo e evitando becos sem saída. Isso é perfeitamente ilustrado no diagrama: à medida que o usuário insere um código postal e uma data, o agente apresenta opções específicas como horários de exibição "2:30 PM" e "5:45 PM", construídas dinamicamente a partir dos resultados do snapshot DOM em tempo real do Fandango.
- 4. Recuperação de Erros: O que acontece quando o site dinâmico muda e um seletor CSS falha? Esta parte do ciclo é o motor de resiliência do agente. Em vez de uma falha grave, o sistema captura o erro, e o BookingAgent inicia uma etapa de autocorreção, muitas vezes solicitando ao LLM dicas sobre o que falhou na página e como tentar novamente.
O Cérebro: Agente ADK e o Gateway LLM TrueFoundry
Esta parceria fornece a inteligência do agente. O Agente ADK (Google ADK Runner + InMemorySession) oferece a estrutura padronizada, enquanto o TrueFoundry LLM Gateway proporciona a flexibilidade do modelo e recursos de backend poderosos.
- O Poder do Gateway: Encaminhar todas as chamadas de modelo através do TrueFoundry LLM Gateway (via ADK Runner) oferece observabilidade instantânea, cache de prompts para velocidade e redução de custos, e a capacidade de alternar facilmente entre modelos de ponta como GPT-4, Claude ou Gemini. Isso é crucial para otimizar o desempenho de uma tarefa específica (como análise de DOM) enquanto se gerenciam os custos de infraestrutura.
A Cadeia de Ações: Browser Tools, DriverManager e agent-browser CLI
Esta cadeia de componentes executa os comandos.
- Camada de Abstração: As Browser Tools abstraem a interação bruta, tornando a lógica de orquestração limpa e modular.
- Escalabilidade Concorrente: O design do BrowserManager é crítico. Como indicado pelo rótulo, ele mantém "Instâncias de BrowserDriver por sessão + pré-aquecimento," o que significa que cada sessão de chat tem sua própria instância de navegador headless isolada. Isso evita a colisão de dados do usuário e permite que sua aplicação escale com segurança e concorrência para milhares de usuários.
- O Motor: O agent-browser CLI (Headless Chromium alimentado por Playwright) é o motor de execução bruto que impulsiona o site Fandango. Ele passa o importantíssimo Snapshot do DOM e Resultados da Interação de volta ao loop para a geração dinâmica da lista.
O Golpe de Mestre: O Modelo de Transição Colaborativa
Esta é a culminação de todo o design arquitetônico. Como você pode ver na "Lógica de Transição (Contexto do Usuário preservado)" linha pontilhada, após a conclusão das tediosas etapas de coleta de dados (por exemplo, depois que o usuário selecionou o cinema e o horário do filme), a automação do lado do servidor para.
Isso aciona o BookingAgent para transferir o controle. A página ativa do Fandango (ou um frame seguro separado) é carregada diretamente no navegador do próprio usuário (a caixa amarela rotulada "Página Ativa do Fandango (Usuário no controle direto)"). Como o contexto (cinema e horário específico da sessão) foi preservado, o usuário é direcionado exatamente para onde precisa estar.
O usuário então interage diretamente com o complexo mapa de assentos visual e prossegue com as etapas de pagamento seguro, exatamente como faria normalmente. Isso é brilhante porque:
- Segurança: Sua aplicação nunca manipula, processa ou armazena dados sensíveis de pagamento PCI, reduzindo vastos custos de segurança e conformidade.
- Transferência Humana: Permite que o usuário humano faça a escolha final e visual do assento no mapa dinâmico, uma tarefa mais adequada para uma pessoa.
Este ciclo final controlado pelo usuário de Seleção de Assento e Pagamento (Entrada Direta) leva diretamente ao resultado final: Reserva Confirmada.
👉 Assista ao Supademo Interativo de Todo o Fluxo Colaborativo
Veja como esta arquitetura robusta leva o usuário de uma simples busca por gênero a um mapa de assentos ativo no Fandango em apenas alguns toques, ilustrando cada etapa deste projeto orquestrado.
Por que Começar com um Acelerador?
Os Aceleradores TrueFoundry são projetados para levar você à produção mais rapidamente. A automação web com LLMs é notoriamente complexa, com gerenciamento de estado oculto e desafios de resiliência. Ao começar com este projeto singular e pronto para produção, você:
- Evita Desenvolvimento Complicado: Impulsione seu projeto com padrões comprovados para persistência de estado, autocorreção e ciclos colaborativos humano-IA.
- Garante Escala Concorrente: Aproveite o modelo de sessão isolada do BrowserManager e DriverManager, que são críticos para qualquer implantação empresarial.
- Reduzir Risco: O comprovado modelo de transferência colaborativa é a forma mais eficaz de proteger ações web, reduzindo riscos de segurança, legais e de conformidade relacionados a dados sensíveis.
Comece Hoje
O Acelerador de Reserva de Filmes é mais do que apenas uma demonstração de tecnologia; é um projeto fundamental para a construção de agentes robustos, seguros e colaborativos. Quer esteja a construir um copiloto de reserva de hotéis, um assistente automatizado de companhias aéreas ou uma ferramenta automatizada de extração de dados, esta arquitetura mostra como conectar LLMs a ações web de forma confiável.
Explore a plataforma TrueFoundry hoje, acesse este repositório do acelerador e comece a adaptar este projeto técnico às suas necessidades únicas de automação.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI













.webp)






.webp)

.webp)
.webp)





.png)



