Próximo seminario web: Seguridad empresarial para Claude Code | 21 de abril · 11:00 a. m. PST. Regístrese aquí →

Cómo se integra TrueFoundry con GCP: la arquitectura del plano de control

Por TrueFoundry

Actualizado: February 15, 2026

Resumir con

La implementación de la IA generativa en Google Cloud Platform (GCP) requiere organizar un conjunto complejo de primitivas: Google Kubernetes Engine (GKE), TPU en la nube y Vertex AI. Si bien GCP proporciona la computación sin procesar, conectarla a una plataforma de desarrollo interno (IDP) que cumpla con las normas requiere una ingeniería personalizada sustancial.

TrueFoundry actúa como la superposición de la infraestructura. Nos encargamos de la organización, lo que le permite tener el control sobre la VPC y la residencia de los datos. En esta publicación, se detallan nuestros patrones de integración con GCP, específicamente en lo que respecta a la arquitectura de plano dividido Federación de identidades de carga de trabajoy administración de TPU.

Modelo de implementación: arquitectura de plano dividido

Usamos una arquitectura de plano dividido para aislar la interfaz de administración de su entorno de ejecución de cargas de trabajo.

  1. El plano de control: Nuestro panel de control y servidor de API alojados. Gestiona los metadatos, el RBAC y la programación de trabajos.
  2. El plano de cálculo: Los agentes y controladores se ejecutan directamente en tu clúster de GKE. Gestiona las ponderaciones de los modelos, los datos de los clientes y las inferencias.

Límite de seguridad No exigimos reglas de firewall de entrada. El agente de su clúster inicia una transmisión WebSocket o gRPC segura y solo de salida a nuestro plano de control. Sondea los manifiestos de despliegue e impulsa la telemetría. Su VPC permanece privada frente al tráfico de entrada externo.

Figura 1: La arquitectura de plano dividido aísla el procesamiento de datos dentro de la VPC del cliente.

Topología de redes

Para un alto rendimiento, configuramos el plano de procesamiento para usar Clústeres nativos de VPC usando IP de alias. Todos los recursos informáticos residen en subredes privadas.

Entrada (solicitudes de inferencia) El tráfico de aplicaciones entra en la VPC a través de Balance de carga en la nube (normalmente un ALB externo global). El ALB termina el TLS y reenvía las solicitudes al Puerta de enlace Istio Ingress que se ejecuta en el clúster de GKE.

Acceso privado a Google Para mantener el cumplimiento, el tráfico a las API de Google (Cloud Storage, Vertex AI) se dirige a través de Acceso privado a Google. Esto mantiene el tráfico entre los módulos de inferencia y los servicios gestionados por GCP en la red troncal de la red de Google, sin pasar por la Internet pública.

Salida Los nodos de trabajo de GKE requieren acceso saliente para extraer imágenes de contenedores desde Registro de artefactos. Enrutamos este tráfico NAT en la nube conectado a las subredes privadas.

Figura 2: Flujo de tráfico de red que detalla la entrada y la conectividad privada.

Federación de identidades

Impulsamos la eliminación de las claves estáticas de las cuentas de servicio (archivos.json). TrueFoundry implementa Identidad de carga de trabajo de GKE para toda la autenticación de cargas de trabajo.

La secuencia de autenticación

  1. Creación: Cuando implementas un servicio, creamos una cuenta de servicio de Kubernetes (KSA).
  2. Encuadernación: Hacemos anotaciones en la KSA para vincularla a una cuenta de servicio de Google (GSA) mediante el enlace roles/iam.workloadIdentityUser.
  3. Intercambio: El Servidor de metadatos de GKE intercepta las solicitudes e intercambia el token KSA por un token de acceso a Google Cloud de corta duración.
  4. Acceso: El pod usa este token para autenticarse de forma nativa (ADC) con recursos como BigQuery o Vertex AI.

Si una cápsula se ve comprometida, el radio de explosión se limita estrictamente a las funciones de IAM asignadas a esa GSA específica.

Figura 3: El flujo de autenticación de la identidad de carga de trabajo de GKE.

Computación: optimización de puntos y TPU

Nos integramos con Grupos de nodos de GKE para orquestar las GPU NVIDIA y las TPU en la nube.

Orquestación de TPU La programación en TPU requiere gestionar restricciones topológicas específicas. TrueFoundry administra el NodeSelector y las tolerancias necesarias para programar los pods en segmentos de TPU (p. ej., las versiones 4-8 y 5e). Introducimos automáticamente los controladores y los límites de recursos necesarios en el manifiesto de despliegue, con lo que extraemos la configuración de Kubernetes de bajo nivel.

Administración puntual de máquinas virtuales Para las cargas de trabajo de procesamiento o desarrollo por lotes, gestionamos Detecta máquinas virtuales para reducir los costos (normalmente entre un 60 y un 90% en comparación con bajo demanda).

  • Aprovisionamiento: Organizamos grupos de nodos con el aprovisionamiento puntual habilitado.
  • Gestión de la terminación: Supervisamos el aviso de preferencia de 30 segundos. Tras la detección, acordonamos el nodo y activamos el programador para que mueva el pod a un grupo bajo demanda alternativo o a un nodo spot alternativo.

AI Gateway: interfaz unificada

Administrar claves distintas para modelos como Géminis Pro crea una sobrecarga operativa. TrueFoundry proporciona una puerta de enlace de IA que actúa como una interfaz API unificada.

  • Autenticación unificada: Autentica una vez en la puerta de enlace. Gestionamos el intercambio de identidades de las cargas de trabajo posteriores con Vertex AI.
  • Cambio de modelo: Cambie de gemini pro a un llama-3-70b autohospedado cambiando un parámetro de configuración. Sin reescrituras de código.
  • Atribución de costos: Registramos el uso de los tokens por proyecto, lo que le permite asignar los costos compartidos de Vertex AI a los centros de costos internos.

Comparación operativa

Task Native GCP Implementation TrueFoundry Overlay
Deploy TPU Workload Manual Node Pool config. Write complex taints, tolerations, and resource limits in YAML. Select TPU type (e.g., v5e). Controller automates node selection and scheduling constraints.
Spot VM Management Provision Spot pools. Write custom termination handlers for the 30s preemption signal. Toggle Spot config. Controller handles preemption, node draining, and fallback logic.
Vertex AI Access Grant IAM permissions per service account. Build custom logging for token/cost tracking. Route via AI Gateway. Get unified logging, cost attribution, and rate limiting out of the box.
Secret Management Mount secrets via CSI Driver. Configure SecretProviderClass manifests per app. UI integration referencing Secret Manager resource IDs for direct env var injection.

Resumen

Esta integración permite a tu equipo aprovechar al máximo las ventajas del hardware de GCP (en concreto, las TPU y las redes de alto rendimiento) sin verse atrapado en la fricción operativa que supone gestionar Kubernetes sin procesar. TrueFoundry actúa como un multiplicador de fuerza para tu infraestructura: eliminamos la complejidad de la organización de GKE y tú conservas la autoridad absoluta sobre la seguridad y la residencia de los datos. Este equilibrio te permite poner en funcionamiento las cargas de trabajo de GenAI de forma inmediata, lo que convierte la infraestructura de una limitación en una ventaja competitiva en velocidad.

La forma más rápida de crear, gobernar y escalar su IA

Inscríbase
Tabla de contenido

Controle, implemente y rastree la IA en su propia infraestructura

Reserva 30 minutos con nuestro Experto en IA

Reserve una demostración

La forma más rápida de crear, gobernar y escalar su IA

Demo del libro

Descubra más

No se ha encontrado ningún artículo.
April 22, 2026
|
5 minutos de lectura

Mercados de agentes de IA: el futuro de la automatización de nivel empresarial

No se ha encontrado ningún artículo.
Detailed Guide to What is an AI Gateway?
April 22, 2026
|
5 minutos de lectura

¿Qué es AI Gateway? Conceptos básicos y guía

No se ha encontrado ningún artículo.
April 22, 2026
|
5 minutos de lectura

Aprovechar la puerta de enlace de IA de TrueFoundry para el cumplimiento de FIPS

No se ha encontrado ningún artículo.
April 22, 2026
|
5 minutos de lectura

Integración de GraySwan con TrueFoundry

No se ha encontrado ningún artículo.
No se ha encontrado ningún artículo.

Blogs recientes

Realice un recorrido rápido por el producto
Comience el recorrido por el producto
Visita guiada por el producto