Blank white background with no objects or features visible.

Werden Sie Teil unseres VAR- und VAD-Ökosystems – und ermöglichen Sie die Governance von Unternehmens-KI über LLMs, MCPs und Agents hinweg. Read →

Ein Leitfaden für Cloud Node Auto-Provisioning

von TrueFoundry

Aktualisiert: February 15, 2024

Fassen Sie zusammen mit
Metallic silver knot design with interlocking loops and circular shape forming a decorative pattern.
Blurry black butterfly or moth icon with outstretched wings on white background.
Blurry red snowflake on white background, symmetrical frosty design with soft edges and abstract shape.

Verschiedene Workloads erfordern unterschiedliche Hardwarespezifikationen wie Maschinentyp, Größe und Geolokalisierung. Mit dem Aufkommen von ML/LLMs ist die Auswahl der richtigen Hardware entscheidend geworden. Wir müssen Entscheidungen auf der Grundlage von Hardwarespezifikationen wie Betriebssystemtyp, Architektur, Prozessor, GPU-Typ und Speicher treffen. Kubernetes hilft bei der Orchestrierung und Verteilung von Ressourcen auf ähnliche Workloads, aber die dynamische Bereitstellung dieser Ressourcen bei Bedarf bleibt eine Herausforderung.

EIN Kubernetes Ein (K8s) -Cluster ist eine Gruppe von Knoten, die containerisierte Apps auf effiziente, automatisierte, verteilte und skalierbare Weise ausführen. Jeder Knoten innerhalb eines Kubernetes-Clusters hat bestimmte Attribute wie Maschinentyp, Größe und Standort.

In diesem Blog wird die Notwendigkeit von Cloud-Node-Autoprovisionern untersucht, um verschiedene Workload-Anforderungen innerhalb von Kubernetes-Clustern automatisch zu verwalten. Wir bieten auch Einblicke in Lösungen, die von großen Cloud-Anbietern wie AWS, GCP und Azure angeboten werden. Schließlich untersuchen wir, wie TrueFoundry diese Herausforderungen als Plattform bewältigt.

Einführung

Die automatische Knotenbereitstellung automatisiert die Bereitstellung der entsprechenden Knotengruppe auf der Grundlage ungeplanter Pod-Einschränkungen, um die Infrastrukturkosten zu optimieren. Automatische Node-Provisionisten in einem Kubernetes-Cluster sind für die folgenden Aktionen verantwortlich:

  • Terminplanung: Start von Knoten als Reaktion auf ungeplante Pods, nachdem die Planungseinschränkungen gelöst wurden, indem der bestmögliche Maschinentyp und die bestmögliche Maschinengröße ausgewählt wurden.
  • Störung: Löschen von Knoten, wenn sie aufgrund eines Ablaufs nicht mehr verwendet werden, Konsolidierung, Drift oder Unterbrechung

Warum Node Auto-Provisioning?

Kubernetes hat Knoten als Arbeitscomputer mit spezifischen Hardwarekonfigurationen wie Maschinentyp, Größe und Kapazitätstyp, und Node-Pools beziehen sich auf Pools solcher gängigen Worker-Maschinen. Da es keinen automatischen Node-Provisioner gab, war die einzige Möglichkeit, Ihrem Workload eine bestimmte Hardwarekonfiguration zuzuweisen, die Auswahl eines Knotenpools. Dazu muss der Benutzer einen Knotenpool mit der erforderlichen Konfiguration in seiner Cloud erstellen und dann den Knoten hinzufügen Affinität für den spezifischen Knotenpool in der Pod-Spezifikation.

Beispiel für eine Pod-Spezifikation mit Knotenpool-Auswahl

Insgesamt umfasst dieser Mechanismus die folgenden Schritte:

  1. Definieren Sie Ihre Hardwareanforderungen im Voraus.
  2. Suche und Auswahl des bestmöglichen Maschinentyps und der bestmöglichen Größe für die gegebenen Anforderungen.
  3. Bereitstellung ausgewählter Knotenpools.
TrueFoundry — Wählen Sie Knotenpools für Ihre Arbeitslast

Die Kombinationen der Anforderungen an den Knotenpool können zahlreich sein, insbesondere während der Experimentierphase für ML/LLM-Workloads. Die Koordination zwischen separaten DevOps- und Plattformteams könnte während der Entwicklung viel Zeit in Anspruch nehmen. Daher ist ein Controller, der die Anforderungen dynamisch bewertet und die Infrastruktur automatisch bereitstellt, von entscheidender Bedeutung.

Wie funktioniert die automatische Bereitstellung von Knoten?

Durch die automatische Bereitstellung von Knoten entfällt der manuelle Schritt der Vorerstellung von Knotenpools, da Benutzer allgemeine Anforderungen als Einschränkungen hinzufügen können. Es bestimmt automatisch den besten Maschinentyp oder den besten verfügbaren Knoten für die jeweilige Arbeitslast.

Beispiel für eine Pod-Spezifikation für die Knotenauswahl durch automatische Bereitstellung

Einige der häufig verwendeten Einschränkungen:

  • cpu: benötigte CPU z.B. 2
  • Speicher: benötigter Speicher für Workload, z. B. 1000
  • gpu-type: erforderlicher GPU-Typ, z. B. t4, a100
  • Art der Kapazität: Kaufoption z. B. auf Abruf oder Stelle
  • Bereiche: geologische Standorte z.B. US-Ost-1A
  • Betriebssystem: Betriebssystem der Maschine z.B. Linux oder Fenster
  • Architektur: die Architektur der Maschine z. B. arm64 oder amd64
TrueFoundry — Machen Sie es einfach, Ihre Workload-Anforderungen zu definieren

Cloud-Anbieter, die automatische Knotenbereitstellung anbieten

Jeder Cloud-Anbieter bietet seine Auto-Provisioning-Mechanismen an. AWS erfordert die Installation von Tools wie Karpenter, während GCP eine integrierte Lösung bietet. Azure hat kürzlich sein Auto-Provisioner-Projekt vorgestellt, das sich derzeit im Vorschaumodus befindet.

AWS Karpenter

Karpenter, ein Open-Source-Node-Lifecycle-Management-Projekt, das für Kubernetes entwickelt wurde, verbessert die Effizienz und Wirtschaftlichkeit der Ausführung von Workloads auf Clustern erheblich. Karpenter berücksichtigt Planungseinschränkungen wie Ressourcenanforderungen, Knotenselektoren, Affinitäten, Toleranzen und Topologiestreuungsbeschränkungen und verteilt Knoten intelligent nach Bedarf und gibt sie frei.

Automatische Bereitstellung von GCP-Knoten

Automatische Bereitstellung von Knoten, das in den Cluster-Autoscaler integriert ist, skaliert bestehende Node-Pools auf der Grundlage der Spezifikationen von nicht planbaren Pods. Die automatische Bereitstellungsfunktion von GCP gewährleistet eine optimale Nutzung der Ressourcen, indem CPU, Arbeitsspeicher, kurzlebiger Speicher, GPU-Anforderungen, Knotenaffinitäten und Label-Selektoren berücksichtigt werden.

Automatische Bereitstellung von Azure Node

Azurs Projekt zur automatischen Bereitstellung von Knoten (NAP), derzeit im Vorschaumodus, nutzt das Open-Source-Projekt Karpenter, um die optimale VM-Konfiguration für die effiziente und kostengünstige Ausführung von Workloads zu ermitteln. NAP implementiert und verwaltet Karpenter automatisch auf AKS-Clustern und bietet Benutzern so ein nahtloses Erlebnis.

💡

Node Auto Provisioning (NAP) für AKS befindet sich derzeit in der VORSCHAU. Wir freuen uns sehr über dieses neue Projekt und freuen uns darauf, es für unsere Kunden zu nutzen. Erfahre mehr

TrueFoundry — Erleben Sie die automatische Bereitstellung von Knoten

TrueFoundry bietet erweiterte Filterfunktionen für Knotenpools und simuliert die automatische Bereitstellung von Knoten.

TrueFoundry — Erleben Sie die automatische Bereitstellung von Knoten

Um dies zu erreichen, haben wir ein paar einfache Schritte befolgt:

  • Erstellen Sie programmgesteuert Knotenpools mit allen Kombinationen von Maschinentypen und Kapazitätstypen und ermöglichen Sie so eine automatische Skalierung bei gleichzeitiger Minimierung auf Null.
  • Verknüpfen Sie den Knotenpool mit seinem Maschinentyp, seiner CPU, seinem Arbeitsspeicher, seinem GPU-Typ und seiner Anzahl.
  • Anschließend filtern wir diese Knotenpools auf der Grundlage der Anforderungen heraus, sodass der Endbenutzer die richtige Infrastruktur leicht auswählen kann.

Dieser Ansatz ermöglicht es Entwicklern/Datenwissenschaftlern, den besten Knotenpool für ihre Arbeitslast auszuwählen, indem sie ihre Anforderungen analysieren. Dieser einfache Mechanismus ermöglicht es uns, für jede Cloud, die noch keine integrierte Unterstützung für Auto-Provisioner hat, dasselbe Erlebnis zu bieten.

Fazit

Da sich die Infrastrukturanforderungen ständig weiterentwickeln, sind Cloud-Anbieter bestrebt, den Prozess der Auswahl der optimalen Infrastruktur für unterschiedliche Workloads zu optimieren. Bei Wahre Gießerei, wir teilen dieses Engagement, indem wir uns bemühen, Entwicklern die Tools und das Wissen an die Hand zu geben, die sie für die reibungslose Bereitstellung ihrer Workloads benötigen.

Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren

Melde dich an
Inhaltsverzeichniss

Steuern, implementieren und verfolgen Sie KI in Ihrer eigenen Infrastruktur

Buchen Sie eine 30-minütige Fahrt mit unserem KI-Experte

Eine Demo buchen

Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren

Demo buchen

Entdecke mehr

August 27, 2025
|
Lesedauer: 5 Minuten

Kartierung des KI-Marktes vor Ort: Von Chips bis zu Steuerflugzeugen

March 24, 2023
|
Lesedauer: 5 Minuten

Einführung in Kubernetes und MLOps: Herausforderungen und Vorteile

October 7, 2022
|
Lesedauer: 5 Minuten

Kubernetes für Datenwissenschaftler — Prognosen hosten

May 16, 2026
|
Lesedauer: 5 Minuten

The Agent Sprawl Problem: Why Enterprises Need Control Before Autonomy

Keine Artikel gefunden.
May 15, 2026
|
Lesedauer: 5 Minuten

Introducing Skills Registry: Reusable Agent Skills for Production AI Systems

Keine Artikel gefunden.
Types of AI agents governed by TrueFoundry enterprise control plane
May 15, 2026
|
Lesedauer: 5 Minuten

Types of AI Agents: Definitions, Roles, and What They Mean for Enterprise Deployment

Keine Artikel gefunden.
May 15, 2026
|
Lesedauer: 5 Minuten

OAuth at the MCP Layer: How We Solved Enterprise Token Management for AI Agents

Keine Artikel gefunden.
April 22, 2026
|
Lesedauer: 5 Minuten

TrueML Talks #29 — GenAI und LLMs für Location Intelligence @ Beans.AI

Wahre ML-Vorträge
April 22, 2026
|
Lesedauer: 5 Minuten

Hinzufügen von OAuth2 zu Jupyter Notebooks auf Kubernetes

Technik und Produkt

Aktuelle Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Machen Sie eine kurze Produkttour
Produkttour starten
Produkttour