Prochain webinaire : La sécurité d'entreprise pour Claude Code | 21 avril · 11 h PST. Inscrivez-vous ici →

Guide du provisionnement automatique des nœuds cloud

Par TrueFoundry

Mis à jour : February 15, 2024

Résumez avec

Les différentes charges de travail nécessitent des spécifications matérielles différentes, telles que le type, la taille et la géolocalisation de la machine. Avec l'essor du ML/LLM, il est devenu crucial de sélectionner le bon matériel. Nous devons faire des choix en fonction de spécifications matérielles telles que le type de système d'exploitation, l'architecture, le processeur, le type de GPU et le stockage. Kubernetes facilite l'orchestration et la distribution des ressources entre des charges de travail similaires, mais le provisionnement dynamique de ces ressources à la demande reste un défi.

UNE Kubernetes Le cluster (K8s) est un regroupement de nœuds qui exécutent des applications conteneurisées de manière efficace, automatisée, distribuée et évolutive. Chaque nœud d'un cluster Kubernetes possède des attributs spécifiques tels que le type, la taille et l'emplacement de la machine.

Ce blog explore la nécessité des provisionneurs automatiques de nœuds cloud pour gérer automatiquement les diverses exigences en matière de charge de travail au sein des clusters Kubernetes. Nous fournissons également des informations sur les solutions proposées par les principaux fournisseurs de cloud tels qu'AWS, GCP et Azure. Enfin, nous examinons comment TrueFoundry répond à ces défis en tant que plateforme.

Présentation

Le provisionnement automatique des nœuds automatise le provisionnement du groupe de nœuds approprié en fonction de contraintes de pod non planifiées afin d'optimiser les coûts d'infrastructure. Les provisionneurs automatiques de nœuds d'un cluster Kubernetes sont responsables des actions suivantes :

  • Planification: lancement de nœuds en réponse à des pods non planifiés après avoir résolu les contraintes de planification en choisissant de manière optimale le meilleur type et la meilleure taille de machine possibles.
  • Perturbation: suppression de nœuds lorsqu'ils ne sont plus utilisés pour cause d'expiration, consolidation, dérive ou interruption

Pourquoi le provisionnement automatique de Node ?

Kubernetes a des nœuds comme machines de travail avec des configurations matérielles spécifiques telles que le type, la taille et le type de capacité de la machine, et les pools de nœuds font référence aux pools de ces machines de travail courantes. En l'absence d'un provisionneur automatique de nœuds, la seule façon d'allouer une configuration matérielle spécifique à votre charge de travail était de sélectionner un pool de nœuds. Cela oblige l'utilisateur à créer un pool de nœuds avec la configuration requise dans son cloud, puis à ajouter un nœud. affinité pour le pool de nœuds spécifique dans la spécification du pod.

Exemple de spécification de pod avec sélection d'un pool de nœuds

Dans l'ensemble, ce mécanisme comporte les étapes suivantes :

  1. Prédéfinir vos exigences matérielles.
  2. Recherche et sélection du type et de la taille de machine les mieux adaptés à des exigences données.
  3. Approvisionnement du ou des pools de nœuds sélectionnés.
TrueFoundry - Sélectionnez des pools de nœuds pour votre charge de travail

Les combinaisons d'exigences en matière de pool de nœuds peuvent être nombreuses, en particulier pendant la phase d'expérimentation des charges de travail ML/LLM. La coordination entre les équipes DevOps et Platform distinctes peut prendre beaucoup de temps pendant le développement. Par conséquent, un contrôleur qui évalue les exigences de manière dynamique et provisionne automatiquement l'infrastructure devient crucial.

Comment fonctionne le provisionnement automatique des nœuds ?

Le provisionnement automatique des nœuds élimine l'étape manuelle de pré-création de pools de nœuds en permettant aux utilisateurs d'ajouter des exigences de haut niveau en tant que contraintes. Il détermine automatiquement le type de machine ou le nœud disponible le mieux adapté à la charge de travail.

Exemple de spécification de pod pour la sélection de nœuds via le provisionnement automatique

Certaines des contraintes couramment utilisées sont les suivantes :

  • cpu : processeur requis, par ex. 2
  • mémoire : mémoire requise pour la charge de travail, par ex. 1000
  • type de GPU : type de GPU requis, par ex. T4 et A100
  • type de capacité: Option d'achat, par ex. à la demande ou place
  • zones: emplacements géologiques, par ex. us-est-1a
  • système d'exploitation: os de la machine, par ex. linux ou vitrines
  • architecture: l'architecture de la machine, par ex. bras 64 ou amd64
TrueFoundry - Faciliter la définition de vos exigences en matière de charge de travail

Fournisseurs de cloud proposant le provisionnement automatique des nœuds

Chaque fournisseur de cloud propose ses mécanismes de provisionnement automatique. AWS nécessite l'installation d'outils tels que Karpenter, tandis que GCP fournit une solution intégrée. Azure a récemment présenté son projet d'approvisionnement automatique, actuellement en mode aperçu.

AWS Karpenter

Charpentier, un projet de gestion du cycle de vie des nœuds open source conçu pour Kubernetes, améliore considérablement l'efficacité et la rentabilité de l'exécution des charges de travail sur des clusters. En tenant compte des contraintes de planification telles que les demandes de ressources, les sélecteurs de nœuds, les affinités, les tolérations et les contraintes d'étalement de la topologie, Karpenter provisionne et désalloue les nœuds de manière intelligente selon les besoins.

Provisionnement automatique des nœuds GCP

Provisionnement automatique des nœuds, intégré à l'autoscaler du cluster, dimensionne les pools de nœuds existants en fonction des spécifications des pods non planifiables. La fonction d'approvisionnement automatique de GCP garantit une utilisation optimale des ressources en tenant compte du processeur, de la mémoire, du stockage éphémère, des requêtes GPU, des affinités de nœuds et des sélecteurs d'étiquettes.

Provisionnement automatique d'Azure Node

D'Azure Projet de provisionnement automatique des nœuds (NAP), actuellement en mode aperçu, exploite le projet open source Karpenter pour déterminer la configuration de machine virtuelle optimale pour exécuter les charges de travail de manière efficace et rentable. NAP déploie et gère automatiquement Karpenter sur des clusters AKS, offrant ainsi aux utilisateurs une expérience fluide.

💡

Le provisionnement automatique des nœuds (NAP) pour AKS est actuellement en version PREVIEW. Nous sommes très enthousiastes à l'idée de ce nouveau projet et avons hâte de l'utiliser pour nos clients. En savoir plus

TrueFoundry - Bénéficiez d'une expérience de provisionnement automatique des nœuds

TrueFoundry offre des fonctionnalités de filtrage avancées pour les pools de nœuds, simulant l'expérience de provisionnement automatique des nœuds.

TrueFoundry - Bénéficiez d'une expérience de provisionnement automatique des nœuds

Pour ce faire, nous avons suivi quelques étapes simples :

  • Créez par programmation des pools de nœuds avec toutes les combinaisons de types de machines et de types de capacité, en permettant une mise à l'échelle automatique tout en minimisant à zéro.
  • Liez le pool de nœuds à son type de machine, à son processeur, à sa mémoire, à son type de GPU et à son nombre.
  • Nous filtrons ensuite ces pools de nœuds en fonction des exigences, ce qui permet à l'utilisateur final de choisir facilement la bonne infra.

Cette approche permet aux développeurs/data scientists de sélectionner le pool de nœuds le mieux adapté à leur charge de travail en analysant leurs besoins. Ce mécanisme simple nous permet de fournir la même expérience pour tous les clouds qui ne disposent pas encore de support intégré pour les provisionneurs automatiques.

Conclusion

Alors que les exigences en matière d'infrastructure continuent d'évoluer, les fournisseurs de cloud s'efforcent de rationaliser le processus de sélection de l'infrastructure optimale pour diverses charges de travail. À True Foundry, nous partageons cet engagement en nous efforçant de fournir aux développeurs les outils et les connaissances dont ils ont besoin pour déployer leurs charges de travail de manière fluide.

Le moyen le plus rapide de créer, de gérer et de faire évoluer votre IA

INSCRIVEZ-VOUS
Table des matières

Gouvernez, déployez et suivez l'IA dans votre propre infrastructure

Réservez un séjour de 30 minutes avec notre Expert en IA

Réservez une démo

Le moyen le plus rapide de créer, de gérer et de faire évoluer votre IA

Démo du livre

Découvrez-en plus

August 27, 2025
|
5 min de lecture

Cartographie du marché de l'IA sur site : des puces aux plans de contrôle

March 24, 2023
|
5 min de lecture

Présentation de Kubernetes et des MLOps : défis et avantages

October 7, 2022
|
5 min de lecture

Kubernetes pour les data scientists - Prédictions d'hébergement

 Best AI Gateways in 2026
April 22, 2026
|
5 min de lecture

5 meilleures passerelles IA en 2026

comparaison
April 22, 2026
|
5 min de lecture

Intégration de Cline avec TrueFoundry AI Gateway

Outils LLM
Detailed Guide to What is an AI Gateway?
April 22, 2026
|
5 min de lecture

Qu'est-ce qu'AI Gateway ? Concepts de base et guide

Aucun article n'a été trouvé.
April 22, 2026
|
5 min de lecture

LLM Embeddings 101 : un guide complet 2024

Terminologie LLM
April 22, 2026
|
5 min de lecture

TrueML Talks #29 - GenAI et LLMs pour la géolocalisation @ Beans.AI

Discussions True ML
April 22, 2026
|
5 min de lecture

Ajouter OAuth2 aux blocs-notes Jupyter sur Kubernetes

Ingénierie et produits

Blogs récents

Faites un rapide tour d'horizon des produits
Commencer la visite guidée du produit
Visite guidée du produit