Blank white background with no objects or features visible.

NOVA PESQUISA: 80% dos custos de IA são invisíveis na fatura. Mais de 200 líderes revelam para onde o dinheiro vai. Leia→

Autoescalonamento de Cluster para as 3 Grandes Nuvens ☁️

By TrueFoundry

Updated: February 16, 2023

Não seria errado dizer que toda empresa precisa lidar com mais tráfego, processar mais dados e atender mais clientes à medida que cresce. Frequentemente, elas precisam escalar sua infraestrutura para acompanhar as crescentes demandas. Isso também é verdade se o seu negócio tiver sazonalidade. Imagine um site de e-commerce que recebe muito tráfego durante feriados, como na Black Friday ou Cyber Monday. O tráfego do site pode aumentar drasticamente durante esses períodos de pico. O site pode apresentar problemas de carregamento lento de páginas e irritar os usuários se não conseguir lidar com o aumento da demanda. Como resultado, a empresa pode sofrer perdas de vendas e uma deterioração de sua reputação.

Uma maneira de resolver esse problema é aumentar manualmente o número de servidores na infraestrutura para lidar com o tráfego crescente. No entanto, escalar manualmente para cima e para baixo pode ser demorado, propenso a erros e difícil de gerenciar. É aqui que entra o dimensionamento automático de clusters (cluster autoscaling). O dimensionamento automático de clusters ajusta automaticamente o número de servidores na infraestrutura com base em certas condições, como uso de CPU, uso de memória ou solicitações de entrada. Isso significa que a infraestrutura pode escalar para cima ou para baixo com base na demanda atual, sem intervenção manual.

Esta postagem de blog explorará o que é o dimensionamento automático de clusters, por que ele é necessário e como ele pode ser implementado em diferentes provedores de nuvem.

TL;DR

Para que nosso cluster funcione corretamente em todos os principais provedores de nuvem, precisamos adaptar a forma como escalamos os nós do cluster.

💡

Na AWS, usamos o Karpenter, que, com configuração mínima, pode escolher o nó mais barato e eficiente para as solicitações de pods recebidas.

💡

No GCP, contamos com o GKE Autopilot, que nos fornece um cluster gerenciado capaz de escalar para cima e para baixo dependendo das solicitações. 

💡

Não há soluções ad-hoc no Azure, e usamos o cluster-autoscaler do Kubernetes, que é menos otimizado que o Karpenter e requer mais configuração que o Autopilot.

Autoscaler para AWS: Karpenter

O Karpenter observa as solicitações agregadas de recursos de pods não agendados e toma decisões para iniciar e encerrar nós para minimizar latências de agendamento e custos de infraestrutura.

  • O Karpenter gerencia cada instância diretamente e não depende de mecanismos de orquestração adicionais, como grupos de nós.
  • O Karpenter foca na carga de trabalho e inicia instâncias adequadas para a situação atual com base nas solicitações de recursos e restrições de agendamento dos pods recebidos. Essa abordagem de seleção de instâncias baseada em intenção permite um dimensionamento mais eficiente e econômico.

Mas, infelizmente, o Karpenter funciona apenas na AWS.

karpenter

Autoscaler para GCP: GKE Autopilot

Autopilot é um serviço gerenciado que usa algoritmos de aprendizado de máquina para determinar o número ideal de nós para o cluster com base na carga de trabalho atual. Ele também oferece recursos como atualizações e patches automáticos, facilitando a manutenção do cluster atualizado e seguro.

Além do autoescalonamento, o Cluster Autopilot também oferece outros benefícios, como melhor utilização de recursos e economia de custos, evitando o superprovisionamento de recursos. Ele também proporciona uma abordagem mais automatizada para o gerenciamento de clusters, já que todas as operações de autoescalonamento são tratadas pelo serviço.

Autoscaler para Microsoft Azure: Kubernetes Cluster Autoscaler

Não há uma oferta gerenciada na nuvem Azure como o GKE Autopilot ou uma abordagem personalizada para autoescalonamento como o Karpenter; portanto, dependemos do cluster-autoscaler.

O Kubernetes Cluster Autoscaler é uma ferramenta de código aberto que permite o escalonamento automático de clusters Kubernetes. Ele é executado como um pod dentro do cluster e monitora a utilização de recursos do cluster, ajustando o número de nós necessários para atender às necessidades dos aplicativos em execução. Isso ajuda a otimizar a utilização de recursos e a reduzir custos, evitando o superprovisionamento de recursos quando a demanda é baixa. O Cluster Autoscaler requer configuração manual de grupos e tipos de nós.

Este blog aborda detalhes sobre o Autoescalonamento do Kubernetes.

TrueFoundry é uma PaaS de Implantação de ML sobre Kubernetes para acelerar os fluxos de trabalho dos desenvolvedores, permitindo-lhes total flexibilidade no teste e implantação de modelos, ao mesmo tempo em que garante total segurança e controle para a equipe de Infraestrutura. Através da nossa plataforma, capacitamos as equipes de Machine Learning a implantar e monitorar modelos em 15 minutos com 100% de confiabilidade, escalabilidade e a capacidade de reverter em segundos - permitindo-lhes economizar custos e lançar Modelos em produção mais rapidamente, possibilitando a realização de valor de negócio real.

The fastest way to build, govern and scale your AI

Sign Up
Table of Contents

Govern, Deploy and Trace AI in Your Own Infrastructure

Book a 30-min with our AI expert

Book a Demo

The fastest way to build, govern and scale your AI

Book Demo

Discover More

October 5, 2023
|
5 min read

<Webinar> Vitrine de GenAI para Empresas

Best Fine Tuning Tools for Model Training
May 3, 2024
|
5 min read

As 6 Melhores Ferramentas de Fine Tuning Para Treinamento de Modelos em 2026

May 25, 2023
|
5 min read

LLMs de Código Aberto: Abrace ou Pereça

August 24, 2023
|
5 min read

Implantações de Machine Learning em 2023

May 21, 2026
|
5 min read

Adicionando OAuth2 a Jupyter Notebooks no Kubernetes

Engenharia e Produto
May 21, 2026
|
5 min read

Uma equipe de 2 pessoas atendendo um modelo para 1,5 milhão de pessoas com TrueFoundry

Engenharia e Produto
May 21, 2026
|
5 min read

Acelere o Processamento de Dados em 30–40x com NVIDIA RAPIDS no TrueFoundry

GPU
Engenharia e Produto
May 21, 2026
|
5 min read

Uma Parceria para IA Responsável: Truefoundry e Enkrypt AI

No items found.
May 21, 2026
|
5 min read

Capacitando a Revolução dos Grandes Modelos de Linguagem: GPUs no Kubernetes

Engenharia e Produto
Kubernetes
GPU

Recent Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Take a quick product tour
Start Product Tour
Product Tour