Blank white background with no objects or features visible.

NOVA PESQUISA: 80% dos custos de IA são invisíveis na fatura. Mais de 200 líderes revelam para onde o dinheiro vai. Leia→

A Plataforma ML TrueFoundry é ideal para você?

By Abhishek Choudhary

Updated: June 5, 2023

O cenário da infraestrutura de ML está repleto de algumas das soluções mais impressionantes disponíveis para simplificar o pipeline de ML. A TrueFoundry pode ser uma solução se você se identificar com alguns dos problemas mencionados abaixo:

Está demorando bastante para colocar nossos modelos de ML em produção, e há muita dependência entre as diversas partes interessadas

A principal razão que encontramos para atrasos nos cronogramas é a dependência entre equipes e a falta de competências em diferentes perfis. A TrueFoundry facilita para os Cientistas de Dados treinarem e implantarem no Kubernetes usando Python. Também permite que as equipes de infraestrutura configurem restrições de segurança e orçamentos de custo. Na maioria das empresas com as quais conversamos, o fluxo de implementação é algo como o seguinte:

ML workflow with TrueFoundry
O fluxo de trabalho de ML está quebrado
A TrueFoundry ajuda a reduzir o tempo de desenvolvimento em pelo menos 3 a 4 vezes, capacitando os Cientistas de Dados a implantar e avaliar o modelo por conta própria, sem depender da equipe de infraestrutura/DevOps.

Com a TrueFoundry, o fluxo é semelhante ao seguinte:

ML workflow with TrueFoundry
Fluxo de trabalho de ML com a TrueFoundry

Quer usar nossa infraestrutura Kubernetes padrão para treinamento e implantações de ML

A TrueFoundry é nativa do Kubernetes e funciona em EKS, AKS, GKE (clusters padrão e autopilot) ou clusters on-premise. O ML exige algumas coisas personalizadas em comparação com a infraestrutura de software padrão – como provisionamento dinâmico de nós, suporte a GPU, volumes para acesso mais rápido, orçamentação de custos e autonomia do desenvolvedor. Nós cuidamos de todos os pormenores em todos os clusters para que você possa se concentrar em construir as melhores aplicações sobre uma infraestrutura de ponta.

Cientistas de Dados não deveriam ter que lidar com infraestrutura ou YAML

Nós fornecemos APIs Python – assim você nunca precisará interagir com YAML. Também fornecemos suporte a YAML, caso você queira usá-lo em seus pipelines de CI/CD. Por exemplo, usando a TrueFoundry, você pode implantar uma API de inferência usando o código abaixo:

service = Service(
   name="fastapi",
   image=Build(
       build_spec=PythonBuild(
           command="uvicorn app:app --port 8000 --host 0.0.0.0",
           requirements_path="requirements.txt",
       )
   ),
   ports=[
       Port(
           port=8000,
           host="<Forneça um valor de host com base no seu domínio configurado>"
       )
   ],
   resources=Resources(
       cpu_request=0.5,
       cpu_limit=1,
       memory_request=1000,
       memory_limit=1500
   ),
   env={
       "UVICORN_WEB_CONCURRENCY": "1",
       "ENVIRONMENT": "dev"
   }
)
service.deploy(workspace_fqn="tfy-cluster/my-workspace")

Precisa de infraestrutura de ML que não exija que movamos dados para fora da nossa Cloud

O TrueFoundry é implantado inteiramente no seu próprio cluster Kubernetes. Os dados permanecem na sua própria VPC, as imagens Docker são salvas no seu próprio registro Docker e todos os modelos permanecem no seu próprio sistema de armazenamento de blobs. Você pode ler mais sobre a arquitetura do TrueFoundry aqui.

O autoescalonamento de modelos é bastante lento devido ao tempo de download dos modelos de ML

O Kubernetes geralmente suporta autoescalonamento usando HPA com base em CPU e memória. No entanto, para cargas de trabalho de ML, o autoescalonamento baseado na contagem de requisições é muito melhor em muitos casos. Outro desafio no autoescalonamento pode ser o alto tempo de inicialização dos modelos devido a grandes tamanhos de imagem e tempos de download de modelos. O Truefoundry resolve esses problemas fornecendo tempo de inicialização de contêineres em segundos, cache de modelos para carregamento mais rápido e tempos de inferência mais rápidos.

Queremos usar o poder dos LLMs para o nosso negócio, mas não podemos deixar os dados saírem do nosso ambiente

Podemos usar alguns modelos LLM de código aberto?

O TrueFoundry permite que você implante e ajuste (finetune) os LLMs de código aberto em sua própria infraestrutura. Já descobrimos as melhores configurações para os modelos de código aberto mais comuns para que você possa treiná-los e implantá-los com as configurações ideais e o menor custo.

Queremos permitir que todos os meus desenvolvedores experimentem diferentes LLMs rapidamente

Nós hospedamos um playground interno de LLMs onde você pode decidir quais LLMs deseja incluir na lista de permissões para os desenvolvedores da empresa, incluindo aqueles hospedados internamente, e diferentes desenvolvedores podem experimentar com os dados internos. Aqui está um vídeo rápido sobre o assunto:

Ajuste e implante LLMs na sua nuvem

Queremos fornecer Jupyter Notebooks para Cientistas de Dados de forma self-service, multi-tenant e otimizada em termos de custo

Jupyter Notebooks são essenciais para o ciclo de desenvolvimento diário de um Cientista de Dados. Executar Jupyter Notebooks localmente na própria máquina nem sempre é uma opção pelos seguintes motivos:

  1. Podemos precisar de mais recursos que talvez não estejam disponíveis em um laptop local
  2. O acesso a dados pode não ser permitido no ambiente local.

Nós nos esforçamos muito para executar Jupyter Notebooks de forma contínua no Kubernetes. Jupyter Notebooks no TrueFoundry oferecem os seguintes benefícios em comparação com JupyterLab ou Kubeflow Notebooks:

  1. Tempo de inicialização rápido dos Notebooks (menos de 10 segundos)
  2. Recurso de parada automática que desliga os notebooks após um certo período configurável de inatividade. Isso reduz o custo, já que um cientista de dados pode trabalhar apenas 8 horas por dia. Isso reduzirá o custo em cerca de 60% em comparação com a execução do Jupyter em instâncias EC2.
  3. Persistência do ambiente, dados e dependências Python entre reinicializações.
  4. Capacidade de adicionar dependências dinamicamente à imagem base.
  5. Capacidade de compartilhar notebooks com outros membros da equipe.
  6. Capacidade de configurar o acesso a conjuntos de dados usando contas de serviço em vez de chaves/senhas.

Quer acompanhar todos os modelos da empresa em um só lugar e descobrir quais estão implantados em qual ambiente?

O TrueFoundry oferece um registro de modelos que pode rastrear quais modelos estão em qual estágio, bem como o esquema e a API de todos os modelos no registro.

Quer espelhar ou dividir o tráfego para a nova versão do meu modelo para que possamos testá-lo com tráfego online antes de lançá-lo completamente?

O TrueFoundry permite dividir ou espelhar o tráfego de um modelo para outro. Isso é especialmente útil quando você deseja testar uma nova versão de modelo em tráfego real por algum tempo antes de lançá-la em produção. O TrueFoundry também suporta estratégias de lançamento canary e blue-green na implantação de modelos.

Quer usar hardware e computação em nuvens e on-premise. Como conectá-los para que os desenvolvedores possam mover cargas de trabalho de um ambiente para outro sem problemas?

Dedicamos muito esforço para garantir que cuidamos das diferenças minuciosas dos clusters Kubernetes em diferentes nuvens. Os desenvolvedores podem escrever e implantar o mesmo código em qualquer ambiente sem se preocupar com a infraestrutura subjacente. Nós nos encarregamos de verificar se os componentes subjacentes do Kubernetes estão instalados, verificar migrações incompatíveis e informar os desenvolvedores de acordo.

Estamos incorrendo em muitos custos em nossa infraestrutura de ML e está se tornando difícil rastreá-los e reduzi-los.

Exponibilizamos a visibilidade de custos dos serviços para os desenvolvedores e fornecemos insights para reduzir os custos. Todos os nossos clientes atuais observaram uma redução de custos de pelo menos 30% após a adoção do TrueFoundry.

TrueFoundry é uma PaaS de Implantação de ML sobre Kubernetes, construída para simplificar a implantação de modelos de IA, acelerar os fluxos de trabalho dos desenvolvedores e manter o controle total da infraestrutura. Através da nossa plataforma, capacitamos as equipes de Machine Learning a implantar e monitorar modelos em 15 minutos com 100% de confiabilidade, escalabilidade e a capacidade de reverter em segundos – permitindo-lhes economizar custos e lançar modelos em produção mais rapidamente, possibilitando a realização de valor de negócio real.  

The fastest way to build, govern and scale your AI

Sign Up
Table of Contents

Govern, Deploy and Trace AI in Your Own Infrastructure

Book a 30-min with our AI expert

Book a Demo

The fastest way to build, govern and scale your AI

Book Demo

Discover More

August 27, 2025
|
5 min read

Gateways de IA: Do Pânico da Interrupção à Espinha Dorsal Empresarial

May 21, 2026
|
5 min read

Adicionando OAuth2 a Jupyter Notebooks no Kubernetes

Engenharia e Produto
May 21, 2026
|
5 min read

Uma equipe de 2 pessoas atendendo um modelo para 1,5 milhão de pessoas com TrueFoundry

Engenharia e Produto
May 21, 2026
|
5 min read

Acelere o Processamento de Dados em 30–40x com NVIDIA RAPIDS no TrueFoundry

GPU
Engenharia e Produto
May 21, 2026
|
5 min read

Uma Parceria para IA Responsável: Truefoundry e Enkrypt AI

No items found.
No items found.

Recent Blogs

Black left pointing arrow symbol on white background, directional indicator.
Black left pointing arrow symbol on white background, directional indicator.
Take a quick product tour
Start Product Tour
Product Tour