Criatividade, Sistemas de IA e Truefoundry com Nikunj Bajaj

Built for Speed: ~10ms Latency, Even Under Load
Blazingly fast way to build, track and deploy your models!
- Handles 350+ RPS on just 1 vCPU — no tuning needed
- Production-ready with full enterprise support
Existe um tipo particular de fundador que constrói não a partir da oportunidade, mas de uma experiência profundamente vivida. Nikunj Bajaj, cofundador e CEO da TrueFoundry, é esse tipo de fundador. Numa conversa recente no podcast Arden Labs, ele traçou o arco completo da sua jornada, desde crescer em Calcutá, a passar num dos exames de admissão mais competitivos da Índia, até passar um confinamento pandémico num colchão num único quarto com os seus dois cofundadores, idealizando a empresa que viria a ser a TrueFoundry.
É uma história que recompensa a paciência para ser ouvida na íntegra.
Calcutá para IIT, IIT para Berkeley
Nikunj cresceu num lar modesto e com os pés no chão em Calcutá, o tipo de educação que ele descreve como estável e consistente: a mesma casa, os mesmos amigos, o mesmo bairro durante anos. Ele não era, por sua própria admissão, alguém que sonhava com o IIT enquanto crescia. A ideia o encontrou gradualmente, através de conversas com pessoas que haviam trilhado esse caminho, e através de um crescente interesse em engenharia e matemática.
O que se seguiu foram dois anos de preparação intensa para o exame de admissão aos IITs da Índia. Meio milhão de estudantes fazem o exame todos os anos. Alguns milhares entram. Nikunj foi um deles.
No IIT Kharagpur, o mais antigo e maior dos IITs, ele escolheu engenharia de instrumentação, pois era atraído pela robótica e pela promessa de construir coisas que se movessem e respondessem ao mundo. Fora da sala de aula, ele fez exatamente isso. Sua equipe construiu um veículo terrestre autônomo e se tornou a primeira equipe da Índia a representar o país em uma competição de robótica nos Estados Unidos. Foi sua primeira viagem à América.
Seguiu-se um estágio na UC Berkeley, garantido através de recomendações de pesquisa de orientadores em Israel e na Índia. Esse estágio mudou tudo. Sua pesquisa correu tão bem que seu orientador o convidou a retornar para um mestrado. Ele também conheceu sua esposa lá, que havia vindo no mesmo programa, a colega de quarto dela, seu colega de laboratório. Um estágio, ele reflete, resolveu tanto sua carreira quanto sua vida.
Os Anos Meta e a Percepção Que Deu Início a Tudo
Após concluir seu mestrado em Berkeley em 2014, Nikunj ingressou na Reflektion, uma empresa de IA que atende à indústria de e-commerce, como um de seus primeiros engenheiros de machine learning. Ao longo de três anos e meio, ele ascendeu para liderar a equipe de ML e construiu uma plataforma interna de desenvolvimento de machine learning, o que foi seu primeiro vislumbre real do problema de infraestrutura que ele dedicaria sua carreira a resolver mais tarde.
Então veio a Meta.
Na Meta, Nikunj trabalhou na equipe de IA conversacional numa época em que a empresa estava aprofundando-se em modelos baseados em transformadores, a mesma tecnologia que mais tarde impulsionaria o ChatGPT e a onda de IA generativa. Mas, além da exposição técnica, foi a realidade operacional da plataforma interna de ML da Meta que permaneceu com ele.
"Como desenvolvedor individual na Meta, eu conseguia construir um modelo de machine learning e lançá-lo em 10.000 nós sozinho, sem depender de mais ninguém", ele compartilhou no podcast. Fora da Meta, esse tipo de capacidade simplesmente não existia no ecossistema de nuvem pública. As empresas estavam construindo aplicações de machine learning em pilhas fragmentadas e paralelas: uma para software, uma para ML e, cada vez mais, uma terceira para IA generativa. A ineficiência era óbvia para qualquer um que tivesse visto a alternativa.
Essa observação tornou-se a hipótese fundadora da TrueFoundry: que o machine learning eventualmente atingiria um ponto de inflexão, momento em que as empresas precisariam urgentemente de uma plataforma de infraestrutura unificada e verticalizada, muito parecida com o que a Meta havia construído internamente. A questão não era se aconteceria, mas quando.
Uma Pandemia, Uma Virada e Um Novo Começo
Antes da TrueFoundry, existia a Enthire. No início de 2020, Nikunj e seus dois cofundadores — Abhishek, que também havia trabalhado na Meta, e Anurag, que usava machine learning para construir estratégias de negociação na WorldQuant — largaram seus empregos para resolver um problema diferente: a ineficiência das entrevistas de contratação técnica.
O momento, como Nikunj coloca, não poderia ter sido pior (ou mais esclarecedor!). Eles chegaram a Bangalore em março de 2020, dias antes de a Índia entrar em confinamento. Sem ter para onde ir, os três acabaram compartilhando um único quarto no apartamento de dois quartos de um amigo por meses, estendendo colchões e construindo uma empresa do zero.
A Enthire cresceu. Em um ano, eles tinham de 40 a 50 clientes e haviam sido aceitos na Y Combinator. Mas uma conversa crucial com seu parceiro da YC, alguém que havia passado quatro anos e mais de 35 milhões de dólares construindo uma empresa surpreendentemente similar antes de se juntar à YC, deu-lhes a validação honesta que precisavam ouvir: o modelo de negócios tinha um teto que eles não conseguiriam romper. Era muito intensivo em operações, muito nichado e não era uma boa opção para três fundadores com profundos conhecimentos em tecnologia.
Eles decidiram sair do negócio, que foi adquirido por uma grande empresa indiana, e voltaram à estaca zero. O que veio a seguir foi a TrueFoundry, construída com base nos conhecimentos de infraestrutura que Nikunj e Abhishek trouxeram consigo desde o tempo que passaram na Meta.
Construindo a Plataforma que Faltava ao Mundo Corporativo
A TrueFoundry foi fundada no final de 2021, mais de um ano antes de o ChatGPT tornar a IA generativa uma conversa comum. Essa vantagem inicial foi extremamente importante. Porque a plataforma foi projetada desde o início com a arquitetura da Meta como sua estrela-guia, tratando a IA generativa como um caso especial de aprendizado de máquina, e o aprendizado de máquina como um caso especial de software. Ela já era capaz de suportar cargas de trabalho de modelos de linguagem grandes quando o mercado de repente exigiu exatamente isso.
"Quando o ChatGPT foi lançado, não tivemos que fazer nenhuma mudança arquitetônica fundamental", disse Nikunj. "Estávamos pensando em aprendizado de máquina, e ele suportaria LLMs por padrão."
O primeiro grande cliente corporativo deles foi uma das maiores empresas farmacêuticas do mundo. Desde então, a TrueFoundry cresceu para uma equipe de quase 100 pessoas na Bay Area, Boston, Bangalore e Londres. O produto expandiu-se de sua plataforma original de implantação de IA, que permite às empresas executar modelos e agentes personalizados em sua própria infraestrutura, para incluir um AI Gateway, um plano de controle unificado que se posiciona no centro de cada chamada de API que uma empresa faz para seus modelos, agentes e servidores MCP.
O gateway impõe governança, conformidade e controle de custos. Ele oferece observabilidade completa em toda a pilha de IA. E opera em 17 regiões globalmente, alcançando mais de quatro noves de tempo de atividade com latência inferior a cinco milissegundos, lidando com dezenas de milhares de requisições por segundo para aplicações críticas de produção.
O Que Ele Diria ao Seu Eu Mais Jovem
Perguntado sobre que conselho daria a si mesmo no início dessa jornada, a resposta de Nikunj foi caracteristicamente sensata.
Faça o trabalho sem glamour e faça-o excepcionalmente bem.
"Muitas vezes, quando estamos trabalhando em problemas interessantes, nós gostamos. E quando o trabalho se torna um pouco menos interessante, começamos a questionar tudo", disse ele. "Meu conselho é: não importa o que você esteja fazendo, faça-o tão bem que você se sinta orgulhoso do próprio trabalho, mesmo que o trabalho não fosse interessante."
O efeito composto dessa abordagem, ele argumenta, é subestimado. As pessoas notam a execução de classe mundial mesmo em tarefas rotineiras. Essas são as pessoas que mais tarde querem voltar e trabalhar com você. Seu crescimento pessoal e seu ecossistema crescem juntos.
É, de muitas maneiras, a filosofia que permeou cada capítulo de sua história, desde dois anos de preparação silenciosa em Calcutá, a escolher um mestrado em vez de um salário de seis dígitos, a reconstruir do zero após a Enthire, a passar um ano focado na infraestrutura antes que a TrueFoundry atendesse sua primeira carga de trabalho de produção.
A estratégia de longo prazo, aplicada consistentemente, tende a compensar.
Ouça a conversa completa com Nikunj Bajaj no podcast Arden Labs, disponível agora no Spotify e Apple Podcasts.
TrueFoundry AI Gateway delivers ~3–4 ms latency, handles 350+ RPS on 1 vCPU, scales horizontally with ease, and is production-ready, while LiteLLM suffers from high latency, struggles beyond moderate RPS, lacks built-in scaling, and is best for light or prototype workloads.
The fastest way to build, govern and scale your AI













.webp)






.webp)

.webp)
.webp)





.png)



