Reduzindo o custo de nuvem de machine learning para empresa de healthtech

A Neurobit está na vanguarda da pesquisa em IA para Health Tech

A Neurobit é uma empresa de saúde digital sediada em Nova York, Singapura e Bangalore. Eles estão desenvolvendo tecnologias para prever e planejar desfechos de saúde adversos muito antes de eles acontecerem, usando sinais vitais coletados durante o sono como biomarcador.

A empresa construiu o maior banco de dados de sono do mundo, com mais de um trilhão de pontos de dados fisiológicos multicanal. A escala de dados com que treinaram seus modelos lhes dá a robustez para generalizar o modelo para qualquer novo cenário. Seu caso de uso se assemelha a muitos esforços recentes de IA de empresas de Health Tech de nova geração e de novas iniciativas de IA das grandes empresas de tecnologia.

Encontramos semelhanças entre os casos de uso da Neurobit e os de outras empresas de saúde de grande e médio porte com as quais conversamos:

Altamente regulamentadas, com diretrizes extremamente rigorosas sobre privacidade de dados
Grande volume de dados
Baixa tolerância a falhas em requisições de modelo malsucedidas
Uso de algoritmos proprietários com fortes regulamentações de proteção de IP

A equipe estava perdendo mais de US$ 1.000 para cada usuário que deixava de atender

Quando conhecemos a equipe da Neurobit, eles vinham conduzindo ensaios médicos com mais de 120 centros de pesquisa, universidades e mais de 1.000 participantes. A maioria desses participantes estava na mesma localização geográfica.

Quando a pessoa acorda, os sensores enviam dados fisiológicos ao servidor para processamento. Cada requisição precisa que 20 modelos diferentes sejam chamados para gerar a saída final.

O volume de dados que chegava em cada requisição era grande (mais de 400 mb) e, durante os horários de alto tráfego, a equipe observava um atraso significativo no tempo de resposta e até a perda de requisições, com perda de dados do usuário.

Problemas enfrentados no pipeline de machine learning devido a picos de tráfego — **Requisições perdidas levaram a milhares de dólares em prejuízo para a empresa**

‍

Essa situação estava causando implicações financeiras adversas significativas para a equipe:

Perder uma única requisição vinda dos participantes do ensaio custava à empresa mais de US$ 1.000 em despesas de experimento.
A empresa poderia acelerar os ensaios médicos trabalhando com laboratórios e hospitais que fazem upload de dados em grandes lotes, o que atrasava as aprovações do produto.

Como em outros casos de uso de machine learning no setor de health tech, a equipe não podia se dar ao luxo de perder dados de clientes ou ter respostas atrasadas.

A equipe queria implantar seus modelos no Kubernetes

A equipe sabia que implantar seus modelos no Kubernetes, com uma fila para armazenar as requisições antes de serem processadas, conseguiria resolver seus problemas de confiabilidade.

No entanto, as normas de proteção de IP da empresa limitavam o acesso ao modelo apenas a alguns membros da equipe de machine learning, e não à equipe de DevOps.

A equipe de machine learning tinha banda e expertise limitadas em Kubernetes para realizar isso por conta própria. Em vez disso, eles queriam trabalhar no desenvolvimento de novos modelos.

A stack existente que estava sendo usada para os deployments de machine learning era:

HTML Table Generator

Componente	Ferramenta
Framework de desenvolvimento de machine learning	Tensorflow
Nuvem	GCP e AWS
Model Serving	GRPC sem load balancer
Armazenamento de modelos	Google Bucket

‍

A stack funcionava bem para a equipe até certa escala. Mas, quando o caso de uso escalou, a equipe começou a enfrentar problemas de confiabilidade ao servir o modelo, que exigiam atenção imediata.

A equipe queria reforçar a segurança de suas APIs de modelo

Como a empresa lida com PII sensíveis e dados de saúde, manter a segurança das APIs de modelo era de extrema importância para eles. Eles não queriam que nenhum dado de cliente saísse de sua nuvem e queriam reforçar as normas de autenticação e segurança das APIs que vinham usando.

A equipe decidiu fazer parceria com a TrueFoundry

A equipe precisava de uma forma de capacitar sua equipe de machine learning, que tinha acesso ao modelo, para conseguir implantar e gerenciar modelos no Kubernetes de forma independente. Os objetivos que a equipe da Neurobit queria alcançar por meio de uma parceria com a TrueFoundry eram:

Aumentar a confiabilidade de seus modelos de ML quando servidos em escala
Capacitar a equipe de DS para conseguir implantar e gerenciar os modelos de machine learning no Kubernetes
Reforçar os protocolos de autenticação e segurança nas APIs de modelo

A TrueFoundry ajudou a equipe a resolver as questões de confiabilidade e segurança

A plataforma foi configurada em menos de um dia

A equipe da TrueFoundry ajudou a equipe da Neurobit a instalar o agente e o control plane da TrueFoundry em seu cluster em uma chamada de 2 horas. Eles foram informados sobre os acessos e permissões necessários e foram guiados por cada etapa da instalação em uma única chamada.

A equipe teve a opção de instalar apenas os módulos da plataforma TrueFoundry que eram relevantes para eles (deployment de modelos e autenticação).

Após a instalação, a equipe recebeu uma demonstração da plataforma e a documentação.

A equipe da Neurobit começou a implantar desde o primeiro dia

A equipe da Neurobit conseguiu começar a usar a plataforma para seus deployments de modelo logo no primeiro dia. Eles podiam conectar diretamente seus repositórios Git à plataforma; esse código era automaticamente dockerizado e implantado na plataforma usando a UI, as APIs ou o SDK Python da TrueFoundry. Não foram necessárias alterações de código nem foi preciso aprender nenhum framework adicional para todos os fluxos de trabalho que a equipe estava tentando concluir.

A equipe demonstrou um ótimo ritmo, pois queria resolver rapidamente os problemas de confiabilidade. Em poucos dias, eles começaram a explorar cada vez mais recursos da plataforma e nos forneceram feedback.

Em duas semanas, a equipe conseguiu:

Migrar suas cargas de trabalho de ML inteiramente para o Kubernetes com a TrueFoundry.
Implantar o modelo de ML com uma fila assíncrona para armazenar as requisições recebidas quando picos de tráfego são detectados, configurada por meio de uma simples flag.
Otimizar a alocação de recursos para os serviços de ML conforme os padrões de tráfego e reduzir os recursos provisionados para economizar custos quando o volume de requisições é baixo.
Configurar a autenticação e reforçar a segurança em todos os endpoints de API de modelo.

Impacto nos casos de uso de machine learning

Por meio do deployment dos modelos de machine learning na TrueFoundry, a equipe conseguiu:

Economizar cerca de US$ 25-30 mil em pagamentos a participantes de ensaios ao reduzir a zero as falhas de modelo e os problemas de confiabilidade.
Redução de 35-40% nos custos de nuvem
Ensaios clínicos de 3 a 6 meses mais rápidos por meio da colaboração com hospitais e laboratórios
Configuração de autenticação no endpoint de API de modelo

A equipe da TrueFoundry também ajudou a equipe da Neurobit a otimizar sua arquitetura de software

Quando os desafios de maior prioridade com os modelos de machine learning foram resolvidos, a equipe da TrueFoundry decidiu ir além para garantir que a equipe da Neurobit estivesse preparada para o sucesso. Durante nossas conversas com a equipe da Neurobit, entendemos que havia espaço para otimizar ainda mais a arquitetura de microservices da empresa. Isso poderia ter um possível impacto no tempo de inferência e nos custos de nuvem que a equipe estava tendo.

Acabamos fazendo uma revisão aprofundada da arquitetura de microservices com a equipe.

Originalmente, cada microservice escrevia sua saída em um banco de dados e o próximo microservice carregava a saída do microservice anterior a partir do banco de dados, desperdiçando muito tempo — **Arquitetura de microservices original**

Obtivemos o seguinte entendimento da arquitetura que a equipe seguia:

Havia 5 microservices diferentes que eram invocados para processar a entrada recebida dos usuários.
Cada serviço escrevia sua saída intermediária em um banco de dados. Desse banco de dados, o próximo serviço lia a saída do serviço anterior, executava a computação sobre ela e a escrevia de volta no banco de dados para o próximo microservice consumir.

Todo esse processo levava cerca de 7 minutos para cada requisição.

Arquitetura de microservices otimizada com a TrueFoundry

Conseguimos ajudar a equipe a reduzir 70% do seu tempo de inferência ao simplificar a arquitetura de microservices — Arquitetura de microservices otimizada com a TrueFoundry

‍

Tentamos entender a tolerância a falhas e os tempos de inferência que a equipe exigia. Com esse entendimento, sugerimos que a equipe da Neurobit passasse a saída de um serviço diretamente para o outro por meio do protocolo gRPC.

A vantagem dessa arquitetura era que.

Como cada microservice levava cerca de 30 segundos para executar, não havia muito risco de perder saídas intermediárias em caso de falha, já que todo o pipeline poderia ser executado novamente.
Isso reduz significativamente o custo de transferência de dados e o tempo gasto para escrever as saídas intermediárias em um banco de dados.

Esse novo pipeline foi hospedado na plataforma TrueFoundry e reduziu o tempo de inferência do modelo de cerca de 7 min/requisição para cerca de 2 min/requisição.

Impacto do redesenho da arquitetura

O tempo de inferência do pipeline de ML foi reduzido de cerca de 7 minutos para cerca de 2 minutos
O custo de executar o serviço de machine learning foi reduzido em 60-70%
Aumento da produtividade e da independência dos desenvolvedores. Os desenvolvedores agora podiam implantar modelos e aplicações por conta própria, o que antes exigia idas e vindas com a equipe de DevOps
A equipe agora executa todos os seus modelos e aplicações totalmente no Kubernetes

Impacto no negócio

À medida que nossa parceria com a equipe da Neurobit avança, vimos o negócio colher os benefícios dos tempos de resposta mais rápidos, da confiabilidade e da escala que a plataforma TrueFoundry ajudou a equipe da Neurobit a alcançar.

GTM 6 meses mais rápido, redução de 60% nos custos de nuvem, tempos de resposta do modelo 70% mais rápidos — Impacto no negócio da Neurobit a partir do engajamento

‍

Impacto na stack técnica da Neurobit

A TrueFoundry ajudou a equipe da Neurobit a migrar todas as suas cargas de trabalho de machine learning para o Kubernetes sem precisar lidar com a complexidade de aprender algo novo relacionado ao Kubernetes. Também ajudou a equipe a se tornar independente no tratamento de todas as operações avançadas no Kubernetes, como fazer deployments assíncronos, configurar autoscaling, deployments serverless etc.

Também conseguimos ajudar a equipe a migrar alguns de seus recursos de software para uma arquitetura de microservices sobre o Kubernetes, de modo que sua stack esteja preparada para o futuro e funcione com níveis ótimos de utilização.

Migração completa para o Kubernetes, 80% menos interação da equipe de ML com DevOps, autenticação forte em todos os endpoints de API, stack pronta para escala de 100X e modelos SOTA — Impacto técnico na Neurobit a partir do engajamento

‍

"Trabalhar com a TrueFoundry provou ser um divisor de águas para nossa equipe de desenvolvimento. Eles nos forneceram as ferramentas necessárias para implantar nossos modelos no Kubernetes de forma independente, uma conquista que antes parecia fora do nosso alcance. Como resultado, a velocidade com que nossa equipe agora consegue operar teve um aumento considerável. Agora conseguimos implantar e escalar nossos modelos com confiança, garantindo ao mesmo tempo disponibilidade e escalabilidade.

O comprometimento e a dedicação da equipe da TrueFoundry realmente se destacam. Eles superaram as expectativas do projeto inicial e demonstraram um interesse genuíno em impulsionar nosso sucesso. De forma impressionante, estenderam sua expertise até mesmo além do machine learning, dedicando tempo para entender profundamente e melhorar nosso framework arquitetural mais amplo.

Ao fazer parceria com a TrueFoundry, alcançamos eficiências operacionais e economias de custo significativas. Nossos tempos de inferência de modelo foram reduzidos em aproximadamente 50%, levando a uma melhora notável na experiência do cliente. Ao mesmo tempo, nossos custos de infraestrutura tiveram uma queda substancial de cerca de 60%, por meio do uso eficiente da infraestrutura. Essa parceria não só gerou economia financeira para nós, como também melhorou enormemente a entrega de serviço aos nossos clientes e o desenvolvimento rápido de tecnologias para a equipe de data science."

- Dr. Amiya Patnaik, Co-founder and Director @ Neurobit

Nossos aprendizados com o engajamento com a Neurobit

À medida que continuamos a colaborar com a Neurobit e a ajudá-los a alcançar a escala e o nível de impacto com Inteligência Artificial que se propuseram, somos gratos por todos os aprendizados que conseguimos extrair do engajamento com a equipe. Isso ajudou a moldar tanto a forma como pensamos o engajamento com clientes quanto a dar uma direção sólida ao nosso produto.

Alguns de nossos principais aprendizados incluem:

As empresas podem economizar uma grande parcela (mais de 40%) de seus custos de nuvem ao usar seus recursos de forma ótima
Tornar os desenvolvedores independentes e capacitá-los a fazer os lançamentos por conta própria aumenta o ritmo em que a equipe consegue entregar
Começar com uma stack pronta para escala garante que as coisas não quebrem e que a equipe não acabe tendo o esforço extra de uma migração no futuro

Codesenvolvemos alguns recursos importantes da plataforma enquanto tentávamos resolver os casos de uso que a equipe da Neurobit precisava que habilitássemos. Eles incluem:

Deployments assíncronos
Jupyter Notebooks hospedados

Caminho a seguir

Esperamos colaborar com a equipe da Neurobit no longo prazo e aprender com eles enquanto tentamos ajudá-los ao longo do caminho. Alguns dos desenvolvimentos futuros que podem estar reservados para esse engajamento incluem:

Escalar os throughputs de inferência do modelo para 10X a escala atual
Ajudar a migrar toda a stack de software da Neurobit para a TrueFoundry
Deployment de novos modelos experimentais e a execução de pilotos com eles em laboratórios, hospitais e casas de repouso.

Animados para ver o que vem a seguir!

The fastest way to build, govern and scale your AI

Book a Demo

Como a Neurobit economiza 60% de seus custos de nuvem e serve Machine Learning em escala

60%

70%

10 X

A Neurobit está na vanguarda da pesquisa em IA para Health Tech

A equipe estava perdendo mais de US$ 1.000 para cada usuário que deixava de atender

A equipe queria implantar seus modelos no Kubernetes

A equipe queria reforçar a segurança de suas APIs de modelo

A equipe decidiu fazer parceria com a TrueFoundry

A TrueFoundry ajudou a equipe a resolver as questões de confiabilidade e segurança

A plataforma foi configurada em menos de um dia

A equipe da Neurobit começou a implantar desde o primeiro dia

Impacto nos casos de uso de machine learning

A equipe da TrueFoundry também ajudou a equipe da Neurobit a otimizar sua arquitetura de software

Arquitetura de microservices otimizada com a TrueFoundry

Impacto do redesenho da arquitetura

Impacto no negócio

Impacto na stack técnica da Neurobit

Nossos aprendizados com o engajamento com a Neurobit

Caminho a seguir

Opere seu Pipeline de ML desde o Dia 0

Recursos

Por que TrueFoundry?

Como a Neurobit economiza 60% de seus custos de nuvem e serve Machine Learning em escala

60%

70%

10 X

A Neurobit está na vanguarda da pesquisa em IA para Health Tech

A equipe estava perdendo mais de US$ 1.000 para cada usuário que deixava de atender

A equipe queria implantar seus modelos no Kubernetes

A equipe queria reforçar a segurança de suas APIs de modelo

A equipe decidiu fazer parceria com a TrueFoundry

A TrueFoundry ajudou a equipe a resolver as questões de confiabilidade e segurança

A plataforma foi configurada em menos de um dia

A equipe da Neurobit começou a implantar desde o primeiro dia

Impacto nos casos de uso de machine learning

A equipe da TrueFoundry também ajudou a equipe da Neurobit a otimizar sua arquitetura de software

Arquitetura de microservices otimizada com a TrueFoundry

Impacto do redesenho da arquitetura

Impacto no negócio

Impacto na stack técnica da Neurobit

Nossos aprendizados com o engajamento com a Neurobit

Caminho a seguir

Opere seu Pipeline de ML desde o Dia 0

Recursos

Por que TrueFoundry?

Assine nossa newsletter