A Innovaccer é uma nuvem de inteligência em saúde que opera em ambientes altamente regulamentados, relacionados a informações de saúde protegidas (PHI). A Innovaccer usa IA para melhorar a eficiência clínica, a gestão de cuidados e a tomada de decisões operacionais em toda a sua plataforma de saúde. A IA impulsiona casos de uso como sumarização clínica, identificação de lacunas de cuidados, estratificação de risco, suporte à qualidade e codificação, e insights em linguagem natural sobre dados de saúde, enquanto opera em ambientes regulamentados e com grande volume de PHI.
Nesta jornada de adoção de GenAI em aplicações clínicas e operacionais, a Innovaccer precisava de uma forma centralizada para governar, observar e escalar o uso, sem fragmentar o acesso ou comprometer a conformidade. Isso trouxe à tona desafios relacionados à observabilidade segura de PII, auditabilidade, controle de acesso a modelos e governança de custos em múltiplos LLMs e modelos de embedding.
Ao fazer parceria com a TrueFoundry, a Innovaccer padronizou todo o tráfego de GenAI através do AI Gateway da TrueFoundry, estabelecendo um plano de controle unificado para governança de nível de saúde em escala. Hoje, a Innovaccer roteia cerca de 17 milhões de solicitações de inferência por mês, processando cerca de 34 bilhões de tokens de entrada e 3,4 bilhões de tokens de saída em mais de 40 modelos — incluindo OpenAI, AWS Bedrock, Gemini e implantações auto-hospedadas — alimentando mais de 25 aplicativos de saúde. Com registro centralizado, redação de PII, controles de custo e aplicação de políticas incorporados por padrão, a Innovaccer incorporou a GenAI profundamente nos fluxos de trabalho de produção, mantendo observabilidade, conformidade e governança de nível empresarial em todos os principais hiperescaladores de LLM.
Um engajamento focado comparou a TrueFoundry com plataformas alternativas de hospedagem de modelos e mostrou que o tempo de autoescalabilidade foi reduzido de ~8 minutos para ~5 minutos (uma diminuição de 37,5%), além de uma configuração de infraestrutura mais rápida, observabilidade mais rica e melhores características de custo.
A Innovaccer ativa o fluxo de dados de saúde, capacitando provedores, pagadores e organizações governamentais a oferecer experiências inteligentes e conectadas que promovem resultados de saúde. A Healthcare Intelligence Cloud equipa cada parte interessada na jornada do paciente para transformar dados fragmentados em ações proativas e coordenadas que elevam a qualidade do atendimento e impulsionam o desempenho operacional. Organizações de saúde líderes como Orlando Health, Adventist Healthcare e Banner Health confiam na Innovaccer para integrar um sistema de inteligência em sua infraestrutura existente, estendendo o toque humano na saúde. A Innovaccer gerencia dados de milhões de pacientes com bilhões de pontos de dados.
“Impulsionando a Inovação em IA/ML da Innovaccer” não é apenas um slogan, reflete como a Innovaccer está escalando a IA em organizações de saúde, com a TrueFoundry como parceira de infraestrutura habilitadora. A Innovaccer está automatizando o trabalho de conhecimento em RCM, acesso de pacientes, copilotos de provedores, codificação clínica e mapeamento de dados. Para apoiar isso em escala, a Innovaccer segue uma estratégia multimodelos que abrange Azure, AWS Bedrock, OpenAI e modelos auto-hospedados — com a TrueFoundry fornecendo a espinha dorsal de governança, orquestração e implantação.
Para sustentar esse crescimento, a Innovaccer precisava:
Antes de centralizar no TrueFoundry, a infraestrutura de IA generativa da Innovaccer utilizava diretamente,
conexões ponto a ponto entre aplicações de produção e vários provedores como OpenAI, Azure,
e Bedrock.
Embora funcional, essa abordagem fragmentada carecia do gateway unificado necessário para a rastreabilidade de alto nível e a supervisão fiscal essenciais em um ambiente de saúde. Consolidar esses fluxos de trabalho foi um movimento estratégico para garantir a confiabilidade exigida para soluções de nível empresarial
operações clínicas.
Ao centralizar sua infraestrutura de GenAI através da TrueFoundry, a Innovaccer passou de um modelo fragmentado para um espinha dorsal unificada de IA projetado para as complexidades da saúde.
Para equipes de atendimento, médicos e pacientes que dependem dessas aplicações para insights oportunos e suporte à decisão, isso criou riscos potenciais em torno da consistência da experiência, disponibilidade do serviço durante momentos clínicos de pico e confiança na forma como os dados de saúde sensíveis eram tratados.
Além disso, a TrueFoundry comparou sua experiência de implantação e autoescalonamento com plataformas alternativas de hospedagem de modelos em provedores de nuvem populares. Eles exigiam configuração manual para contagens de invocação, dependiam de rastreamento baseado em logs via CloudWatch para entender o tempo de autoescalonamento e adicionavam uma margem de ~25% sobre o preço da instância. A visibilidade dos eventos em nível de pod e do comportamento de autoescalonamento era limitada, tornando o ajuste mais lento e menos transparente.
A TrueFoundry foi adotada como a camada de DevX e orquestração para ambos Tráfego de LLM (Gateway de IA) e Plataforma de Implantação de IA.
Em média, em um mês, o Gateway de IA atende:
A Innovaccer utiliza GenAI em gerenciamento de cuidados, inteligência clínica e fluxos de trabalho operacionais que apoiam médicos, gerentes de cuidados e equipes de saúde populacional. Esses aplicativos apresentam resumos de pacientes, insights de risco, lacunas de cuidados e as próximas melhores ações no ponto de tomada de decisão.
Em 10 de junho, quando a OpenAI experimentou taxas de erro elevadas, o Gateway de IA da Innovaccer redirecionou automaticamente o tráfego para o Azure com base em regras de fallback pré-configuradas. Isso garantiu que as equipes de cuidados continuassem a receber insights oportunos sem interrupção, mesmo enquanto os provedores de modelos subjacentes experimentavam instabilidade.
Ao configurar o failover centralmente no Gateway de IA, em vez de em aplicativos individuais, a Innovaccer garantiu confiabilidade consistente em toda a sua plataforma de saúde. Essa abordagem reduziu a variabilidade na experiência de clínicos e equipes de cuidados, ao mesmo tempo em que permitiu que as equipes de produto se concentrassem em melhorar os fluxos de trabalho de cuidados, em vez de gerenciar cenários de falha específicos do provedor.
O TrueFoundry também acelerou o acesso a APIs OpenAI mais recentes através do Gateway:
A GenAI da Innovaccer é utilizada em fluxos de trabalho de gerenciamento de cuidados e inteligência clínica, onde o tempo de resposta afeta diretamente a usabilidade para médicos e equipes de cuidados. Para apoiar isso, o TrueFoundry implementou roteamento sensível à latência no Gateway de IA, direcionando dinamicamente o tráfego em tempo real para o endpoint de modelo mais rápido disponível, sem exigir alterações nos aplicativos.
Além disso, o gerenciamento centralizado de prompts permitiu que as equipes da Innovaccer versionassem e implementassem atualizações de prompts com segurança em todos os aplicativos, garantindo um comportamento de IA consistente e confiável nos fluxos de trabalho clínicos e operacionais.
Para casos de uso de saúde sensíveis à conformidade, a Innovaccer precisava de uma infraestrutura de GenAI que pudesse operar inteiramente em ambientes regulamentados e soberanos. O TrueFoundry foi implementado no AWS GovCloud (US), permitindo que a Innovaccer executasse cargas de trabalho de GenAI em regiões projetadas para requisitos rigorosos de residência de dados, controle de acesso e auditoria.
Isso permite que a Innovaccer utilize o mesmo Gateway de IA e camada de orquestração para cargas de trabalho com grande volume de PHI e alinhadas com a HIPAA, garantindo que os dados de saúde sensíveis permaneçam dentro das fronteiras soberanas aprovadas e das estruturas de conformidade.
A implementação do TrueFoundry (TF) introduziu um ciclo de vida mais determinístico para a implantação de modelos. Nos testes de desempenho, o tempo de "gatilho para operacional" foi reduzido para uma consistente janela de ~5 minutos, representando uma otimização de 37,5% em relação às linhas de base de infraestrutura anteriores.
O escalonamento padrão baseado em recursos (CPU/RAM) muitas vezes fica aquém da natureza intermitente do tráfego de GenAI. A Innovaccer adotou Requisições Por Segundo-based scaling através da TrueFoundry como a métrica de escalonamento primária para lidar melhor com o tráfego intermitente de GenAI
Ao consolidar o tráfego de GenAI no gateway centralizado da TrueFoundry, a Innovaccer estabeleceu o "equilíbrio" técnico necessário para as operações de saúde corporativas:
A parceria destacou várias vantagens da plataforma baseada em Kubernetes da TrueFoundry: