True ML Talks #6 - Plattform für maschinelles Lernen @ °Nomad Health

Auf Geschwindigkeit ausgelegt: ~ 10 ms Latenz, auch unter Last
Unglaublich schnelle Methode zum Erstellen, Verfolgen und Bereitstellen Ihrer Modelle!
- Verarbeitet mehr als 350 RPS auf nur 1 vCPU — kein Tuning erforderlich
- Produktionsbereit mit vollem Unternehmenssupport
Wir sind zurück mit einer weiteren Folge von True ML Talks. Darin tauchen wir tief ein °Nomad Health's ML Platform, und wir sprechen mit Liming Zhao.
Liming Zhao ist CTO bei °Nomad Health, einem Technologieunternehmen, das die Personalbranche im Gesundheitswesen revolutioniert. Da das Angebot an Klinikern, insbesondere angesichts einer Pandemie, knapp ist, will °Nomad Health einen Marktplatz bieten, auf dem medizinisches Fachpersonal temporäre Stellen finden kann, um den dringendsten und attraktivsten Bedürfnissen der Patienten gerecht zu werden.
📌
Unsere Gespräche mit Liming werden die folgenden Aspekte behandeln:
- ML-Anwendungsfälle in °Nomad Health
- Team für maschinelles Lernen bei °Nomad Health
- Einsatz von Modellen für maschinelles Lernen
- Aufbau einer maßgeschneiderten Feature Store-Lösung
- Auswahl der MLOps-Tools
- Cloud-Kosten verwalten
Sehen Sie sich die ganze Folge unten an:
ML-Anwendungsfälle bei °Nomad Health
- Prädiktive Modellierung: °Nomad Health hat KI und ML in seinen Betrieb integriert, insbesondere im Bereich der prädiktiven Modellierung. Dies hilft bei der Priorisierung der Arbeit, da Kliniker die knappste Ressource sind. °Nomad Health investiert viel in dieses Thema und betrachtet es als eine Fähigkeit des maschinellen Lernens.
- Empfehlungssysteme: °Nomad Health verwendet graphenbasierte Modelle, um Klinikern attraktive Jobs zu empfehlen. Sie beziehen dies in ihr Ranking und ihre Kontakt-E-Mails ein und stellen so sicher, dass Klinikern die am besten geeigneten Stellen präsentiert werden, auch wenn sie nicht die Zeit haben, alle verfügbaren Stellen zu erkunden.
- Große Sprachmodelle: °Nomad Health verwendet LLMs wie GPT-3, um Stellenbeschreibungen zu extrahieren und zu ergänzen. Sie verwenden das Modell, um die Stellenanforderungen zu standardisieren, indem sie aussagekräftige Informationen aus einem Textblock extrahieren, der in unterschiedlichem Detailgrad und in unterschiedlicher Klarheit geschrieben sein kann. °Nomad Health untersucht auch die Verwendung von LLMs bei Lebensläufen, aber dies ist aufgrund des unterschiedlichen Vollständigkeitsgrads des klinischen Personals eine Herausforderung.
📌
LLMs für Lebensläufe im klinischen Personalwesen:
°Nomad Health untersucht die Verwendung großer Sprachmodelle (LLMs) für Stellenbeschreibungen und Lebensläufe. Das Unternehmen hat mit robusten Modellen wie GPT-3 mehr Erfolge erzielt. Die Verwendung von LLMs in Lebensläufen für das klinische Personal stellt jedoch aufgrund der Notwendigkeit spezifischer Zertifizierungen und Lizenzen eine Herausforderung dar. °Nomad Health arbeitet an einem umfassenden Satz digitaler Zeugnisse für Lebensläufe und nutzt dabei ihre Plattform, um den Prozess sowohl für Kliniker als auch für medizinische Einrichtungen zu vereinfachen.
Team für maschinelles Lernen bei °Nomad Health
Das Data-Science-Team von °Nomad Health ist relativ klein und besteht aus neun Teammitgliedern, darunter ein Manager, ein Datenwissenschaftler, ein Datenanalyst und ein Dateningenieur. Die verbleibenden fünf Mitglieder sind Ingenieure für maschinelles Lernen, von denen sich zwei auf Infrastrukturentwicklung und MLOps konzentrieren, während sich die anderen drei auf das Erstellen, Testen und Versenden von Modellen konzentrieren.
Sie nutzen leicht verfügbare Lösungen aus anderen Branchen und Referenzproblemen, passen sie an bestimmte Anwendungsfälle an und investieren viel in das Sammeln, Analysieren und Standardisieren von Daten. Die Teamstruktur und die Methoden der Zusammenarbeit von °Nomad ermöglichen es ihnen, schnell und effizient vorzugehen, wobei alle Mitglieder zusammenarbeiten, um Probleme zu lösen. Dank ihres datengesteuerten Ansatzes und ihres talentierten und vielfältigen Teams haben sie bei MLOps beachtliche Erfolge erzielt und aus ihren Bedürfnissen und Engpässen gelernt.
Bereitstellung von Modellen für maschinelles Lernen
°Nomad Health investierte stark in Vertex AI, da sich der Großteil der Technologieinfrastruktur auf der Google Cloud Platform (GCP) befand. Da das Unternehmen jedoch mit komplizierteren Geschäftsanforderungen und einer höheren Bereitstellungshäufigkeit konfrontiert war, begann das Unternehmen, den Endpunkt des Produktionsservices aus Vertex AI zu verlagern und im Google Kubernetes Engine (GKE) -Cluster bereitzustellen. Dies ermöglichte dem Team mehr Flexibilität, Kontrolle und Skalierbarkeit in Bezug auf die Bereitstellung und die CI/CD-Pipeline.
Das Machine-Learning-Team von °Nomad Health nutzt Vertex AI für das Modelltraining und nutzt die umfangreichen Bibliotheken, Schnittstellen und Tools von Vertex AI, um Dinge schnell auszuprobieren, Erfolge zu überwachen und vielversprechende Signale zu verstehen. Das Team evaluiert auch ML Flow, verwendet jedoch derzeit keine DataBricks in seinem Stack.
Insgesamt beruhte die Entwicklung der Einsatzstrategie von °Nomad Health auf der Erkenntnis der praktischen Komplexität und dem erfolgreichen Einsatz des angrenzenden Ingenieurteams auf GKE. Diese Strategie ermöglichte es dem Team für maschinelles Lernen, die vorhandenen Verfahren und Infrastrukturen zu nutzen und gleichzeitig die Kontrolle über deren Einsatz zu behalten.
Aufbau einer maßgeschneiderten Feature Store-Lösung
°Nomad Health hat eine maßgeschneiderte Feature-Engineering-Lösung entwickelt, um seinen großen Datensatz zu verarbeiten und einen einheitlicheren Feature-Store aufzubauen. Das Unternehmen erkannte, dass die verschiedenen Machine-Learning-Projekte dieselben Daten gemeinsam nutzen mussten, einschließlich Informationen über die Berufsbilder von Ärzten, Bewerbungsergebnisse sowie Referenzen oder Präferenzen. Sie formalisierten einen Feature-Store und stellten ein Team zusammen, das für die Erfassung der Rohdaten, die grundlegende Transformation und die anschließende Bereitstellung der Daten auf geschäftsorientierte Weise verantwortlich war. Um einen schnellen Übergang zur Visualisierung zu ermöglichen, konnte die BI-Organisation dann die transformierten Daten verwenden. Das Data-Science-Team könnte auch schnell eine Teilmenge von Funktionen extrahieren und im Feature-Store abrufen.
°Nomad Health verwendet die Open-Source-Lösung Feast, um Funktionen für verschiedene Modelle zu extrahieren und zu speichern. Das Feedback aus der Modellierung geht zurück in den Feature Store. Das Unternehmen nutzt die Vertex-KI für die Modellierung und verfügt über eine andere Pipeline für den Einsatz. Eine der innovativsten Lösungen in der gesamten ML-Plattformlandschaft ist die Umwandlung von Rohdaten in eine konsistente Entität, ein konsistentes Ereignis und eine einheitliche Dimension, die das BI-Team und das Data-Science-Team für die Datenanalyse bzw. prädiktive Analyse verwenden könnten. Diese Transformation der Rohdaten hat es °Nomad Health ermöglicht, ein zuverlässiges Signal zu erzeugen, das stark mit der Anwendung und der Darbietung eines Angebots der Einrichtungen korreliert.
Anfänglich haben wir mit der Vertex-KI-Infrastruktur begonnen und sind schließlich zu unserem eigenen Open-Source-implementierten Feature-Store übergegangen, wobei der Zugriff auf unsere proprietären Daten, die einzigartige Form und den Datensatz, eigentlich der Schlüssel ist.
Auswahl von MLOps-Tools
Unternehmen sollten frühzeitig in ein Tool oder eine Plattform investieren, die das meiste von dem bietet, was sie benötigen, wie Vertex AI oder SageMaker, damit sie sich darauf konzentrieren können, ihren Geschäftswert zuerst zu realisieren. Sobald Unternehmen ein robustes Engineering- oder Data-Science-Team aufgebaut haben, können sie die Produktionsbereitstellung aus der Plattform herausnehmen und angrenzende Services hinzufügen. Der Weg, den ein Unternehmen durchläuft, ist wichtiger als die Empfehlung eines vollständigen Satzes von Tools. Es ist immer am besten, etwas auszuwählen, das vorerst einigermaßen gut funktioniert, und von dort aus zu iterieren.
Wenn Sie nur zwei Personen haben, die mit Ihrem Data-Science-Team beginnen und Sie als Erstes Ihre gesamte proprietäre Infrastruktur einrichten. Wofür? Hast du bewiesen, dass dieser schicke Motor und die superstarke Infrastruktur tatsächlich schreien können?
Cloud-Kosten verwalten
- Investieren Sie in Überwachungs- und Warntools: Erwägen Sie den Einsatz von Tools wie TrueFoundry, um die Infrastrukturleistung zu überwachen und Fälle zu identifizieren, die Kostenschwankungen verursachen. Diese Tools können dazu beitragen, Probleme frühzeitig zu erkennen und schnell Abhilfemaßnahmen zu ergreifen.
- Verlassen Sie sich auf manuelle Verfahren: Verwenden Sie manuelle Verfahren wie die Überwachung von Protokollen und Signalen, die in ein Colab-Notebook geleitet werden, um Fälle zu identifizieren, die zu Kostenschwankungen führen. Untersuchen Sie diese Fälle auf wöchentlicher oder zweiwöchentlicher Basis und starten oder beenden Sie bestimmte Trainingsmodelle nach Bedarf erneut.
- Legen Sie ein Budget fest und erhalten Sie Berichte in Echtzeit: Legen Sie ein Budget für die Cloud-Kosten fest und erhalten Sie Echtzeitberichte vom Cloud-Anbieter, um sicherzustellen, dass das Budget nicht überschritten wird. Dies kann dazu beitragen, die Kosten unter Kontrolle zu halten und unerwartete Ausgaben zu vermeiden.
- Implementieren Sie anspruchsvollere Lösungen: Wenn die Infrastruktur wächst, sollten Sie die Implementierung anspruchsvollerer Lösungen in Betracht ziehen, um die Kosten effektiv zu verwalten. Dies kann den Einsatz automatisierter Tools oder die Einstellung von engagiertem Personal zur Verwaltung der Cloud-Kosten beinhalten.
- Finden Sie ein Gleichgewicht zwischen Kosten und Leistung: Es ist wichtig, ein Gleichgewicht zwischen Kosten und Leistung zu finden, um die gewünschten Ergebnisse zu erzielen. Erwägen Sie, die Workloads für maschinelles Lernen zu optimieren, um sicherzustellen, dass sie kostengünstig sind und gleichzeitig die Leistungsanforderungen erfüllen.
Zusätzliche Gedanken von Liming Zhao
MLOps: Bauen gegen Kaufen
- Die Entscheidung zwischen Managed Services und interner Infrastruktur ist für die MLOps-Implementierung von entscheidender Bedeutung. Ein hybrider Ansatz wird empfohlen, wenn das Unternehmen reift.
- Langfristige Ergebnisse und Kostenkompromisse sollten bei der Kosten- und Ressourcenbewertung berücksichtigt werden. Überwachen Sie die Kosten sorgfältig und verlagern Sie leistungsstarke Komponenten in eine firmeneigene Infrastruktur, um stabile Produkte zu gewährleisten.
- Bei weniger zuverlässigen Modellen sollten Sie Kostenschwankungen tolerieren, aber Tags für die Kostenzuweisung verwenden und Preisschwankungen überwachen, um eine effektive Kostenoptimierung zu erzielen.
Bedeutung der Anpassung an sich ändernde Geschäftsanforderungen
Während der Pandemie musste °Nomad Health die wahrscheinlichsten Angebote priorisieren, um den Zustrom von Bewerbungen zu bewältigen. Da die Menschen jedoch immer zögerlicher wurden, sich für eine Stelle zu bewerben, musste die Empfehlungsmaschine angepasst werden, um den Bewerbern mehr Optionen zu zeigen.
Rückblickend betrachtet war der anfängliche Fokus von °Nomad Health auf Geschwindigkeit und Autonomie die richtige Entscheidung für ein kleines Team mit unsicheren Geschäftsanforderungen. Als sich das Team und die Geschäftsanforderungen jedoch weiterentwickelten, musste das Unternehmen seinen Fokus auf Genauigkeit und Effizienz verlagern.
Diese Reise unterstreicht, wie wichtig es ist, sich ändernde Geschäftssituationen bei Entscheidungen über maschinelles Lernen zu berücksichtigen. Indem Unternehmen agil und bereit sind, sich anzupassen, können sie fundierte Entscheidungen treffen, die es ihnen ermöglichen, sich an die sich ändernde Geschäftslandschaft anzupassen.
Wenn Ihnen der folgende Blog gefallen hat, finden Sie hier die vorherigen Blogs der TrueML-Serie
Schaue weiter TrueML YouTube-Serie und lese das ganze TrueML Blog-Serie.
Wahre Gießerei ist ein ML Deployment PaaS über Kubernetes, um die Workflows von Entwicklern zu beschleunigen und ihnen gleichzeitig volle Flexibilität beim Testen und Bereitstellen von Modellen zu bieten und gleichzeitig die volle Sicherheit und Kontrolle für das Infra-Team zu gewährleisten. Über unsere Plattform ermöglichen wir Teams für maschinelles Lernen bereitstellen und überwachen Modelle innerhalb von 15 Minuten mit 100% iger Zuverlässigkeit, Skalierbarkeit und der Möglichkeit, innerhalb von Sekunden rückgängig zu machen. So können sie Kosten sparen und Modelle schneller für die Produktion freigeben, wodurch ein echter Geschäftswert erzielt wird.
TrueFoundry AI Gateway bietet eine Latenz von ~3—4 ms, verarbeitet mehr als 350 RPS auf einer vCPU, skaliert problemlos horizontal und ist produktionsbereit, während LiteLM unter einer hohen Latenz leidet, mit moderaten RPS zu kämpfen hat, keine integrierte Skalierung hat und sich am besten für leichte Workloads oder Prototyp-Workloads eignet.
Der schnellste Weg, deine KI zu entwickeln, zu steuern und zu skalieren













.png)




.png)






.webp)

.webp)



