Definition von MLOps

MLOps steht für „Machine Learning and Operations“. Es ist wie DevOps, nur für maschinelles Lernen (ML). Es geht darum, den Prozess der Erstellung, Bereitstellung und Wartung von ML-Modellen effizienter zu gestalten. Bei MLOps geht es darum, sicherzustellen, dass ML-Projekte von Anfang bis Ende reibungslos ablaufen.

Beispiele für MLOps

  • Versionierung von Daten und Modellen. Ein Team arbeitet an einer Empfehlungsmaschine für eine Website. Sie speichern Versionen von Datensätzen und Modellen. Es geht darum zu verstehen, welche Änderungen zu Leistungssteigerungen oder -einbußen geführt haben. Bei Bedarf können sie mit einem Tool wie DVC einen früheren Zustand wiederherstellen.
  • Kontinuierliche Integration/Kontinuierliche Bereitstellung (CI/CD). Ein E-Commerce-Unternehmen verfügt über ein Preismodell, das täglich mit neuen Daten aktualisiert wird. Sobald neue Daten eintreffen, wird das Modell neu trainiert. Wenn es die Leistungsprüfungen besteht, wird es in der Produktion bereitgestellt.
  • Modellüberwachung. Ein Bonitätsbewertungsmodell in einer Bank überwacht Prognosen in Echtzeit. Wenn die Genauigkeit des Modells nachlässt oder sich die Daten plötzlich verändern (Datenverschiebung), benachrichtigt das Modell das Team.
  • Skalierbarkeit. Ein Start-up bietet Bilderkennung als Dienstleistung an. Es nutzt Kubernetes, um seine ML-Modelle bereitzustellen. Wenn die Nutzerzahl wächst, skaliert Kubernetes die Anzahl der Modellserver, um die erhöhte Last zu bewältigen.
  • Experiment-Tracking. Forscher eines Pharmaunternehmens arbeiten daran, molekulare Eigenschaften vorherzusagen. Sie führen Experimente mit verschiedenen Modellen und Hyperparametern durch. Mithilfe eines Tools wie MLflow behalten sie den Überblick über alle ihre Experimente und können die Ergebnisse vergleichen.
  • Automatisierte Tests. Ein Team integriert ein Chatbot-Modell in eine Kundensupport-Seite. Sie nutzen automatisierte Tests, um Nutzeranfragen zu simulieren und die Antworten des Chatbots zu überprüfen. Wenn es die Genauigkeitsschwelle nicht erreicht, wird es nicht bereitgestellt.
  • Zusammenarbeit. Ein Unternehmen hat weltweit mehrere Teams, die an verschiedenen ML-Projekten arbeiten. Sie nutzen Plattformen wie Kubeflow, die einen gemeinsamen Arbeitsbereich bieten. Teams können gemeinsam an der Entwicklung, dem Training und der Bereitstellung von Modellen arbeiten.
  • Sicherheit und Governance. Ein Health-Tech-Unternehmen, das mit Patientendaten arbeitet. Das Unternehmen stellt sicher, dass seine ML-Pipelines den Vorschriften für Gesundheitsdaten entsprechen. Sie verfügen über automatisierte Prüfungen, um sicherzustellen, dass keine personenbezogenen Daten offengelegt werden und dass Modellentscheidungen nachverfolgt werden können.