DSML liefert in Unternehmen heute einen ungleichen Wert

Data Scientist-Teams im Finanzdienstleistungssektor, im Gesundheitswesen und in der Fertigung berichten VentureBeat, dass die DSML-Strategien ihrer Unternehmen am effektivsten sind, wenn sie ungleiche Anfangsergebnisse je nach Geschäftseinheit vorhersehen und einplanen. Die Teams sagen auch, dass sich die Produktion von Modellen in großem Maßstab mit MLOps grundlegend von der Produktion interner Mainstream-Anwendungen mit DevOps unterscheidet. Sie fügen hinzu, dass die MLOps-Lernkurve umso steiler ist, je komplexer das Betriebsmodell eines Geschäftsbereichs ist. Der Beitrag von DSML für die Geschäftsbereiche hängt von der Verfügbarkeit zuverlässiger Daten und der Klarheit der Problemstellung ab. 

O'Reilly stellte fest, dass "KI in Unternehmen erst dann ausgereift ist, wenn Entwicklungs- und Betriebsgruppen Praktiken wie die kontinuierliche Bereitstellung anwenden können, bis die Ergebnisse wiederholbar sind (zumindest in einem statistischen Sinne) und bis Ethik, Sicherheit und Datenschutz nicht mehr nur zweitrangige Anliegen sind. 

Kaggle gab an, dass 80,3% der Befragten lineare oder logistische Regressionsalgorithmen verwenden, gefolgt von Entscheidungsbäumen und Zufallswäldern (74,1%) und Gradient-Boosting-Maschinen (59,5%). Die Unternehmen kratzen gerade erst an der Oberfläche des DSML-Potenzials, wobei die Akzeptanz durch mehrere Faktoren gebremst wird, die sich bis 2022 verbessern müssen. 

Wie und wo sich DSML im Jahr 2022 verbessern wird

Wenn die grundlegenden Elemente einer DSML-Plattform stimmen, werden die Genauigkeit, Geschwindigkeit und Qualität der Entscheidungsfindung beschleunigt. Wie der jüngste Magic Quadrant von Gartner zeigt, machen die Anbieter von DSML-Plattformen Fortschritte bei der Bereitstellung flexiblerer, skalierbarer Infrastrukturen, deren Governance darauf ausgelegt ist, die Anforderungen mehrerer Personas in großem Umfang zu unterstützen und gleichzeitig erweiterbar zu sein. Unternehmen, die McKinsey als "High Performer" einstuft, nutzen die Cloud-Infrastruktur viel stärker als ihre Mitbewerber: 64% ihrer KI-Arbeitslasten laufen in einer öffentlichen oder hybriden Cloud, verglichen mit 44% ihrer Mitbewerber. Darüber hinaus stellt McKinsey fest, dass diese Gruppe auf eine öffentliche Cloud-Infrastruktur zurückgreift, um auf eine breitere Palette von KI-Funktionen und -Techniken zuzugreifen. 

DSML-Strategien werden im Jahr 2022 eine zunehmende Akzeptanz in Unternehmen erfahren. In den folgenden Bereichen können Unternehmen und Plattformanbieter zusammenarbeiten, um die Ergebnisse zu verbessern, indem sie diese Bereiche in ihre Roadmaps für 2022 aufnehmen:  

Adaptive ML hat das Potenzial, die Cybersicherheit, die Sicherheit an entfernten Standorten, das Qualitätsmanagement in der Fertigung und die Feinabstimmung von Industrierobotersystemen zu verbessern.

Es ist zu erwarten, dass adaptive ML in einem Spektrum von Anwendungsfällen, die dadurch definiert sind, wie schnell sich ihre kontextbezogenen Daten, Bedingungen und Handlungen ändern, verstärkt eingesetzt wird. Beispielsweise ist die Kombination von Cyberrisiken und Risikobewertungen für entfernte Standorte in einem adaptiven ML-Modell ein Anwendungsfall, den Versorgungsunternehmen heute in der Produktion einsetzen. Die größten Vorteile von Adaptive ML könnten sich in der Fertigung ergeben, wo durch die Kombination von Telemetriedaten aus visuellen IoT-Sensoren mit adaptiven ML-basierten Anwendungen fehlerhafte Produkte sofort erkannt und von der Produktionslinie genommen werden können. Indem man den Kunden die Mühe erspart, defekte Produkte zurückzugeben, kann man die Kundenbindung erhöhen und gleichzeitig die Kosten senken. Angesichts des chronischen Arbeitskräftemangels, mit dem die Hersteller konfrontiert sind, kann die Kombination von adaptiven ML-Techniken mit der Robotik dazu beitragen, dass die Hersteller die Anforderungen der Kunden an die Produkte weiterhin konsequent erfüllen. Adaptive ML ist auch die Grundlage für autonome, selbstfahrende Fahrzeugsysteme und kollaborative, intelligente Roboter, die durch Iteration schnell lernen, einfache Aufgaben gemeinsam zu erledigen. Zu den Anbietern von DSML-Plattformen, die für ihr Know-how bekannt sind, gehören Cogitai, Google, IBM, Microsoft und andere.

Die Unterstützung kollaborativer Arbeitsabläufe in DSML-Plattformen wird zu einer Grundvoraussetzung für den Wettbewerb auf dem Markt.

Datenwissenschaftler berichten VentureBeat, dass Umgehungslösungen für DSML-Plattformen, die nicht auf flexible und an ihre Bedürfnisse angepasste Arbeitsabläufe ausgelegt sind, Wochen an Modellentwicklungszeit kosten können. Collaboration-Tools und -Workflows müssen über einfache Frage-und-Antwort-Foren hinausgehen und effektivere modalübergreifende Daten- und Code-Repositories bereitstellen, die jeder Mitarbeiter im gesamten Unternehmen sicher nutzen kann. Auch die Visualisierung von Daten und Modellen sowie die Möglichkeit, Modelle zu exportieren, müssen unterstützt werden. Zu den unabdingbaren Voraussetzungen für eine Zusammenarbeit, die den Anforderungen von Datenwissenschaftlern gerecht wird, gehören die Kommunikation und die gemeinsame Nutzung von Code in jedem Schritt des Modellierungsprozesses, die Datenabfolge und Modellverfolgung sowie die Versionskontrolle und die Analyse der Modellabfolge. Zu den DSML-Plattformanbietern, die Unterstützung für kollaborative Arbeitsabläufe bieten, gehören Domino, Google, Microsoft, SAS, TIBCO, RapidMiner und andere. 

MLOps wird ein bahnbrechendes Jahr erleben, da Unternehmen mehr Erfahrung mit der schnelleren Skalierung von Modellen für die Bereitstellung sammeln und gleichzeitig die Geschäftsergebnisse für bessere Ergebnisse verfolgen.

Die Verkürzung der Zykluszeiten für die Erstellung und Einführung neuer Modelle ist eine der wichtigsten Messgrößen für die Bewertung von DSML-Projekten in Unternehmen. Jeder DSML-Plattformanbieter bietet seine Version der MLOps-Unterstützung an. Unternehmen, die eine DSML-Strategie in Erwägung ziehen, müssen prüfen, wie die einzelnen Plattformen die Modellerstellung, -verwaltung, -wartung, Modell- und Codewiederverwendung, Updates und Governance handhaben. Es ist zu erwarten, dass jeder DSML-Plattformanbieter die Modifizierung von MLOps weiter verfeinern wird, um bis 2022 eine größere Modellskalierbarkeit und Sicherheit zu gewährleisten.

Die Anbieter von DSML-Plattformen werden sich auf MLOps-Unterscheidungsmerkmale verlassen, einschließlich Modelltaxonomien, Versionskontrolle, Modellwartung, Überwachung sowie Code- und Modellwiederverwendung. Die besten DSML-Plattformen stellen auch sicher, dass ihre MLOps-Workflows die Möglichkeit bieten, die Geschäftsergebnisse mit Hilfe von Metriken und Leistungsindikatoren (KPIs) zu messen, die für Finanzentscheider und Geschäftsbereichsverantwortliche relevant sind. 

Datenschutzbedenken zwingen jedes Unternehmen, das mit Sensoren verbundene Produkte und die sie unterstützenden Dienste entwickelt, synthetische Daten zum Erstellen, Testen und Verfeinern von Modellen zu verwenden.

Die aktuelle und die nächste Generation von vernetzten Geräten mit eingebetteten Sensoren zur Erfassung biometrischer Daten gehören zu den größten Herausforderungen bei der Erstellung von Modellen für maschinelles Lernen. Startups, die KI-basierte Systeme für die Arbeitssicherheit entwickeln, müssen synthetische Daten erstellen und verfeinern, damit sie zum Beispiel vorhersagen können, wann, wo und wie Unfälle passieren können. Das Wall Street Journal bietet einen faszinierenden Einblick in die Effektivität synthetischer Daten und ihre zunehmende Verbreitung bei der Entwicklung von KI- und ML-Modellen. Der Artikel erklärt, wie American Express seine Betrugsprognosemodelle mithilfe von generativen adversarischen Netzwerken verbessert, einer viel genutzten Technik zur Erstellung synthetischer Daten mit zufälligen Betrugsmustern. Auch Unternehmen, die autonome Fahrzeuge herstellen, setzen auf synthetische Daten, um ihre Modelle zu trainieren. Dazu gehören Aurora, Cruise und Waymo, die alle synthetische Daten verwenden, um die Wahrnehmungssysteme zu trainieren, die ihre Fahrzeuge steuern.

Die Anbieter von DSML-Plattformen müssen den gesamten ML-Workflow skalieren und automatisieren.

Die Anbieter verfügen über mehrere Generationen von Modellentwicklungstools, und ihre Erfahrung zeigt sich in der Reife der Workflows, die sie unterstützen können. Das Ziel für 2022 ist die Verbesserung der Modellbereitstellung und -verwaltung sowie die Integration von Zero Trust in MLOps-Workflows bei gleichzeitiger Beibehaltung der Flexibilität zur Anpassung der Workflows. AutoML wird verstärkt eingesetzt werden, da Unternehmen ihre ML-Workflows beschleunigen wollen und Datenwissenschaftler, die mit diesen Techniken vertraut sind, sehr gefragt sind. Die Automatisierung von ML-Workflows wird die Wiederverwendbarkeit von ML-Codekomponenten verbessern, die Zykluszeiten für Modelltests und -validierung verkürzen und die Produktivität von Data-Science-Teams erhöhen. 

Transfer Learning wird in Unternehmen mit DSML-Strategien, die bereits heute in großem Umfang und in der Produktion eingesetzt werden, schnell Einzug halten.

Der Kern des Transfer-Learnings ist die Wiederverwendung bereits trainierter Machine-Learning-Modelle, um einen Vorsprung bei der Entwicklung neuer Modelle zu erhalten. Dies ist besonders nützlich für Data-Science-Teams, die mit überwachten maschinellen Lernalgorithmen arbeiten, die für genaue Analysen markierte Datensätze benötigen. Anstatt mit einem neuen überwachten maschinellen Lernmodell zu beginnen, können Datenwissenschaftler mithilfe von Transfer Leveling Modelle schnell für ein bestimmtes Geschäftsziel anpassen. Darüber hinaus werden Transfer-Learning-Module in prozessorientierten Branchen, die auf Computer Vision angewiesen sind, immer relevanter, da sie die Skalierung von gelabelten Daten ermöglichen. Zu den führenden DSML-Plattformanbietern, die Transfer Learning anbieten, gehören Alteryx, Google, IBM, SAS, TIBCO und andere. 

Unternehmen müssen sich zunächst auf Anwendungsfälle und Messgrößen konzentrieren und erkennen, dass eine außergewöhnliche Modellgenauigkeit möglicherweise keinen Geschäftswert liefert.

Eine der häufigsten Herausforderungen bei der Erstellung von überwachten maschinellen Lernmodellen, insbesondere wenn eine Fülle von Telemetriedaten von Sensoren und Endpunkten vorliegt, ist die Tendenz, Modelle immer weiter zu optimieren, um einen weiteren Genauigkeitsgrad zu erreichen. Telemetriedaten aus Fertigungshallen können sporadisch sein und variieren je nach Zykluszahl, Frequenz und Geschwindigkeit einer bestimmten Maschine, neben vielen anderen Faktoren. Es ist leicht, sich darauf zu konzentrieren, was die Echtzeit-Telemetriedaten aus dem Fertigungsbereich über die Maschinen aussagen. Das primäre Ziel muss jedoch sein, herauszufinden, was die Daten über die Produktivität im Fertigungsbereich und ihre Auswirkungen auf die Gewinnspanne aussagen. 

DSML-Strategien müssen auf Geschäftsergebnissen beruhen

Unternehmen, die DSML-Strategien verfolgen, müssen bis 2022 einen klaren Fahrplan aufstellen, was sie aus geschäftlicher Sicht erreichen wollen, und sich dabei auf messbare Kundenergebnisse stützen. Das Tempo und die Vielfalt der Innovationen, die die Anbieter von DSML-Plattformen in den nächsten zwölf Monaten ankündigen wollen, werden sich um fünf Schlüsselbereiche drehen. Dazu gehören die Demokratisierung der Erstellung von ML-Modellen und die Bereitstellung der Modellerstellung und -feinabstimmung für mehr Fachleute. Zweitens wird die Multi-Persona-Unterstützung von DSML-Plattformen in den nächsten zwölf Monaten verbessert, was die Akzeptanz weiter erhöht. Drittens wird die End-to-End-Automatisierung von ML-Workflows dazu beitragen, die MLOps-Zyklen im Jahr 2022 zu beschleunigen, was den vierten Faktor eines verbesserten, an die Modellleistung gekoppelten Line-of-Business-Reportings fördert. Fünftens wünschen sich Unternehmen eine viel schnellere Amortisation ihrer DSML-Investitionen, und die Anbieter von DSML-Plattformen müssen ihren Wert mit größerer Präzision und Echtzeiteinblicken quantifizieren, um Kunden zu halten und neue zu gewinnen. 

Die Original-Version in Englisch erschien am 10. Januar 2022 auf VentureBeat.com

Mit freundlicher Genehmigung des Autors durften wir den Beitrag in diesem Blog veröffentlichen.

Kommentar schreiben

* Diese Felder sind erforderlich

Kommentare

Keine Kommentare