BY_MARC GIOMBETTI

Wie Sie Ihr Data-Science-Projekt erfolgreich in ein KI-Produkt transformieren (1/2)

data-science-project-resized.jpg

Digitalisierung

Data Science

Data Analytics

Data Analytics

Teil 1: Verschiedene Arten von Data-Science-Projekten

In diesem Artikel teile ich meine Erfahrungen darüber, wie man ein Data-Science-Projekt erfolgreich in ein Produkt umwandelt. Oftmals bleiben vielversprechende Projekte im Proof-of-Concept (PoC) oder Prototypenstadium stecken, weil es zu aufwendig wäre, sie global einzuführen. Dabei müssten möglicherweise große Teile der Arbeit neu gemacht werden, die Programmiersprache oder die Frameworks des Modells ändern sich, oder möglicherweise ist sogar eine komplette Neuentwickung nötig. Auch die Qualität des Data-Science-Modells, gemessen an Precision und Recall, kann sich deutlich von den Ergebnissen in der Prototypenphase unterscheiden. Der erste Teil dieses Artikels beschäftigt sich mit verschiedenen Arten von Data-Science-Projekten. Im zweiten Teil gebe ich einige Richtlinien, wie man einen PoC in ein echtes KI-Produkt umwandeln kann.

data-science-project-resized.jpg

Zunächst einmal sollten wir uns genauer ansehen, welche Arten von Data-Science-Projekten überhaupt geeignet sind, um in produktive Lösungen - oder sogar Produkte - umgewandelt zu werden. Es ist nicht immer sinnvoll, produktionsreife Lösungen anzustreben. Meiner Erfahrung nach haben Data-Science-Projekte in der Regel eine dieser beiden Ausprägungen:

 

  1. Die One-Off Analyse: Bei diesem Projekttyp geht es darum, eine spezifische geschäftliche Frage zu beantworten, um eine einmalige Entscheidung zu treffen. Ein Beispiel dafür ist ein Versicherungsunternehmen, das anlässlich seines 100. Geburtstags eine Sonderdividende ausschütten möchte. Um zu entscheiden, wie hoch die Dividende sein kann, ohne das S&P- oder Moody's-Rating zu beeinflussen, muss das Unternehmen Faktoren wie seine Kapitalbasis, den Vertragsbestand und offene Forderungen berücksichtigen. Für eine solche einmalige Analyse können strukturierte Methoden und Natural Language Processing (NLP) Technologie eingesetzt werden. Dabei werden alle Textdokumente durchsucht. Es ist nicht erforderlich, eine separate Software oder Anwendung zu entwickeln, um diesen Prozess zu wiederholen. Es handelt sich um eine einmalige Fragestellung, die beantwortet werden soll. Es wäre nicht sinnvoll, die Situation durch die Entwicklung eines Produkts zu verkomplizieren.

  2. Die wiederkehrende Analyse, auch regelmäßiges Reporting genannt: Die häufigere Art der Analyse ist die wiederkehrende Analyse, bei der eine bestimmte Frage regelmäßig beantwortet werden muss. Die Antwort ist möglicherweise nicht trivial und erfordert komplexe maschinelle Lernmodelle, um zukünftige Ergebnisse vorherzusagen. Zum Beispiel möchte ein Unternehmen Kunden kontaktieren, die wahrscheinlich abwandern, um ihnen ein besseres Angebot zu machen und sie zu binden. Spezielle Dashboards werden für die regionalen Manager eingerichtet. Sie erhalten einen Überblick über ihren Verkaufsbereich und die Kunden, die sie wahrscheinlich verlieren werden, wenn keine Maßnahmen ergriffen werden. Bei dieser Art von Analyse ist es von größter Bedeutung, dass die Daten kontinuierlich fließen, Dashboards eingerichtet sind und Berichte an die richtigen Personen gesendet werden, um zeitnahe Entscheidungen zu treffen.

  3. Das KI-Produkt oder die KI-Lösung: Das KI-Produkt geht weit über einen Algorithmus, eine einmalige Analyse oder regelmäßige Reportings hinaus. Hier werden KI-Modelle in Prozesse eingebettet, um automatische Entscheidungsfindung zu ermöglichen. Dies geschieht, um das Risiko zu verringern, die Verarbeitungseffizienz zu verbessern, die gesamte Verarbeitungszeit zu verkürzen oder einfach mit beachtlichen Datenmenge umzugehen, die in das System fließen. Wichtig ist hier auch der Mechanismus zur Erfassung von Feedback-Daten, zur Anzeige von Modellergebnissen für Administratoren und zur kontinuierlichen Wartung und Verbesserung der Vorhersagequalität. Ein Beispiel dafür könnte ein System sein, das Anspruchsteller, Schadensdetails, Schadensdatum extrahiert und die Dringlichkeit des Anspruchs bewertet. Die Backend-Module dieses Systems ermöglichen es, Ergebnisse zu überschreiben, einzugreifen, wenn die Extraktionsqualität unter einen bestimmten Schwellenwert fällt, und Leistungsmetriken-Dashboards für den Betreiber anzuzeigen. Es zielt darauf ab, das Problem ganzheitlich anzugehen, um Durchsatz und Qualität zu optimieren und gleichzeitig die Möglichkeit für Menschen zu bieten, das System bei Bedarf zu übersteuern.

 

Die drei Arten von Data-Science-Projekten können einem Unternehmen enorme Vorteile bringen. Doch was ist wichtig, damit aus der Analyse ein Produkt wird? Welche Schritte und Überlegungen sind erforderlich, und wie kann dies den Entscheidungsträgern erklärt werden?

Im nächsten Teil dieses Artikels gehe ich auf diese Fragen ein und zeige Ihnen, wie Sie ein datenwissenschaftliches Projekt erfolgreich in ein KI-Produkt umwandeln können.