Mehrwert Daten: Warum es sich lohnt den Datenberg zu bezwingen
Datensammlung und -aufbereitung im Unternehmen
Viele Unternehmen stehen vor der Herausforderung, ihre Daten so aufzubereiten, dass sie für Künstliche Intelligenz, Machine Learning oder mathematische Methoden wie Operations Research nutzbar sind. Doch bevor diese Technologien ihre Stärke ausspielen können, müssen die benötigten Daten in hoher Qualität vorliegen – ein komplexes Thema, das in der Praxis oft eine große Hürde darstellt.
Ein anschauliches Bild, das wir dafür gerne verwenden, ist das des Datenbergs: Die Daten eines Unternehmens gleichen einem riesigen Berg, der bestiegen werden muss. Je nach Ausgangssituation bedeutet das manchmal, nur einen Teil des Berges zu erklimmen, um schnell einen Mehrwert zu erzielen. In anderen Fällen braucht es ein „Zwischenlager“ – einen Etappenschritt, um die Daten schrittweise aufzubereiten und nutzbar zu machen.
Eines ist dabei jedoch klar: Nur mit gut vorbereiteten und validierten Daten lassen sich bei der Nutzung von KI, ML oder – wie in unserem Fall – mathematischen Optimierungsmethoden optimale Analyseergebnisse erzielen. Wie wir Unternehmen auf diesem Weg unterstützen und den Aufstieg erleichtern können, erläutern wir in diesem Beitrag.
Daten sind das neue Gold – das Potenzial von Daten erkennen
Daten werden gerne als das neue Gold oder Öl bezeichnet. Als stets präsentes Thema auch in den Medien, ist ihr Potenzial hinlänglich bekannt. So werden sie oftmals auch das strategische Kapital von Unternehmen genannt. Der Umgang mit den eigenen Daten hat somit einen großen Einfluss auf das wirtschaftliche Handeln und auch auf die Wettbewerbsfähigkeit.
Warum aber scheuen sich so viele Unternehmen vor der Aufgabe der Datensammlung und -aufbereitung, wenn der Mehrwert bekannt ist?
Ineffizienzen und Probleme zwingen zum Handeln
Solange das Geschäft „rund“ läuft, also keine Ineffizienzen oder Produktions- und Absatzprobleme vorhanden sind, sehen viele Unternehmen nicht die Notwendigkeit, sich mit dem Thema „Daten und Datenaufbereitung“ zu beschäftigen. Denn natürlich ist eine gut strukturierte Datensammlung und -aufbereitung mit Investitionen verbunden – sowohl in Hinblick auf Zeit als auch monetär.
Spätestens aber, wenn Entscheidungen getroffen werden müssen, die die Wirtschaftlichkeit eines Unternehmens stark beeinflussen, werden Daten und ihre Aufbereitung zu einem wichtigen Thema für jedes Unternehmen.
Ohne Datenaufbereitung keine validen Ergebnisse und Entscheidungen
Bei der Datenaufbereitung und -vorbereitung geht es darum, die Daten für Analysezwecke verwenden zu können. Hierzu gehören die prädiktive und präskriptive Analyse als Form der Advanced Analytics, aber auch der Einsatz maschinellen Lernens (ML), künstlicher Intelligenz (KI) und Operations Research (OR). Diesen Methoden ist gemeinsam, dass in der Regel die Auf- und Vorbereitung großer Datenmengen erforderlich ist.
Der Zweck der Datenaufbereitung besteht also darin, dass die Daten, die verwendet werden, genau und konsistent sind. Nur so ist sichergestellt, dass die Analyse valide Ergebnisse liefert und verwertbare Erkenntnisse und Informationen für die Entscheidungsfindung gewonnen werden können. Somit ist eine exzellente Datenqualität für operationalisierte Entscheidungen – also der Form der Entscheidungsunterstützung mithilfe von Analyseverfahren – von höchster Relevanz.
Datenqualität als entscheidender Faktor
Gründe für eine schlechte Qualität der Daten gibt es viele. Angefangen mit dem Fehlen von Daten. Manchmal fehlen „nur“ einzelne Datensätze, aber häufig wurden die Daten einfach nicht gesammelt, weil sie bisher nicht relevant erschienen. Daten können aber auch unkorrekt, unvollständig oder defekt sein. Oder sie liegen in unterschiedlichen Formaten vor – oftmals in einfachen Tabellen in Excel-Dateien, manchmal nur als Bildformat. Angesichts der vielen Widrigkeiten scheinen das Zusammentragen und Aufbereiten von Daten eher eine Aufgabe für Sisyphos. Um sich nicht entmutigen zu lassen und ein entsprechendes Mindset zu entwickeln, wird ein Ziel benötigt. Und das sollte nicht gleich der Berggipfel sein.
Den Aufstieg wagen und ein Trainingslager aufschlagen
Wie auch der Mount Everest nicht an einem einzigen Tag bestiegen werden kann, sollte man auch den Datenberg in Etappen angehen und mit einer geringen Datenmenge „trainieren“. Hierzu sollte man sich die Frage stellen „Mit welchen Daten ist relativ leicht ein Mehrwert zu generieren?“. Eine gut zu erreichende Alm mit einer guten Aussicht kann hierbei ein geeignetes Zwischenziel sein, um ein Trainingslager aufzuschlagen. In unserem Fall sprechen wir statt von einer Alm von einem erfolgsversprechenden Use-Case und für diese erste Etappe stellen sich folgende Fragen:
- Wie kann der Use-Case auf die Daten angewendet werden, so dass ein Mehrwert generiert wird?
- Welche Daten liegen bereits vor?
- Welche Daten werden eventuell noch benötigt, um gute Ergebnisse zu erzielen?
- Woher kommen die fehlenden Daten?
Mithilfe dieses ersten erfolgreichen Use-Cases lernt man, was für Möglichkeiten Daten schaffen und welche Potenziale sie beinhalten. So können mit relativ geringem Aufwand bereits große Einsichten erlangt werden.
Von Trainingsdaten zu großen Datenmengen
Das Training mit einer kleinen überschaubaren Datenmenge ist geschafft und ein erfolgreich durchgeführter Use-Case hat den Mehrwert der Datenaufbereitung gut verdeutlicht. Erste Quick Wins konnten also erzielt werden. Wie geht es weiter mit dem Thema Datenaufbereitung?
Der Prozess der Datenaufbereitung besteht aus verschiedensten mehr oder weniger aufwendigen Schritten und Ziel ist die Automatisierung, um den Aufwand für das Datenmanagement zu reduzieren und Analysetools einfach einsetzen zu können.
- Bei der Datenbereinigung werden Datenfehler, Inkonsistenzen und Anomalien korrigiert, um vollständige und richtige Datensätze zu erhalten.
- Im Schritt der Datentransformation- und anreicherung werden die Daten angepasst, um den Analyseanforderungen zu entsprechen. Beispielsweise müssen die Daten, die in verschiedensten Datenformaten gespeichert sind, in ein einheitliches und für die Analyse anwendbares Format umgewandelt werden. Bei der Datenanreicherung werden Datensätze je nach Bedarf durch Erweitern und Hinzufügen von Daten weiter verbessert.
- Bei der Datenvalidierung werden automatisierte Routinen mit den Daten durchgeführt, die sie auf Konsistenz, Vollständigkeit und Genauigkeit prüfen.
Vorteile der (automatisierten) Datenaufbereitung
Ein effektiver Prozess für die Datenaufbereitung bietet, neben der Verfügbarkeit der nötigen Daten, also viele Vorteile, unter anderem:
- Fundierte Entscheidungsfindung mithilfe der Daten
- Sicherstellung, dass die Ergebnisse von Analysemethoden valide Ergebnisse liefern
- Beheben von Datenproblemen und -fehlern
Eine automatisierte Datenaufbereitung kann zudem schnell erfolgen und reduziert so Kosten und Zeit für das Datenmanagement, so dass der Schwerpunkt auf die Datenanalyse gelegt werden kann.
Weitere interessante Inhalte
Das Potenzial von Daten nutzen – mit OPTANO
Aus der Sicht von Operations Research Expert*innen ist die Datenaufbereitung essenziell. Ohne konsistente und genaue Daten kann das Optimierungsmodell keine validen Ergebnisse liefern, die jedoch wesentlich für die Entscheidungsfindung sind. Deshalb unterstützen wir Sie bei der Datenaufbereitung. Wie wir dabei vorgehen, erfahren Sie hier.
OPTANO – mit unserem Team definieren Sie Ihre Ziele
OPTANO Projekte starten in der Regel mit einem Workshop, in dem bereits über konkrete Fallbeispiele und auch über die Daten gesprochen wird. Hierbei wird unter anderem eine Hochrechnung erstellt, was die automatische Datenverarbeitung, -bereinigung und -aggregation Ihrem Unternehmen bringt. So wird das Datenpotenzial greifbar.
Während wir über die Pain Points Ihres Unternehmens sprechen, beschäftigen wir uns auch immer mit dem Thema Daten: Welche Daten werden benötigt, um Ineffizienzen zu beseitigen? Welche Daten sind vorhanden? Woher kommen weitere Daten, die benötigt werden?
Unsere Projektleiter*innen, die bereits viele Erfahrungen in unterschiedlichsten Branchen sammeln konnten, helfen Ihnen dabei, die relevanten Daten zu identifizieren. Liegen diese nicht in verarbeitbarer Form vor, bereiten wir sie auf. Auch hier profitieren unsere Kund*innen von der Erfahrung des OPTANO Teams.
Aus Daten Informationen und Erkenntnisse gewinnen
Als Optimierungssoftware ermöglicht OPTANO die Analyse und Darstellung von Daten als Modell. In manchen Fällen erstellen wir zunächst einen schnellen Prototyp in Form eines MVPs (Minimum Viable Product). So können Sie bereits zu diesem frühen Zeitpunkt sehen, wie Ihre Optimierung aussehen wird. Hierzu genügt uns ein Daten Dump. Natürlich erfolgt eine Validierung, um sicherzustellen, dass die Ergebnisse korrekt dargestellt werden.
Mit dem Einsatz mathematischer Optimierungsmethoden kann eine Vielzahl unterschiedlicher Ziele berücksichtigt und ebenso Zielkonflikte gelöst werden. Unsere leistungsfähigen Algorithmen berechnen aus Abermillionen von Möglichkeiten stets das bestmögliche Ergebnis – wenn die Daten stimmen. Nur so können Sie sicher sein, die beste Entscheidung zu treffen.
Berg Heil
Die Besteigung des Datenberges hat für die Entscheidungsfindung Ihres Unternehmens zweifellos einen hohen Mehrwert. Aber auch kleinere Etappen bedeuten immer einen Gewinn. Und mit ein bisschen Unterstützung von Expert*innen erreichen Sie auch den Berggipfel. In diesem Sinne: Berg Heil!