Data Lake als Datenmanagement-Methode für Digital Analytics

Data Lake als Datenmanagement-Methode für Digital Analytics 150 150 Lorenz Johnsen

Data Lake als Datenmanagement-Methode für Digital Analytics

Unternehmen sind auf Daten angewiesen, um die Nutzung ihrer Internetaktivitäten auf unterschiedlichen Plattformen und Kanälen erfassen, auswerten und steuern zu können. Im Zentrum dieser Datenerhebung steht meist die Web Analyse. Sie liefert die grundsätzlichen Informationen zur Nutzung der Webseite. Aus analytischer Sicht gibt es in der Regel weitere Datenquellen, wie z. B. das E-Mail-Kampagnenmanagement, ein Content-Management-System oder Social-Media-Kanäle. Oftmals mag es ausreichen jede Datenquelle individuell auszuwerten. Um einen übergreifenden Blick auf die unterschiedlichen Aktivitäten zu gewinnen, bietet es sich an, die Daten zentral zusammenzuführen. Und genau hier setzt die Methode des Data Lake an.

Am Anfang steht Big Data

Um diesen Ansatz genauer zu erklären ist ein kleiner Ausflug in die neuere Geschichte notwendig. Auch wenn schon etwas in die Jahre gekommen, steht am Anfang der Begriff Big Data. Mit der digitalen Transformation werden immer mehr Prozesse online abgebildet, zunehmend „smarte“ Devices werden genutzt und die Messmethoden werden präziser. Das alles führt zu immer umfangreicheren Datenmengen, die gesammelt und ausgewertet werden sollen. Klassische Methoden der Business Intelligence, wie Data Warehouse, sind überfordert. Selbst wenn sie die Menge an Daten verarbeiten können, an der Entwicklungsgeschwindigkeit hapert es. Klassische Datawarehouses weisen aufgrund der Komplexität und der notwendigen Sorgfalt eine extrem langsame Entwicklungsgeschwindigkeit auf. Auf der Auswertungs- und Analyseebene bedeutete das: Unternehmen sitzen auf einem Schatz von Daten sitzen, den sie nicht heben können.

Data Lake – alles aus einer Quelle

Was ist Data Lake? Die Idee eines Data Lake ist schlicht die Möglichkeit, beliebige (Roh-) Daten in einem Datenspeicher zusammenzubringen, unabhängig vom Quellsystem, dem Format oder der Liefersequenz. Die Vorteile sind offensichtlich. Es entsteht die Möglichkeit, den Schatz zu heben. Konkret stehen zwei große Szenarien im Vordergrund. Zum einen entsteht eine Basis für ein übergreifendes Reporting. Für das bestehende Berichtswesen bedeutet es, sich aus einer Quelle, dem Data Lake, bedienen zu können. Wer regelmäßig Daten aus unterschiedlichen Quellen in Excel zusammengebracht hat, weiß wie verheißungsvoll das klingt. Der andere Anwendungsfall ist noch spannender. Welcher Unternehmenslenker (und Analyst) träumt nicht davon, neue Zusammenhänge und Muster in bestehenden Daten entdecken zu können? Stichworte wie Customer Lifecycle, Budget-Optimierungen, Content-Strategie … die Liste ist lang.

Datenanalysten sind immer mehr gefordert

Die technischen Grundlagen dieser Verheißung sind ebenfalls weit entwickelt. Große neue und alte Anbieter und Namen, wie Hadoop, Pentaho oder Amazon Web Services versprechen und liefern immer mehr Dienste mit immer billigerer Hardware und Prozesskosten. Beliebig skalierbar, cloudbasiert etc. Spätestens jetzt drängt sich die Frage nach dem Haken auf.

Die Antwort ist einfach. Auch mit einem Data Lake ändert sich nichts an der Komplexität der Daten und dem eigenen Unternehmen, d. h. die fachlichen, technischen und methodischen Herausforderungen bleiben dieselben. Dazu zwei kurze Beispiele:

  1. die Anforderungen an das Skillset eines Datenanalysten steigen, da nun auch die Datenaufbereitung zu seinen Aufgaben gehört. Hat er vorher auf strukturierten Daten gearbeitet, beginnen Analysen nun mit dem Sichten der Rohdaten.
  2. das schiere Datenvolumen und die damit einhergehenden Möglichkeiten der Analyse machen das Anforderungsmanagement noch wichtiger. Wer stellt die richtigen Fragen und entscheidet, welche davon zuerst beantwortet werden sollen?

neo.eleven, eine Agentur für Digital Analytics Services, bietet anwendungsbereites Expertenwissen im Bereich Data Lake um ihre Herausforderungen zu meistern.

Sprechen Sie uns an!

Ihre Fragen und Anmerkungen sind herzlich willkommen.