Data Lake
Der Data Lake ist ursprünglich ein auf Hadoop basierendes Konzept mit dem Ziel, Daten jeder Art zu sammeln und schemafrei zu speichern. Heute werden Data Lakes zunehmend in der Cloud implementiert und nutzen entweder objects stores, wie Amazon S3 oder kombinieren mehrere unterschiedliche Speicherformen in einer Art virtuellem Data Lake. Der Data Lake ist damit ein zentraler Baustein in einer Big-Data-Architektur. Eine Auswertung und Übertragung der Daten in weitere Infrastrukturelemente erfolgt bei Bedarf, z. B. NoSQL DBs.
Data Governance ist auch im Data Lake notwendig, denn sonst wird der Data Lake leicht zum Datensumpf.
Gefällt Ihnen dieser Beitrag?
Wir haben noch viel mehr davon! Schließen Sie sich über 25.775 Data & Analytics Professionals an, um der Konkurrenz einen Schritt voraus zu bleiben.