Data Lake
Der Data Lake ist ursprünglich ein auf Hadoop basierendes Konzept mit dem Ziel, Daten jeder Art zu sammeln und schemafrei zu speichern. Heute werden Data Lakes zunehmend in der Cloud implementiert und nutzen entweder objects stores, wie Amazon S3 oder kombinieren mehrere unterschiedliche Speicherformen in einer Art virtuellem Data Lake. Der Data Lake ist damit ein zentraler Baustein in einer Big-Data-Architektur. Eine Auswertung und Übertragung der Daten in weitere Infrastrukturelemente erfolgt bei Bedarf, z. B. NoSQL DBs.
Data Governance ist auch im Data Lake notwendig, denn sonst wird der Data Lake leicht zum Datensumpf.
Don‘t miss out!
Join over 25,775 data & analytics professionals and get the latest product insights, research, surveys and more!
Weitere Inhalte entdecken
No results found.