Daten See

Definition - Was bedeutet Data Lake?

Ein Datensee ist ein riesiges, leicht zugängliches, zentrales Repository mit großen Mengen strukturierter und unstrukturierter Daten.

Technische.me erklärt Data Lake

Die Data Lake-Architektur ist ein Store-Everything-Ansatz für Big Data. Daten werden nicht klassifiziert, wenn sie im Repository gespeichert werden, da der Wert der Daten zu Beginn nicht klar ist. Dadurch entfällt die Datenaufbereitung. Ein Data Lake ist daher im Vergleich zu einem herkömmlichen Data Warehouse weniger strukturiert. Wenn auf die Daten zugegriffen wird, werden sie nur dann klassifiziert, organisiert oder analysiert.

Hadoop, ein Open-Source-Framework zur Verarbeitung und Analyse von Big Data, kann zum Durchsuchen der Daten im Repository verwendet werden.