Daten-Wrangling

Definition - Was bedeutet Data Wrangling?

Data Wrangling ist eine spezielle Art der Datenverwaltung, die sich aus neuen Softwarefunktionen ergibt, die große, unübersichtliche und vielfältige Datenmengen einführen, die für Analyse- und Verwendungszwecke in eine serviceorientierte Architektur (SOA) integriert werden müssen. Das Daten-Wrangling umfasst im Allgemeinen viele verschiedene ausgefeilte Techniken, um unregelmäßige oder unterschiedliche Daten zu verarbeiten und für geschäftliche Anwendungsfälle zu bearbeiten.

Technische.me erklärt Data Wrangling

Es mag wie ein informeller Begriff klingen, aber Daten-Wrangling nimmt tatsächlich einen bestimmten Platz in der Datenverwaltung ein. Ein hilfreicher Weg, um das Daten-Wrangling zu verstehen, besteht darin, es der oft formaleren ETL-Methode (Extract, Transform and Load) gegenüberzustellen. Data Wrangling hat andere Aspekte und Anwendungsfälle als ETL. Dies wird häufig von erfahrenen Datenwissenschaftlern oder anderen Personen in der Nähe der Pipeline durchgeführt. In mancher Hinsicht könnte Data Wrangling als eine Art "Open Source" -ETL bezeichnet werden, da die Ingenieure, die sich mit den Daten befassen, möglicherweise "praktischer" sind oder manuellere Extraktionsmethoden verwenden.

Für diejenigen, die die verfeinerten Prozesse, mit denen verschiedene Daten erfasst, sortiert und in Unternehmensarchitekturen eingespeist werden, wirklich verstehen, ist das Daten-Wrangling tatsächlich ein sehr wichtiges Thema. IT-Experten sehen sich eine Vielzahl von Tools, Ressourcen und Techniken an, um aus unordentlichen, rohen oder unstrukturierten Daten einen Mehrwert zu ziehen.