Data Mining

Definition - Was bedeutet Data Mining?

Beim Data Mining werden verborgene Datenmuster aus verschiedenen Perspektiven analysiert, um diese Daten in nützliche und häufig umsetzbare Informationen umzuwandeln. Daten werden in öffentlichen Bereichen wie Data Warehouses gesammelt und zusammengestellt, und Data Mining-Algorithmen suchen nach Mustern, mit denen Unternehmen bessere Entscheidungen treffen können, z. B. Entscheidungen, die helfen, Kosten zu senken, den Umsatz zu steigern oder Kunden oder Kunden besser zu bedienen.

Data Mining wird auch als Datenerkennung oder Wissenserkennung bezeichnet. In Business Intelligence ist es wichtig, datengesteuerte Entscheidungen zu treffen.

Technische.me erklärt Data Mining

Die wichtigsten Schritte eines Data Mining-Prozesses sind:

  • Extrahieren, transformieren und laden Sie Daten in ein Data Warehouse
  • Speichern und Verwalten von Daten in mehrdimensionalen Datenbanken
  • Bereitstellung des Datenzugriffs für Geschäftsanalysten mithilfe von Anwendungssoftware
  • Präsentieren Sie analysierte Daten in leicht verständlichen Formen, wie z. B. Grafiken

Der erste Schritt beim Data Mining ist das Sammeln relevanter Daten, die für das Geschäft von entscheidender Bedeutung sind. Unternehmensdaten sind entweder Transaktionsdaten, nicht betriebliche Daten oder Metadaten. Transaktionsdaten befassen sich mit alltäglichen Vorgängen wie Umsatz, Inventar und Kosten. Nicht betriebsbereite Daten werden normalerweise prognostiziert, während sich Metadaten mit dem logischen Datenbankdesign befassen. Muster und Beziehungen zwischen Datenelementen können häufig relevante Informationen zur Verbesserung von Geschäftsprozessen liefern. Unternehmen mit einem starken Verbraucherfokus beschäftigen sich mit Data-Mining-Techniken und liefern klare Bilder der verkauften Produkte, des Preises, des Wettbewerbs und der Kundendemografie.

Beispielsweise überträgt der Einzelhandelsriese Walmart alle relevanten Informationen an ein Data Warehouse mit Terabyte an Daten. Auf diese Daten können Lieferanten leicht zugreifen, um Kundenkaufmuster zu identifizieren. Mithilfe von Data-Mining-Techniken können sie Muster zu Einkaufsgewohnheiten, den am häufigsten eingekauften Tagen, den am meisten nachgefragten Produkten und anderen Erkenntnissen generieren.

Der zweite Schritt beim Data Mining ist die Auswahl eines geeigneten Algorithmus - eines Mechanismus zur Erstellung eines Data Mining-Modells. Die allgemeine Arbeitsweise des Algorithmus besteht darin, Trends in einem Datensatz zu identifizieren und die Ausgabe für die Parameterdefinition zu verwenden. Die beliebtesten Algorithmen für das Data Mining sind Klassifizierungsalgorithmen und Regressionsalgorithmen, mit denen Beziehungen zwischen Datenelementen identifiziert werden. Große Datenbankanbieter wie Oracle und SQL integrieren Data Mining-Algorithmen wie Clustering- und Regressionsbäume, um die Nachfrage nach Data Mining zu befriedigen.