Data Science-Plattform

Definition - Was bedeutet Data Science Platform?

Eine Data Science-Plattform ist eine Umgebung für die Durchführung von Data Science-Arbeiten, die in der Regel die Codierung und Bereitstellung von Codemodellen sowie die Aggregation und Verwendung von Daten aus verschiedenen Quellen umfasst. Data Science-Projekte profitieren von einer zentralen Data Science-Plattform, die häufig als „Software-Hub“ für diese Art von Big-Data-Arbeit bezeichnet wird.

Technische.me erklärt die Data Science Platform

Data Science-Plattformen können auf viele Arten eingerichtet werden. Viele von ihnen nutzen Modernisierungsprinzipien wie virtuelle Maschinen und Containervirtualisierung, bei denen eine Data Science-Plattform Designfaktoren berücksichtigt, die es Entwicklern ermöglichen, mit Anwendungen und Codebasen in einer modularen Umgebung zu arbeiten. Die datenwissenschaftliche Arbeit hat sich auch durch den Einsatz von Technologien wie Apache Hadoop und anderen Clustering- und modularen Systemen für die Datenverarbeitung und einen Datenlebenszyklus entwickelt.

Ein Teil der Herausforderung einer Data Science-Plattform besteht darin, zu bestimmen, wie Tools unterstützt werden, und zu steuern, was einige als „Tool Sprawl“ bezeichnen, was ein negativer Faktor sein kann.