Große Datenmengen

Definition - Was bedeutet Big Data?

Big Data bezieht sich auf einen Prozess, der verwendet wird, wenn herkömmliche Data Mining- und Handhabungstechniken die Erkenntnisse und die Bedeutung der zugrunde liegenden Daten nicht aufdecken können. Daten, die unstrukturiert oder zeitkritisch oder einfach sehr groß sind, können von relationalen Datenbankmodulen nicht verarbeitet werden. Diese Art von Daten erfordert einen anderen Verarbeitungsansatz, der als Big Data bezeichnet wird und eine massive Parallelität auf leicht verfügbarer Hardware verwendet.

Technische.me erklärt Big Data

Big Data spiegelt ganz einfach die sich verändernde Welt wider, in der wir leben. Je mehr Dinge sich ändern, desto mehr werden die Änderungen erfasst und als Daten aufgezeichnet. Nehmen Sie das Wetter als Beispiel. Für einen Wettervorhersager ist die Menge der weltweit gesammelten Daten über die örtlichen Gegebenheiten beträchtlich. Logischerweise wäre es sinnvoll, dass lokale Umgebungen regionale Effekte und regionale Effekte globale Effekte diktieren, aber es könnte auch umgekehrt sein. Auf die eine oder andere Weise spiegeln diese Wetterdaten die Attribute von Big Data wider, bei denen eine Echtzeitverarbeitung für eine große Datenmenge erforderlich ist und bei denen die große Anzahl von Eingaben maschinell generiert werden kann, persönliche Beobachtungen oder äußere Kräfte wie Sonnenflecken.

Die Verarbeitung solcher Informationen zeigt, warum Big Data so wichtig geworden ist:

  • Die meisten jetzt gesammelten Daten sind unstrukturiert und erfordern eine andere Speicherung und Verarbeitung als herkömmliche relationale Datenbanken.
  • Die verfügbare Rechenleistung ist rasant, was bedeutet, dass es mehr Möglichkeiten gibt, Big Data zu verarbeiten.
  • Das Internet hat Daten demokratisiert, die verfügbaren Daten stetig erhöht und gleichzeitig immer mehr Rohdaten produziert.

Daten in ihrer Rohform haben keinen Wert. Daten müssen verarbeitet werden, um wertvoll zu sein. Hierin liegt jedoch das inhärente Problem von Big Data. Ist die Verarbeitung von Daten aus dem nativen Objektformat zu einem nutzbaren Einblick die enormen Kapitalkosten wert? Oder gibt es einfach zu viele Daten mit unbekannten Werten, um die Verarbeitung mit Big-Data-Tools zu rechtfertigen? Die meisten von uns würden zustimmen, dass die Vorhersage des Wetters einen Wert haben würde. Die Frage ist, ob dieser Wert die Kosten für die Zusammenstellung aller Echtzeitdaten in einem Wetterbericht, auf den man zählen kann, überwiegen könnte.