Unstrukturierte Daten

Definition - Was bedeuten unstrukturierte Daten?

Unstrukturierte Daten stellen alle Daten dar, die keine erkennbare Struktur haben. Es ist unorganisiert und roh und kann nicht textuell oder textuell sein. Zum Beispiel ist E-Mail ein gutes Beispiel für unstrukturierte Textdaten. Es enthält Uhrzeit, Datum, Empfänger- und Absenderdetails und Betreff usw., aber ein E-Mail-Text bleibt unstrukturiert. Unstrukturierte Daten können auch als lose strukturierte Daten identifiziert werden, wobei die Datenquellen eine Struktur enthalten, aber nicht alle Daten in einem Datensatz derselben Struktur folgen.

In kundenorientierten Unternehmen können die in unstrukturierter Form gefundenen Daten untersucht werden, um das Beziehungsmarketing und das Kundenbeziehungsmanagement (CRM) zu verbessern. Da Social-Media-Apps wie Facebook und Twitter zum Mainstream werden, wird die unstrukturierte Datenentwicklung wahrscheinlich den Fortschritt strukturierter Daten übertreffen.

Technische.me erklärt unstrukturierte Daten

Unstrukturierte Daten beziehen sich auf Daten, die einem Formular folgen, das weniger geordnet ist als Elemente wie Tabellenkalkulationsseiten, Datenbanktabellen oder andere lineare oder geordnete Datensätze. Tatsächlich ist der Begriff "Datensatz" hilfreich, da er mit Daten verknüpft ist, die sich in übersichtlichen, zugänglichen Arrays ohne zusätzlichen Inhalt befinden und in einer bestimmten Struktur verknüpft oder mit Tags versehen sind.

Andere Instanzen unstrukturierter Textdaten sind Word-Dokumente, PowerPoint-Präsentationen, Sofortnachrichten, Collaboration-Software, Dokumente, Bücher, Social-Media-Beiträge und Krankenakten. Nicht strukturierte unstrukturierte Daten werden im Allgemeinen in Medien wie MP3-Audiodateien, JPEG-Bildern und Flash-Videodateien usw. erstellt.

Unstrukturierte Daten enthalten normalerweise kein vordefiniertes Datenmodell und passen möglicherweise nicht gut zu relationalen Tabellen. Unstrukturierte Daten sind normalerweise textlastig. Es kann jedoch Zahlen und Daten sowie Fakten enthalten. Dies führt zu Unklarheiten, die mit herkömmlichen Softwareprogrammen nur schwer zu erkennen sind.

Die Speicherung großer Mengen unstrukturierter Daten, die innerhalb eines Unternehmens generiert werden, kann bei schlechter Verwaltung zu höheren Kosten führen. Daten in gedruckten Dokumenten oder in einem elektronischen Format müssen gescannt werden, damit eine Suchanwendung Ideen abhängig von den in bestimmten Kontexten verwendeten Wörtern analysieren kann. Dies wird als Unternehmens- oder semantische Suche bezeichnet.