SQL auf Hadoop

Definition - Was bedeutet SQL unter Hadoop?

SQL unter Hadoop ist eine Art analytisches Anwendungstool - die SQL-Implementierung auf der Hadoop-Plattform, die die standardmäßige Abfrage strukturierter Daten im SQL-Stil mit dem Hadoop-Datenframework kombiniert. Hadoop ist eine relativ neue Plattform, ebenso wie Big Data selbst, und nicht viele Fachleute sind Experten darin, aber SQL unter Hadoop vereinfacht den Zugriff auf das Hadoop-Framework und erleichtert die Implementierung auf aktuellen Unternehmenssystemen.

Technische.me erklärt SQL unter Hadoop

SQL unter Hadoop bezieht sich auf verschiedene Implementierungen von SQL für die Hadoop-Plattform. MapReduce, Hadoops Cluster Job Mapper und Ergebnisorganisator, unterstützt SQL als Hauptanwendungsfall sowie andere Verarbeitungsmethoden. Daher ist es sinnvoll, leistungsstarke Tools zum Zulassen von SQL zu erstellen, einer der am häufigsten verwendeten Sprachen für Datenbankabfragen und -manipulationen. Da Hadoop für die Unternehmensdatenarchitektur immer beliebter wird, ist SQL der Schlüssel für die ordnungsgemäße Übernahme sowohl von lose strukturierten als auch von in Hadoop verwendeten strukturierten Daten.

Zu den Schlüsseltreibern von SQL on Hadoop gehören:

  • Nutzung vorhandener SQL-Kenntnisse in den meisten Organisationen
  • Wiederverwendung von Investitionen in Extract Transform Load (ETL), Business Intelligence (BI) und Analytics-Infrastruktur in Hadoop

Einige SQL on Hadoop-Implementierungen umfassen:

  • Apache Spark SQL
  • Apache Hive
  • Apache Tajo
  • Apache Drill
  • HP Vertica auf MapR
  • ODBC-Treiber
  • Presto
  • Hai