Stup

(redirecționat de la „ Apache Hive ”)
Apache Hive
Tip de Sistemul de gestionare a bazelor de date
Autor Facebook
Dezvoltator Apache Software Foundation
Scris in Java
Sistem de operare Software multiplatformă
Limbi de interfață Engleză
Prima editie 9 noiembrie 2011 [1]
Platformă hardware Mașină virtuală Java
ultima versiune
Stat Activ
Licență Licența Apache 2
Site-ul web hive.apache.org
 Fișiere media la Wikimedia Commons

Hive  este un sistem de gestionare a bazelor de date bazat pe platforma Hadoop cu un limbaj de interogare asemănător SQL care vă permite să interogați, să agregați și să analizați date; componentă a ecosistemului Hadoop .

Creat de Facebook Corporation , în 2011 a fost transferat sub o licenţă deschisă către Fundaţia Apache .

Funcționează direct cu HDFS și Apache HBase , acceptă formatele majore Hadoop. Interogările pot fi executate prin Tez , Spark sau Hadoop MapReduce [3] .

Limbajul de interogare - HiveQL  - este apropiat de SQL, dar nu implementează toate caracteristicile standardului SQL-92 . Limbajul are funcții încorporate pentru lucrul cu formatele XML și JSON , suport pentru tipuri de date non-scalare, cum ar fi matrice, structuri, matrice asociative [4] , este implementat un set destul de larg de funcții agregate , funcții definite de utilizator, blocări sunt suportate.

Un exemplu de sesiune de lucru cu Hive folosind HiveQL - ștergerea unui tabel, crearea unui tabel, încărcarea datelor în el dintr-un fișier text și o interogare pentru a număra de câte ori a apărut fiecare cuvânt în fișier:

DROP TABLE IF EXISTIS docs ; CREATE TABLE docs ( linia STRING ); LOAD DATA INPATH 'input_file' OVERWRITE INTO TABLE docs ; CREATE TABLE word_counts AS SELECTARE cuvânt , numărare ( 1 ) AS count FROM ( SELECT explode ( split ( line , '\s' )) AS word FROM docs ) temp GRUPĂ CU cuvânt ORDENAȚI DUPĂ cuvânt ;

Note

  1. https://projects.apache.org/json/projects/hive.json
  2. Apache Hive 3.1.3 Lansat - 2022.
  3. Despre Apache Hive . Preluat la 11 august 2016. Arhivat din original la 30 august 2016.
  4. Diferențele SQL între Impala și Hive . Preluat la 11 august 2016. Arhivat din original la 9 august 2016.

Link -uri