• オープンソースHiveは、Hadoop上で使用するソフトウェアです。
    Hadoopと親和性の高いインターフェースを持ち、SQLと似ているHiveQLという言語でデータの操作をする事が出来ます。
  • Hiveを利用すれば、Hadoopで直接データを扱うよりも簡単にデータを操作出来ます。

 

Hadoop上で稼働するHive

Hiveは、Hadoop上でDWHを構築する時に使うオープンソースのソフトウェアです。

HBaseというHadoop上で動くデータベースもありますが、HiveのインターフェイスはHDFSと親和性の高いので、快適な操作が可能となっています。

HiveのSQLライクな言語HiveQLを使う事で、Hadoop内のデータを手軽に処理する事が可能です。

 

 

 

Hiveの使い方

Hiveは、専用のインタプリタhiveで各種操作を行います。
SQLと同じようなコマンドで、操作する事が可能です。

・CREATE TABLE:テーブルの作成
・LOAD DATA:データの読み込み
・SELECT:テーブルの検索
・INSERT:データの保存

 

 

本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。

 

参考文献