- オープンソースHiveは、Hadoop上で使用するソフトウェアです。
Hadoopと親和性の高いインターフェースを持ち、SQLと似ているHiveQLという言語でデータの操作をする事が出来ます。 - Hiveを利用すれば、Hadoopで直接データを扱うよりも簡単にデータを操作出来ます。
Hadoop上で稼働するHive
Hiveは、Hadoop上でDWHを構築する時に使うオープンソースのソフトウェアです。
HBaseというHadoop上で動くデータベースもありますが、HiveのインターフェイスはHDFSと親和性の高いので、快適な操作が可能となっています。
HiveのSQLライクな言語HiveQLを使う事で、Hadoop内のデータを手軽に処理する事が可能です。
Hiveの使い方
Hiveは、専用のインタプリタhiveで各種操作を行います。
SQLと同じようなコマンドで、操作する事が可能です。
・CREATE TABLE:テーブルの作成
・LOAD DATA:データの読み込み
・SELECT:テーブルの検索
・INSERT:データの保存
本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。
参考文献