10月26,27日の2日間にわたって、Hadoop Summit 2016 Tokyoが開かれるほか、
Hadoopのパッケージ製品を開発しているビッグデータ関連で著名なclouderaのイベントである
Cloudera World Tokyo 2016が開催されます。

Hadoop Summit 2016 Tokyo  (ヒルトン東京)

Cloudera World Tokyo 2016 (ANAインターコンチネンタルホテル東京)

 

みどりのゾウが東京にやってくる! ―Hadoop関連トピックを2つほど

EnterpriseZineのDBオンラインの記事です。Hadoop Summit 2016 Tokyoの見どころを紹介してくれているほか、主催のホートンワークスのトレードマークの緑のゾウの紹介などもしてくれています。こちらを先に見てから、上述のHadoop Summit 2016 Tokyoのホームページを見ていってもいいかもしれません。Hadoop Summit 2016 Tokyoでは
Hadoopの次のメジャーリリースである Apache Hadoop 3.0の紹介もされるようです。

 

Hadoopはどのように動くのか ─並列・分散システム技術から読み解くHadoop処理系の設計と実装

技評のHadoop連載の17回目から三回にわたって、「Impalaの設計と実装」としてHadoop上でSQLを高速に処理するための並列データ処理系であるImpalaについて解説してくれています。
Hadoopのエコシステムの中でHadoop上でSQLを実行するための処理系としてはHiveがありますが、バッチ処理としての高スループットを目指す用途ではHive、分析などのアドホッククエリに対して高速な応答を返す用途にはImpalaを使うのがよいようです。

本連載はHadoopの概要を理解できるとともに、バッチ処理から分析などのアドホッククエリにも用途を広げているHadoopのキーコンポーネントとして注目されているSparkやImpalaなどについても理解を深めることができる記事だと思います。