- ETLとは、・Extract(抽出) ・Transform(変換) ・Load(書き出し)
の頭文字を並べたものです。 - さまざまなデータソースから抽出したデータを利用しやすいフォーマットに変換して、DWHに格納するのがETL処理の基本的な役目となります。
- オープンソースBIのPentahoやOracleのWarehouse Builderなどで、ETL処理をする事が出来ます。
(Extract(抽出) Transform(変換) Load(書き出し))
ETLとは、BIで分析する時に重要となる
・Extract(抽出)
・Transform(変換)
・Load(書き出し)
の頭文字を並べたものです。
データを分析しやすい構造と内容に整理するために、BIではETL処理を行います。
さまざまなデータをETL処理する事で、利用しやすいものに変わります。
データソースからデータを抽出、利用しやすい形に変換してDWHに格納する処理
各種データソースから抽出したデータを利用しやすいフォーマットに変換してから、DWHに格納するのがETL処理の基本的な役目です。
直接データーソースをDWHに入力したのでは分析しにくく処理効率が悪化するので、抽出・変換・書き出し処理をしてから、DWHで利用するのが一般的となっています。
どのような分析をするのかを明確にしてから分析する時に必要となる情報や項目を検討して、具体的なテーブル構成を決めてETL処理を行います。
ETL処理が行えるソフトウェア
ETL処理が出来るソフトウェアには、
・オープンソースBIのPentaho
・OracleのWarehouse Builder
などがあります。
PentahoはETL処理以外にも、レポーティング・対話型分析・ダッシュボードなどにお機能を備えおり、Warehouse BuilderはOracleが持つ大規模データウェアハウス構築のノウハウを活かして、高品質で使いやすいETLツールとなっています。
本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。
参考文献
- データ統合/ETLを使おう(ThinkIT)
- Amazon Redshiftで構築するビッグデータ分析環境の構成要素と全体像 (CodeZine)
- 「2007年にBI市場で1位を取りたい」、オラクル -