• Amazon Redshiftの導入手順
  • クラスタの立ち上げ
  • アクセスの認可
  • クラスタへの接続
  • テーブル作成
  • データのアップロード、クエリ

 

Amazon Redshiftクラスタの立ち上げ

Amazon Redshiftを利用するには、まずRedshiftのメニューを開いてクラスターを立ち上げます。

表示されるメニューに従って、
・クラスタ識別子
・DB名
・DB接続ポート
・マスターユーザー名
・パスワード
をなど設定します。

そして、ノード設定においてクラスタ内のノードの設定などを行うと、クラスターが作成されて起動されます。

クラスターを起動しましたら、クライアントからのアクセスの認可に関する設定を行います。

 

 

クラスタへの接続

クラスタへの接続は、PostgreSQLと互換性のあるSQLクライアントで行います。

作成したクラスタの情報をSQLクライアントの接続情報に設定すれば接続できる状態となります。

クラスタ固有の接続文字列については、Amazon Redshift管理コンソールのクラスタページで調べることができます。

 

テーブル作成

クラスターに接続できるようになれば、データベースの操作することが可能です。
最初に、CREATE TABLE文を使ってテーブルを作成することになりますが、パフォーマンス向上のために、データの内容に応じてdist_keyやsort_keyを使う必要があります。

 

 

 

データのアップロード、クエリ

Amazon S3からデータをコピーすることで、作成したテーブルにデータをアップロードでできます。
RedShiftのコピーコマンドは、データの内容を分析して最適な圧縮方式を選んでくれますので、パフォーマンスの向上が望めます。

アップロードしたテーブル上のデータに対しては、クエリを実行してさまざまな操作ができます。

 

 

本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。

 

 

参考文献