• データソースの作成
  • 学習モデルの構築
  • 学習モデルの評価
  • 予測結果の取得

 

予測を取得するまでの具体的な作業の流れ

Amazon Machine Learningでの機械学習においては、

・訓練で使うためのデータソースの作成
・学習モデルの構築
・学習モデルの評価
・データを使って予測した結果の作成

といった作業を行って、予測を行います。

 

 

 

 

訓練で使うためのデータソースの作成

機械学習で訓練に使うデータは、Amazon Machine Learningで使えるフォーマットに変換する必要があります。

・訓練用データを、S3やRedshiftなどから読み込みます
・読み込んだデータを、どのようなフォーマットに変換するか指定します
・データソースを使って機械学習するために、ターゲットの指定をします
・予測した結果をIDと関連付けたい場合は、ID項目を指定します

 

学習モデルの構築

データソースを使って、学習モデルを構築します。

・モデルを構築するためのデータソースを指定します
・学習に関する設定を、推奨設定にするか手動設定にするか選択します
・手動で学習設定をする場合、どのような前処理をするか指定します
・モデルの最大サイズやパス数の設定などの学習パラメータに関する設定を行います
・評価についての設定をします

 

 

 

 

学習モデルの評価

構築した学習モデルの評価が、評価エンティティに保存されます。

・二項分類
・多項分類
・回帰

などの学習モデルに種類に応じた評価指標が使われます。

 

データを使って予測した結果の作成

学習モデルを構築して評価が済んだ後は、実データを入力して予測を行う事が出来ます。

予測結果を取得する方法には、
・複数の予測結を一度に行うバッチ予測
・AWS APIを使って一つずつデータを入力して、予測結果を問い合わせるリアルタイル予測
が利用出来ます。

 

本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。

 

参考文献