• 特定の属性に注目してデータを分類する学習アルゴリズムとして、二項分類と多項分類があります。
    ・二種類のグループに分類する二項分類
    ・三種類以上のグループに分類する多項分類

 

機械学習に用いられる二項分類と多項分類

機械学習には複数の学習アルゴリズムが存在しますが、特定の属性に注目してデータを分類する方法として、二項分類と多項分類があります。

二項分類
・属性によって、二種類に分類する
・具体例 奇数か偶数か、0か1かなど

多項分類
・属性に応じて、三種類以上に分類する
・具体例 色による分類、商品の種類による分類など

 

 

二項分類による予測

データを二種類のグループに分類する二項分類では、が判断の材料として使われるのが分類閾値(カットオフ)です。
閾値とデータを比較した結果を元にして、予測が行われます。

二項分類の結果を評価するために用いられる精度メトリクスには、
・Accuracy(正確度)
・Precision(精度、適合率)
・Recall(再現率)
・False Positive Rate(偽陽性率)
・F1-measure(F1値)
などがあります。
これらの値を検証する事で、より正確に二項分類出来るように修正する事が出来ます。

 

 

 

多項分類による予測

多項分類は、単にデータと閾値を比較するのではなく総合的なスコアによって、分類を行います。
状況によっては、一定の値以上のスコアにならない時は、予測出来ない事もあります。

多項分類でも二項分類と同じように、Accuracy(正確度)やPrecision(精度、適合率)などの精度メトリクスを使って、予測した結果を評価します。

 

 

 

 

本サイト上に掲載されているまとめ記事が、毎週ステップメールで受け取ることもできます。

 

 

参考文献