機械学習における分類エラー率: 定義と例

によるベンジャミン・アンダーソン博士 7月 19, 2023 ガイド 0コメント

機械学習において、誤分類率は、分類モデルによって誤って予測された観測値の割合を示す指標です。

次のように計算されます。

誤分類率 = 誤った予測の数 / 予測の合計数

誤分類率の値は 0 から 1 まで変化します。ここで、

誤分類率の値が低いほど、分類モデルは応答変数の結果をより適切に予測できます。

次の例は、実際にロジスティック回帰モデルの分類誤り率を計算する方法を示しています。

ロジスティック回帰モデルを使用して、400 人のさまざまな大学バスケットボール選手が NBA にドラフトされるかどうかを予測するとします。

次の混同行列は、モデルによって行われた予測を要約したものです。

ロジスティック回帰モデルの誤分類率を計算する

モデルの分類エラー率を計算する方法は次のとおりです。

このモデルの分類エラー率は 0.275 または27.5%です。

これは、モデルが27.5%のプレイヤーの結果を誤って予測したことを意味します。

分類エラー率の反対は精度であり、次のように計算されます。

これは、モデルが72.5%のプレイヤーの結果を正しく予測したことを意味します。

誤分類率には次の利点があります。

ただし、分類エラー率には次のような欠点があります。

これには、データがどのように分散されるかは考慮されていません。たとえば、全選手の 90% が NBA にドラフト指名されなかったと仮定します。すべての選手がドラフト外になることを単純に予測するモデルがある場合、そのモデルの分類誤差率はわずか 10% になります。これは低いように見えますが、実際にはこのモデルはドラフトされる選手を正確に予測できません。

実際には、次のような他の指標を使用してモデルの分類誤り率を計算することがよくあります。

これらの各メトリクスの値を計算することで、モデルがどの程度正確に予測できるかを完全に理解できます。

次のチュートリアルでは、一般的な機械学習の概念に関する追加情報を提供します。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る