マローズとは何ですか？ cp？ (定義と例)

によるベンジャミン・アンダーソン博士 7月 25, 2023 ガイド 0コメント

Mallows Cp は、いくつかの異なるモデルの中から最適な回帰モデルを選択するために使用されるメトリックです。

次のように計算されます。

Cp = RSS _p /S ² – N + 2(P+1)

金：

Mallows Cp は、回帰モデルで使用したい潜在的な予測変数がいくつかあり、これらの予測変数のサブセットを使用する最適なモデルを特定したい場合に使用されます。

P+1 未満の最小 Cp 値を持つモデルを特定することで、「最良の」回帰モデルを特定できます。ここで、P はモデル内の予測子変数の数です。

次の例は、Mallows の Cp を使用して、いくつかの潜在的なモデルから最適な回帰モデルを選択する方法を示しています。

教授が、学習時間、受けた予備試験、および現在の累積 GPA を回帰モデルの予測変数として使用して、最終試験で学生が受け取る成績を予測したいとします。

7 つの異なる回帰モデルに適合し、各モデルの Mallows Cp 値を計算します。

Mallows Cp を使用して最適な回帰モデルを選択する

マローズの Cp の値がモデル係数の数 (P+1) より小さい場合、モデルには偏りがないと言われます。

2 つの公平なモデルがあることがわかります。

これら 2 つのモデルのうち、予備試験と GPA を予測変数として使用するモデルは、Mallows の Cp の値が最も低く、バイアスが最小になる優れたモデルであることがわかります。

Mallows Cp について留意すべき点は次のとおりです。

また、Mallows の Cp は回帰モデルの適合度を測定する 1 つの方法にすぎないことにも留意してください。

もう 1 つの一般的に使用される尺度は、調整済み R 二乗です。これは、使用される予測子変数の数に合わせて調整された、モデル内の予測子変数によって説明できる応答変数の分散の割合を示します。

いくつかの異なるモデルのリストからどの回帰モデルが最適であるかを判断するには、Mallows の Cp と調整済み R 二乗の両方を確認することをお勧めします。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る