Cos'è la malva? cp? (definizione ed esempio)


Mallows Cp è una metrica utilizzata per selezionare il miglior modello di regressione tra diversi modelli.

Viene calcolato come segue:

Cp = RSS p /S 2 – N + 2(P+1)

Oro:

  • RSS p : la somma residua dei quadrati per un modello con p variabili predittive
  • S 2 : Il quadrato medio residuo del modello (stimato da MSE)
  • N: dimensione del campione
  • P: il numero di variabili predittive

Mallows Cp viene utilizzato quando disponiamo di diverse potenziali variabili predittive che vorremmo utilizzare in un modello di regressione e vogliamo identificare il modello migliore che utilizza un sottoinsieme di queste variabili predittive.

Possiamo identificare il modello di regressione “migliore” identificando il modello con il valore Cp più basso inferiore a P+1, dove P è il numero di variabili predittive nel modello.

L’esempio seguente mostra come utilizzare il Cp di Mallows per selezionare il miglior modello di regressione tra diversi modelli potenziali.

Esempio: utilizzo di Mallows Cp per selezionare il modello migliore

Si presuppone che un professore desideri utilizzare le ore di studio, gli esami preparatori sostenuti e l’attuale GPA cumulativo come variabili predittive in un modello di regressione per prevedere il voto che uno studente riceverà all’esame finale.

Si adatta a sette diversi modelli di regressione e calcola il valore Cp di Mallow per ciascun modello:

Utilizzo di Mallows Cp per scegliere il miglior modello di regressione

Se il valore del Cp di Mallows è inferiore al numero di coefficienti del modello (P+1), allora il modello è detto imparziale.

Possiamo vedere che esistono due modelli imparziali:

  • Il modello con Ore e GPA come variabili predittive (Cp di Mallows = 2,9, P+1 = 3)
  • Il modello con esami preparatori e GPA come variabili predittive (Cp di Mallows = 2,7, P+1 = 3)

Di questi due modelli, il modello che utilizza gli esami preparatori e la GPA come variabili predittive ha il valore più basso per il Cp di Mallows, il che ci dice che è il modello migliore che risulta nel minor bias.

Note sul Cp des mauves

Ecco alcune cose da tenere a mente su Mallows Cp:

  • Si dice che i modelli che hanno un valore Cp di Mallow vicino a P+1 abbiano una distorsione bassa.
  • Se ciascun modello potenziale ha un valore Cp di Mallows elevato, ciò indica che è probabile che in ciascun modello manchino alcune importanti variabili predittive.
  • Se diversi modelli potenziali hanno valori bassi per il Cp di Mallow, scegliere il modello con il valore più basso come modello migliore da utilizzare.

Tieni inoltre presente che il Cp di Mallows è solo un modo per misurare la bontà dell’adattamento di un modello di regressione.

Un’altra misura comunemente utilizzata è l’R quadrato aggiustato, che ci dice la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili predittive nel modello, aggiustate per il numero di variabili predittive utilizzate.

Per decidere quale modello di regressione è il migliore da un elenco di diversi modelli diversi, è una buona idea esaminare sia il Cp di Mallows che l’R quadrato corretto.

Risorse addizionali

Come calcolare il Cp di Mallow in R
Come calcolare l’R quadrato corretto in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *