Quando la relazione tra un insieme di variabili predittive e una variabile di risposta è molto complessa, spesso utilizziamo metodi non lineari per modellare la relazione tra loro. Uno di questi metodi sono gli alberi di classificazione e regressione (spesso abbreviati...
Quando la relazione tra un insieme di variabili predittive e una variabile di risposta è molto complessa, spesso utilizziamo metodi non lineari per modellare la relazione tra loro. Uno di questi metodi è costruire un albero decisionale . Tuttavia, lo svantaggio...
Una distribuzione campionaria è una distribuzione di probabilità di una certa statistica basata su molti campioni casuali di una singola popolazione . Questo tutorial spiega come eseguire le seguenti operazioni con le distribuzioni di campionamento in Excel: Generare una distribuzione campionaria....
Spesso potresti voler selezionare un campione casuale da un set di dati in Excel. Fortunatamente, questo è facile da fare utilizzando la funzione RAND() , che genera un numero casuale compreso tra 0 e 1. Questo tutorial fornisce un esempio passo...
Un grafico delle posizioni in scala è un tipo di grafico che mostra i valori adattati di un modello di regressione lungo l’asse x e la radice quadrata dei residui standardizzati lungo l’asse y. Osservando questo grafico controlliamo due cose: 1....
Un intervallo di confidenza è un intervallo di valori che probabilmente contiene un parametro della popolazione con un certo livello di confidenza. Si calcola secondo la seguente formula generale: Intervallo di confidenza = (stima puntuale) +/- (valore critico)* (errore standard) Questa...
R è uno dei linguaggi di programmazione più popolari per lavorare con i dati. Ma prima di poter lavorare con i dati, dobbiamo importarli effettivamente in R! Se i tuoi dati sono già in un file CSV o Excel, puoi seguire...
La distribuzione normale è la distribuzione più comunemente utilizzata in tutte le statistiche ed è nota per essere simmetrica e a forma di campana. Una distribuzione strettamente correlata è la distribuzione t , anch’essa simmetrica e a forma di campana ma...
La maggior parte degli algoritmi di machine learning supervisionati si basano sull’utilizzo di un singolo modello predittivo come la regressione lineare , la regressione logistica , la regressione ridge , ecc. Tuttavia, metodi come il bagging e le foreste casuali creano...
Spesso nelle statistiche vogliamo raccogliere dati in modo da poter rispondere a determinate domande di ricerca. Ad esempio, potremmo voler rispondere alle seguenti domande: 1. Qual è il reddito familiare medio a Miami, in Florida? 2. Qual è il peso medio...