Il rischio attribuibile si riferisce alla differenza nei tassi di incidenza tra le persone esposte a un fattore di rischio e le persone non esposte a quel fattore di rischio. Ad esempio, potremmo utilizzare questa misura per comprendere la differenza nelle...
La regressione lineare è un metodo che possiamo utilizzare per quantificare la relazione tra una o più variabili predittive e una variabile di risposta . Generalmente utilizziamo la regressione lineare con variabili quantitative . A volte chiamate variabili “numeriche”, si tratta...
Una variabile fittizia è un tipo di variabile che creiamo nell’analisi di regressione in modo da poter rappresentare una variabile categoriale come variabile numerica che assume uno dei due valori: zero o uno. Ad esempio, supponiamo di avere il seguente set...
Una variabile fittizia è un tipo di variabile che creiamo nell’analisi di regressione in modo da poter rappresentare una variabile categoriale come variabile numerica che assume uno dei due valori: zero o uno. Ad esempio, supponiamo di avere il seguente set...
La regressione lineare è un metodo che possiamo utilizzare per quantificare la relazione tra una o più variabili predittive e una variabile di risposta . Generalmente utilizziamo la regressione lineare con variabili quantitative . A volte chiamate variabili “numeriche”, si tratta...
Due termini a volte usati in modo intercambiabile sono correlazione e associazione . Tuttavia, nel campo della statistica, questi due termini hanno significati leggermente diversi. In particolare, quando usiamo la parola correlazione , solitamente parliamo del coefficiente di correlazione di Pearson...
Possiamo usare la funzione DATEDIF() per calcolare la differenza tra due date in Excel. Questa funzione utilizza la seguente sintassi: =DATEDIF(Data_inizio, Data_fine, Metrica) Oro: Start_Date: la data di inizio End_Date: la data di fine Metrica: la metrica da calcolare. Le opzioni...
In statistica si dice che una distribuzione di probabilità ha una proprietà senza memoria se la probabilità che si verifichi un evento futuro non è influenzata dal verificarsi di eventi passati. Esistono solo due distribuzioni di probabilità con la proprietà memoryless:...
Possiamo utilizzare la funzione pmax() per trovare il valore massimo su più colonne di R. Questa funzione utilizza la seguente sintassi: pmax(…, na.rm = FALSO) Oro: … : un elenco di vettori na.rm: un elemento logico che indica se i valori...
La funzione str_replace() del pacchetto stringr in R può essere utilizzata per sostituire i modelli corrispondenti in una stringa. Questa funzione utilizza la seguente sintassi: str_replace(stringa, modello, sostituzione) Oro: stringa: vettore di caratteri modello: modello da cercare sostituzione: un vettore di...