Un set di dati può essere scritto in due formati diversi: wide e long . Un formato ampio contiene valori che non si ripetono nella prima colonna. Un formato lungo contiene valori che si ripetono nella prima colonna. Ad esempio, considera...
Nelle statistiche, i casi si riferiscono semplicemente agli individui in un set di dati. Nella maggior parte dei set di dati abbiamo casi (gli individui) e variabili (gli attributi degli individui). Ad esempio, il seguente set di dati contiene 10 casi...
Puoi utilizzare l’argomento cmap in Matplotlib per visualizzare facilmente immagini in scala di grigi . L’esempio seguente mostra come utilizzare questo argomento nella pratica. Esempio: visualizzare l’immagine in scala di grigi in Matplotlib Diciamo che ho la seguente immagine chiamata shape.JPG...
Il test di Kolmogorov-Smirnov viene utilizzato per determinare se un campione è distribuito normalmente o meno. Questo test è ampiamente utilizzato perché molti test e procedure statistiche presuppongono che i dati siano distribuiti normalmente. Il seguente esempio passo passo mostra come...
La funzione scale() in R può essere utilizzata per ridimensionare i valori in un vettore, matrice o frame di dati. Questa funzione utilizza la seguente sintassi di base: scale(x, center = TRUE , scale = TRUE ) Oro: x : Nome...
Un errore che potresti riscontrare in Python è: TypeError :Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Questo errore si verifica in genere quando si tenta di filtrare un DataFrame Panda utilizzando più condizioni ma non...
Centrare un set di dati significa sottrarre il valore medio di ogni singola osservazione nel set di dati. Una volta centrato un set di dati, il valore medio del set di dati diventa zero. Gli esempi seguenti mostrano come centrare i...
La formula di Spearman-Brown viene utilizzata per prevedere l’affidabilità di un test dopo aver modificato la durata del test. La formula è: Affidabilità prevista = kr / (1 + (k-1)r) Oro: k : Fattore in base al quale viene modificata la...
La funzione split() in R può essere utilizzata per dividere i dati in gruppi in base ai livelli dei fattori. Questa funzione utilizza la seguente sintassi di base: dividere(x, f, …) Oro: x : Nome del vettore o del blocco dati...
Un test di Wald può essere utilizzato per verificare se uno o più parametri di un modello sono uguali a determinati valori. Questo test viene spesso utilizzato per determinare se una o più variabili predittive in un modello di regressione sono...