In statistica, i dati grezzi si riferiscono a dati raccolti direttamente da una fonte primaria e non elaborati in alcun modo. In qualsiasi tipo di progetto di analisi dei dati, il primo passo è raccogliere dati grezzi. Una volta raccolti, questi...
La correlazione viene utilizzata per misurare l’associazione lineare tra due variabili. Un coefficiente di correlazione assume sempre un valore compreso tra -1 e 1 dove: -1 indica una correlazione lineare perfettamente negativa tra due variabili 0 indica alcuna correlazione lineare tra...
Un grafico delle serie temporali è utile per visualizzare i valori dei dati che cambiano nel tempo. Questo tutorial spiega come creare vari grafici di serie temporali utilizzando il pacchetto di visualizzazione dei dati Seaborn in Python. Esempio 1: tracciare una...
È possibile utilizzare la seguente sintassi di base per creare un istogramma da un DataFrame panda: df. hist (column=' col_name ') Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica. Esempio 1: tracciare un singolo istogramma Il codice seguente mostra...
È possibile utilizzare la funzione fillna() per sostituire i valori NaN in un DataFrame panda. Questa funzione utilizza la seguente sintassi di base: #replace NaN values in one column df[' col1 '] = df[' col1 ']. fillna (0) #replace NaN values...
È possibile utilizzare la seguente sintassi di base per aggiungere due DataFrame panda in un singolo DataFrame: big_df = pd. concat ([df1, df2], ignore_index= True ) Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica. Esempio 1: aggiungi due DataFrames...
È possibile utilizzare la seguente sintassi di base per dividere un DataFrame panda in più DataFrame in base al numero di riga: #split DataFrame into two DataFrames at row 6 df1 = df. iloc [:6] df2 = df. iloc [6:] Gli...
La distribuzione esponenziale è una distribuzione di probabilità utilizzata per modellare il tempo che dobbiamo aspettare prima che si verifichi un determinato evento. Se una variabile casuale X segue una distribuzione esponenziale, allora la funzione di densità cumulativa di X può...
È possibile utilizzare la seguente sintassi di base per eseguire un CERCA.VERT (simile a Excel) in panda: p.d. merge (df1, df2, on = ' column_name ', how = ' left ') Il seguente esempio passo passo mostra come utilizzare questa sintassi...
Una matrice di grafici a dispersione è esattamente ciò che sembra: una matrice di grafici a dispersione. Questo tipo di matrice è utile perché consente di visualizzare contemporaneamente la relazione tra più variabili in un set di dati. Puoi utilizzare la...