Come risolvere il problema: l'input contiene nan, infinito o un valore troppo grande per dtype ("float64")

Di Benjamin anderson Luglio 16, 2023 Guida 0 commenti

Un errore comune che potresti riscontrare quando usi Python è:

 ValueError: Input contains infinity or a value too large for dtype('float64').

Questo errore di solito si verifica quando si tenta di utilizzare una funzione dal modulo scikit-learn, ma il DataFrame o la matrice che si sta utilizzando come input ha valori NaN o valori infiniti.

L’esempio seguente mostra come risolvere questo errore nella pratica.

Come riprodurre l’errore

Supponiamo di avere i seguenti panda DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' x1 ': [1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4],
                   ' x2 ': [1, 3, 3, 5, 2, 2, 1, np.inf, 0, 3, 4],
                   ' y ': [np.nan, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90]})

#view DataFrame
print (df)

    x1 x2 y
0 1 1.0 NaN
1 2 3.0 78.0
2 2 3.0 85.0
3 4 5.0 88.0
4 2 2.0 72.0
5 1 2.0 69.0
6 5 1.0 94.0
7 4 lower 94.0
8 2 0.0 88.0
9 4 3.0 92.0
10 4 4.0 90.0

Supponiamo ora di provare ad adattare un modello di regressione lineare multipla utilizzando le funzioni scikit-learn :

 from sklearn. linear_model import LinearRegression

#initiate linear regression model
model = LinearRegression()

#define predictor and response variables
x, y = df[[' x1 ', ' x2 ']], df. y

#fit regression model
model. fit (x,y)

#print model intercept and coefficients
print (model. intercept_ , model. coef_ )

ValueError: Input contains infinity or a value too large for dtype('float64').

Stiamo ricevendo un errore perché il DataFrame che stiamo utilizzando ha sia valori infiniti che NaN.

Come correggere l’errore

Il modo per risolvere questo errore è rimuovere prima tutte le righe dal DataFrame che contengono valori infiniti o NaN:

 #remove rows with any values that are not finite
df_new = df[np. isfinite (df). all ( 1 )]

#view updated DataFrame
print (df_new)

    x1 x2 y
1 2 3.0 78.0
2 2 3.0 85.0
3 4 5.0 88.0
4 2 2.0 72.0
5 1 2.0 69.0
6 5 1.0 94.0
8 2 0.0 88.0
9 4 3.0 92.0
10 4 4.0 90.0

Le due linee con valori infiniti o NaN sono state rimosse.

Possiamo ora procedere con l’adattamento del nostro modello di regressione lineare:

 from sklearn. linear_model import LinearRegression

#initiate linear regression model
model = LinearRegression()

#define predictor and response variables
x, y = df_new[[' x1 ', ' x2 ']], df_new. y

#fit regression model
model. fit (x,y)

#print model intercept and coefficients
print (model. intercept_ , model. coef_ )

69.85144124168515 [5.72727273 -0.93791574]

Tieni presente che questa volta non riceviamo alcun errore perché prima abbiamo rimosso le righe con valori infiniti o NaN dal DataFrame.

Risorse addizionali

I seguenti tutorial spiegano come correggere altri errori comuni in Python:

Come risolvere il problema in Python: l’oggetto ‘numpy.ndarray’ non è richiamabile
Come risolvere il problema: TypeError: l’oggetto “numpy.float64” non è richiamabile
Come risolvere il problema: Errore di tipo: oggetto stringa o byte previsto

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più

Come riprodurre l’errore

Come correggere l’errore

Risorse addizionali

Informazioni sull'autore

Benjamin anderson

Aggiungi un commento