パンダ: csv ファイルをインポートするときに最初の列を無視する
次の基本構文を使用すると、CSV ファイルを pandas DataFrame にインポートするときに最初の列を無視できます。
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
この特定の例では、最初の列を除く、 basketball_data.csvという CSV ファイルの各列を pandas DataFrame に読み取ります。
このコードを使用して、まず CSV ファイル内の列数を見つけて、それをncolsという変数に割り当てます。
次に、 usecols引数を使用して、CSV ファイルの 1 (つまり 2 番目の列) と最後の列の間の列のみをインポートすることを指定します。
次の例は、この構文を実際に使用する方法を示しています。
例: CSV ファイルを Pandas にインポートするときに最初の列を無視する
Basketball_data.csvという次の CSV ファイルがあるとします。
次の構文を使用して CSV ファイルをパンダ データフレームにインポートし、最初の列を無視できます。
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
CSV ファイルをパンダにインポートしたときに、 teamという最初の列が削除されたことに注意してください。
CSV ファイル内の列の合計数が事前にわかっている場合は、この値をusecols引数に直接指定できることに注意してください。
たとえば、CVS ファイルに 3 つの列があることがすでにわかっているとします。
次の構文を使用して CSV ファイルをパンダ データフレームにインポートし、最初の列を無視できます。
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
CSV ファイルをパンダにインポートしたときに、 teamという最初の列が削除されたことに注意してください。
CSV ファイルには 3 つの列があることがすでにわかっていたため、 usecols引数でrange(1,3)を使用しただけです。
注: pandas read_csv()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的なタスクを実行する方法について説明します。
Pandas: CSV ファイルを読み取るときに行をスキップする方法
パンダ: 既存の CSV ファイルにデータを追加する方法
パンダ: usecols 引数を指定して read_csv を使用する方法