パンダ: csv ファイルをインポートするときに最初の列を無視する


次の基本構文を使用すると、CSV ファイルを pandas DataFrame にインポートするときに最初の列を無視できます。

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

この特定の例では、最初の列を除く、 basketball_data.csvという CSV ファイルの各列を pandas DataFrame に読み取ります。

このコードを使用して、まず CSV ファイル内の列数を見つけて、それをncolsという変数に割り当てます。

次に、 usecols引数を使用して、CSV ファイルの 1 (つまり 2 番目の列) と最後の列の間の列のみをインポートすることを指定します。

次の例は、この構文を実際に使用する方法を示しています。

例: CSV ファイルを Pandas にインポートするときに最初の列を無視する

Basketball_data.csvという次の CSV ファイルがあるとします。

次の構文を使用して CSV ファイルをパンダ データフレームにインポートし、最初の列を無視できます。

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

CSV ファイルをパンダにインポートしたときに、 teamという最初の列が削除されたことに注意してください。

CSV ファイル内の列の合計数が事前にわかっている場合は、この値をusecols引数に直接指定できることに注意してください。

たとえば、CVS ファイルに 3 つの列があることがすでにわかっているとします。

次の構文を使用して CSV ファイルをパンダ データフレームにインポートし、最初の列を無視できます。

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

CSV ファイルをパンダにインポートしたときに、 teamという最初の列が削除されたことに注意してください。

CSV ファイルには 3 つの列があることがすでにわかっていたため、 usecols引数でrange(1,3)を使用しただけです。

: pandas read_csv()関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、Python で他の一般的なタスクを実行する方法について説明します。

Pandas: CSV ファイルを読み取るときに行をスキップする方法
パンダ: 既存の CSV ファイルにデータを追加する方法
パンダ: usecols 引数を指定して read_csv を使用する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です