Pandas: csv ファイルをインポートするときに列名を設定する
CSV ファイルをパンダにインポートするときに、次の基本構文を使用して DataFrame の列名を定義できます。
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
names引数には、DataFrame 内の列に使用する名前のリストを受け取ります。
この引数を使用すると、CSV ファイルの最初の行をヘッダー行として使用するのではなく、DataFrame の最初の行として使用するようにパンダに指示することになります。
次の例は、この構文を実際に使用する方法を示しています。
例: CSV ファイルを Pandas にインポートするときに列名を設定する
Players_data.csvという次の CSV ファイルがあるとします。
ファイルから、最初の行には列名が含まれていないことがわかります。
read_csv()関数を使用して CSV ファイルをインポートすると、パンダは最初の行の値を DataFrame の列名として使用しようとします。
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
ただし、CSV ファイルをインポートするときに、 names引数を使用して独自の列名を指定できます。
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
CSV ファイルの最初の行はヘッダー行として使用されないことに注意してください。
代わりに、 names引数を使用して指定した列名が列名として使用されるようになりました。
注: pandas read_csv()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的なタスクを実行する方法について説明します。
Pandas: CSV ファイルを読み取るときに行をスキップする方法
パンダ: 既存の CSV ファイルにデータを追加する方法
パンダ: usecols 引数を指定して read_csv を使用する方法