Pandas: csv ファイルから特定の行のみを読み取る方法
次の基本構文を使用して、CSV ファイルから特定の行のみを pandas DataFrame に読み取ることができます。
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
この特定の例では、 my_data.csvという CSV ファイルからインデックス位置 0、2、および 3 の行を pandas DataFrame に読み取ります。
次の例は、この構文を実際に使用する方法を示しています。
例: Pandas で CSV ファイルから特定の行のみを読み取ります
Basketball_data.csvという次の CSV ファイルがあるとします。
read_csv()関数を使用すると、パンダは CSV ファイルの各行を DataFrame に自動的にインポートします。
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
ただし、次の構文を使用して、インデックス位置 0、2、および 3 の行のみを CSV ファイルから pandas DataFrame にインポートできます。
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
CSV ファイルのインデックス位置 0、2、および 3 の行のみが DataFrame にインポートされることに注意してください。
この構文は、 skiprows引数とラムダ関数を使用して、CSV ファイルをインポートするときにスキップすべき行をパンダに指示します。
この例では、CSV ファイルをインポートするときに、インデックス位置 0、2、および 3 の行を無視せず、他のすべての行を無視するようにパンダに指示しています。
注: pandas read_csv()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的なタスクを実行する方法について説明します。
Pandas: CSV ファイルを読み取るときに行をスキップする方法
パンダ: 既存の CSV ファイルにデータを追加する方法
Pandas: CSV ファイルをインポートするときにタイプを指定する方法
Pandas: CSV ファイルをインポートするときに列名を設定する方法