Pandas で tsv ファイルを読み取る方法 (例を含む)
Python のパンダで TSV ファイルを読み取るには、次の基本構文を使用できます。
df = pd. read_csv (" data.txt ", sep=" \t ")
このチュートリアルでは、この関数の実際の使用例をいくつか紹介します。
ヘッダー付きのTSVファイルを読み取る
data.txtというヘッダーを持つ次の TSV ファイルがあるとします。
このファイルを pandas DataFrame に読み取るには、次の構文を使用できます。
import pandas as pd #read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ") #view DataFrame print (df) column1 column2 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
次の構文を使用して、DataFrame クラスを出力し、行と列の数を確認できます。
#display class of DataFrame print (type(df)) <class 'pandas.core.frame.DataFrame'> #display number of rows and columns in DataFrame df. shape (10, 2)
df は10 行 2 列の pandas DataFrame であることがわかります。
ヘッダーなしの TSV ファイルを読み取る
ヘッダーのないdata.txtという次の TSV ファイルがあるとします。
このファイルを pandas DataFrame に読み取るには、次の構文を使用できます。
#read TSV file into pandas DataFrame df = pd. read_csv (" data.txt ", sep=" \t ", header= None ) #view DataFrame print (df) 0 1 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
テキスト ファイルにはヘッダーがなかったため、パンダは単に列に0と1という名前を付けました。
ヘッダーなしの TSV ファイルを読み取り、列名を指定します
必要に応じて、テキスト ファイルをインポートするときに、 names引数を使用して列名を割り当てることができます。
#read TSV file into pandas DataFrame and specify column names df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] ) #display DataFrame print (df) A B 0 1 4 1 3 4 2 2 5 3 7 9 4 9 1 5 6 3 6 5 7 7 8 8 8 3 1 9 4 9
追加リソース
次のチュートリアルでは、パンダを使用して他のファイル タイプを読み取る方法を説明します。
Pandasでテキストファイルを読み取る方法
PandasでCSVファイルを読み取る方法
Pandas で Excel ファイルを読み取る方法
Pandas で JSON ファイルを読み取る方法