Pandas で tsv ファイルを読み取る方法 (例を含む)


Python のパンダで TSV ファイルを読み取るには、次の基本構文を使用できます。

 df = pd. read_csv (" data.txt ", sep=" \t ")

このチュートリアルでは、この関数の実際の使用例をいくつか紹介します。

ヘッダー付きのTSVファイルを読み取る

data.txtというヘッダーを持つ次の TSV ファイルがあるとします。

このファイルを pandas DataFrame に読み取るには、次の構文を使用できます。

 import pandas as pd

#read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ")

#view DataFrame
print (df)

	column1 column2
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

次の構文を使用して、DataFrame クラスを出力し、行と列の数を確認できます。

 #display class of DataFrame
print (type(df))

<class 'pandas.core.frame.DataFrame'>

#display number of rows and columns in DataFrame
df. shape

(10, 2)

df は10 行 2 列の pandas DataFrame であることがわかります。

ヘッダーなしの TSV ファイルを読み取る

ヘッダーのないdata.txtという次の TSV ファイルがあるとします。

このファイルを pandas DataFrame に読み取るには、次の構文を使用できます。

 #read TSV file into pandas DataFrame
df = pd. read_csv (" data.txt ", sep=" \t ", header= None )

#view DataFrame
print (df)

        0 1
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

テキスト ファイルにはヘッダーがなかったため、パンダは単に列に01という名前を付けました。

ヘッダーなしの TSV ファイルを読み取り、列名を指定します

必要に応じて、テキスト ファイルをインポートするときに、 names引数を使用して列名を割り当てることができます。

 #read TSV file into pandas DataFrame and specify column names
df = pd. read_csv (" data.txt ", sep=" \t ", header= None, names=[" A ", " B "] )

#display DataFrame
print (df)

	A B
0 1 4
1 3 4
2 2 5
3 7 9
4 9 1
5 6 3
6 5 7
7 8 8
8 3 1
9 4 9

追加リソース

次のチュートリアルでは、パンダを使用して他のファイル タイプを読み取る方法を説明します。

Pandasでテキストファイルを読み取る方法
PandasでCSVファイルを読み取る方法
Pandas で Excel ファイルを読み取る方法
Pandas で JSON ファイルを読み取る方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です