カテゴリー: ガイド
description()関数を使用すると、pandas DataFrame 内の変数の記述統計を生成できます。 次の基本構文を使用して、pandas の groupby( ) 関数とともに description () […]...
xarrayモジュールを使用すると、3D pandas DataFrame をすばやく作成できます。 このチュートリアルでは、xarray モジュール関数を使用して次の pandas 3D DataFrame を作成する […]...
Z スコアから確率を見つける最も簡単な方法は、Z テーブル内の Z スコアに対応する確率を単純に見つけることです。 このチュートリアルでは、z テーブルを使用して次の確率を見つける方法について説明します。 値が特定の Z […]...
平均は、一連のデータの平均値を表します。 次のように計算されます。 サンプル平均 = Σx i / n 金: Σ: 「和」を意味する記号 x i :データセット内の i番目の観測値 n:データセット内の観測値の総数 標準 […]...
機械学習で最も一般的なクラスタリング アルゴリズムの 1 つは、k-means クラスタリングとして知られています。 K 平均法クラスタリングは、データセットの各観測値をK個のクラスターの 1 つに配置する手法です。 最 […]...
次のメソッドを使用すると、pandas query()関数でLIKE (SQL と同様) を使用して、特定のパターンを含む行を検索できます。 方法 1: パターンを含む行を検索する df. query (' my_col […]...
次のメソッドを使用して、pandas DataFrame の列値の分布をプロットできます。 方法 1: 列内の値の分布をプロットする df[' my_column ']. plot (kind=' kde ') 方法 2 […]...
次のメソッドを使用して、浮動小数点の NumPy 配列を整数の配列に変換できます。 方法 1: 浮動小数点数を整数に変換する (切り捨て) rounded_down_integer_array = float_array […]...
箱ひげ図は、データ セットの 5 桁の概要を表示するプロットの一種で、次のものが含まれます。 最小値 最初の四分位数 (25 パーセンタイル) 中央値 第 3 四分位数 (75 パーセンタイル) 最大値 箱ひげ図を作成す […]...
統計学では、多次元スケーリングは、抽象的なデカルト空間 (通常は 2D 空間) 内のデータ セット内の観察の類似性を視覚化する方法です。 R で多次元スケーリングを実行する最も簡単な方法は、次の基本構文を使用する組み込み […]...