ガイド - Statorials

パンダ: グループごとに description() を使用する方法

description()関数を使用すると、pandas DataFrame 内の変数の記述統計を生成できます。次の基本構文を使用して、pandas の groupby( ) 関数とともに description () […]...

xarrayモジュールを使用すると、3D pandas DataFrame をすばやく作成できます。このチュートリアルでは、xarray モジュール関数を使用して次の pandas 3D DataFrame を作成する […]...

Z スコアから確率を見つける最も簡単な方法は、Z テーブル内の Z スコアに対応する確率を単純に見つけることです。このチュートリアルでは、z テーブルを使用して次の確率を見つける方法について説明します。値が特定の Z […]...

平均は、一連のデータの平均値を表します。次のように計算されます。サンプル平均 = Σx i / n 金： Σ：「和」を意味する記号 x i :データセット内の i番目の観測値 n:データセット内の観測値の総数標準 […]...

機械学習で最も一般的なクラスタリングアルゴリズムの 1 つは、k-means クラスタリングとして知られています。 K 平均法クラスタリングは、データセットの各観測値をK個のクラスターの 1 つに配置する手法です。最 […]...

次のメソッドを使用すると、pandas query()関数でLIKE (SQL と同様) を使用して、特定のパターンを含む行を検索できます。方法 1: パターンを含む行を検索する df. query (' my_col […]...

次のメソッドを使用して、pandas DataFrame の列値の分布をプロットできます。方法 1: 列内の値の分布をプロットする df[' my_column ']. plot (kind=' kde ') 方法 2 […]...

次のメソッドを使用して、浮動小数点の NumPy 配列を整数の配列に変換できます。方法 1: 浮動小数点数を整数に変換する (切り捨て) rounded_down_integer_array = float_array […]...

箱ひげ図は、データセットの 5 桁の概要を表示するプロットの一種で、次のものが含まれます。最小値最初の四分位数 (25 パーセンタイル) 中央値第 3 四分位数 (75 パーセンタイル) 最大値箱ひげ図を作成す […]...

統計学では、多次元スケーリングは、抽象的なデカルト空間 (通常は 2D 空間) 内のデータセット内の観察の類似性を視覚化する方法です。 R で多次元スケーリングを実行する最も簡単な方法は、次の基本構文を使用する組み込み […]...