外れ値とは、データセット内の他の値から異常に離れている観測値です。外れ値は分析結果に影響を与える可能性があるため、問題となる場合があります。 このチュートリアルでは、Python で外れ値を特定して削除する方法を説明しま […]...
マハラノビス距離は、多変量空間内の 2 点間の距離です。複数の変数を含む統計分析で外れ値を検出するためによく使用されます。 このチュートリアルでは、Python でマハラノビス距離を計算する方法を説明します。 例: Py […]...
二項分布は、統計で最もよく使用される分布の 1 つです。これは、 n回の二項実験でk 回の成功が得られる確率を表します。 確率変数X が二項分布に従う場合、 X = kが成功する確率は次の式で求められます。 P(X=k) […]...
オジーブは、データセット内の特定の値を上回るまたは下回るデータ値の数を示すグラフです。このチュートリアルでは、Python で弾頭を作成する方法を説明します。 例: Python で Ogive を作成する方法 Pyth […]...
平均絶対パーセント誤差 (MAPE) は、モデルの予測精度を測定するために一般的に使用されます。次のように計算されます。 MAPE = (1/n) * Σ(|実際 – 予測| / |実際|) * 100 金: Σ – 「 […]...
平均二乗誤差 (MSE) は、モデルの予測精度を測定する一般的な方法です。次のように計算されます。 MSE = (1/n) * Σ(実際 – 予測) 2 金: Σ – 「和」を意味する派手な記号 n – サンプルサイズ […]...
「ベル カーブ」は、正規分布の形状に付けられたニックネームで、明確な「ベル」形状を持っています。 このチュートリアルでは、Python でベル カーブを作成する方法を説明します。 Python でベルカーブを作成する方法 […]...
統計におけるグループ化とは、数値をグループに分類するプロセスです。 クラスタリングの最も一般的な形式は等幅クラスタリングとして知られており、データセットを等しい幅のk個のグループに分割します。 あまり一般的には使用されな […]...
5 週間にわたって特定の店舗で曜日ごとに行われた販売数を表示する、Python の次のデータセットがあるとします。 import numpy as np import pandas as pd import seabor […]...
人口ピラミッドは、特定の人口の年齢と性別の分布を示すグラフです。これは、人口構成や人口増加傾向を理解するのに役立ちます。 このチュートリアルでは、Python で次の人口ピラミッドを作成する方法を説明します。 Pytho […]...