主成分分析 (PCA と略されることも多い) は、データセット内の変動の大部分を説明する主成分 (元の予測子の線形結合) を見つけようとする教師なし機械学習手法です。 PCA の目標は、元のデータ セットよりも少ない変数 […]...
一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。 ANOVA 表全体のp 値が一定の有意性レベルを下回っている場合、グループ平均の少なくとも 1 つ […]...
一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。 ANOVA 表全体のp 値が一定の有意性レベルを下回っている場合、グループ平均の少なくとも 1 つ […]...
NumPy 配列を新しい列として pandas DataFrame に追加したい場合があります。 幸いなことに、これは次の構文を使用して簡単に行うことができます。 df[' new_column '] = array_n […]...
クラスタリングは、データセット内の観測値のグループを見つけようとする機械学習手法です。 目標は、各クラスター内の観測値が互いに非常に類似している一方で、異なるクラスター内の観測値が互いに大きく異なるようなクラスターを見つ […]...
分散は、データ値が平均の周囲にどの程度分散しているかを測定する方法です。 母集団の分散を求める公式は次のとおりです。 σ 2 = Σ (x i – μ) 2 / N ここで、μ は母集団の平均、x iは母集団の i番目の […]...
クラスタリングは、データセット内で観察のグループまたはクラスターを見つけようとする機械学習手法です。 目標は、各クラスター内の観測値が互いに非常に類似している一方で、異なるクラスター内の観測値が互いに大きく異なるようなク […]...
スチューデント残差は、単に残差をその推定標準偏差で割ったものです。 実際には、一般に、データセット内のスチューデント残差が絶対値 3 より大きい観測値は外れ値であると言われます。 MASS パッケージのstudres() […]...
スチューデント残差は、単に残差をその推定標準偏差で割ったものです。 実際には、一般に、データセット内のスチューデント残差が絶対値 3 より大きい観測値は外れ値であると言われます。 Python では、次の構文を使用する […]...
ボックス コックス変換は、非正規分布のデータ セットをより正規分布のセットに変換するために一般的に使用される方法です。 この方法の基本的な考え方は、次の式を使用して、変換されたデータができるだけ正規分布に近づくような λ […]...