カテゴリー: ガイド
クラスタリングは、データセット内の観測値のグループを見つけようとする機械学習手法です。 目標は、各クラスター内の観測値が互いに非常に類似している一方で、異なるクラスター内の観測値が互いに大きく異なるようなクラスターを見つ […]...
分散は、データ値が平均の周囲にどの程度分散しているかを測定する方法です。 母集団の分散を求める公式は次のとおりです。 σ 2 = Σ (x i – μ) 2 / N ここで、μ は母集団の平均、x iは母集団の i番目の […]...
クラスタリングは、データセット内で観察のグループまたはクラスターを見つけようとする機械学習手法です。 目標は、各クラスター内の観測値が互いに非常に類似している一方で、異なるクラスター内の観測値が互いに大きく異なるようなク […]...
スチューデント残差は、単に残差をその推定標準偏差で割ったものです。 実際には、一般に、データセット内のスチューデント残差が絶対値 3 より大きい観測値は外れ値であると言われます。 MASS パッケージのstudres() […]...
スチューデント残差は、単に残差をその推定標準偏差で割ったものです。 実際には、一般に、データセット内のスチューデント残差が絶対値 3 より大きい観測値は外れ値であると言われます。 Python では、次の構文を使用する […]...
ボックス コックス変換は、非正規分布のデータ セットをより正規分布のセットに変換するために一般的に使用される方法です。 この方法の基本的な考え方は、次の式を使用して、変換されたデータができるだけ正規分布に近づくような λ […]...
2 つのベクトルAとBの間のマンハッタン距離は次のように計算されます。 Σ|a i – b i | ここで、 iは各ベクトルの i番目の要素です。 この距離は、任意の 2 つのベクトル間の非類似性を測定するために使用され […]...
2 つのベクトルAとBの間のミンコフスキー距離は次のように計算されます。 (Σ|a i – b i | p ) 1/p ここで、 iは各ベクトルの i番目の要素、 pは整数です。 この距離は、任意の 2 つのベクトル間の […]...
R で回帰分析またはANOVAを実行すると、出力テーブルには、分析で使用された変数の p 値と、対応する有意性コードが含まれます。 これらの有意性コードは、変数が統計的に有意である場合、一連の星印または小数点として表示さ […]...
R で線形回帰モデルを当てはめるには、 lm()コマンドを使用できます。 回帰モデルの出力を表示するには、 summary()コマンドを使用します。 このチュートリアルでは、R の回帰出力の各値を解釈する方法について説明 […]...