カテゴリー: ガイド
場合によっては、Python の pandas DataFrame からインデックス列を削除したい場合があります。 pandas DataFrame と Series には常にインデックスがあるため、実際にインデックスを […]...
ブースティングは、高い予測精度のモデルを生成することが証明されている機械学習手法です。 実際にブースティングを実装する最も一般的な方法の 1 つは、「extreme gradient boosting」の略称であるXGB […]...
統計では、次のような質問に答えたいことがよくあります。 ある都市の平均世帯収入はいくらですか? 特定の種のカメの平均体重はどれくらいですか? 大学フットボールの試合の平均入場者数はどれくらいですか? 各シナリオでは、測定 […]...
ピアソン相関係数は、 2 つの変数間の線形関連を測定します。 常に -1 から 1 までの値を取ります。 -1 は、2 つの変数間の完全な負の線形相関を示します。 0 は 2 つの変数間に線形相関がないことを示します 1 […]...
データセット内の値を 0 から 100 の間で正規化するには、次の式を使用できます。 z i = (x i – 最小(x)) / (最大(x) – 最小(x)) * 100 金: z i :データセット内のi 番目の正規 […]...
統計学における観測とは、単に測定したものの発生を指します。 たとえば、特定の種類のカメの体重を測定しているとします。体重を収集した各カメは 1 つの観測値としてカウントされます。 次のデータセットには 15 匹の異なるカ […]...
主成分分析 (PCA と略されることも多い) は、データセット内の変動の大部分を説明する主成分 (元の予測子の線形結合) を見つけようとする教師なし機械学習手法です。 PCA の目標は、元のデータ セットよりも少ない変数 […]...
一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。 ANOVA 表全体のp 値が一定の有意性レベルを下回っている場合、グループ平均の少なくとも 1 つ […]...
一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。 ANOVA 表全体のp 値が一定の有意性レベルを下回っている場合、グループ平均の少なくとも 1 つ […]...
NumPy 配列を新しい列として pandas DataFrame に追加したい場合があります。 幸いなことに、これは次の構文を使用して簡単に行うことができます。 df[' new_column '] = array_n […]...