R は、データを操作するための最も人気のあるプログラミング言語の 1 つです。ただし、データを操作する前に、データを実際に R にインポートする必要があります。 データがすでに CSV または Excel ファイルにある […]...
正規分布は、すべての統計で最も一般的に使用される分布であり、対称で釣鐘型であることが知られています。 密接に関連した分布はt 分布です。これも対称で釣鐘型ですが、正規分布よりも重い「尾部」を持っています。 言い換えると、 […]...
ほとんどの教師あり機械学習アルゴリズムは、線形回帰、 ロジスティック回帰、リッジ回帰などの単一の予測モデルの使用に基づいています。 ただし、 バギングやランダム フォレストなどの方法では、元のデータセットの繰り返しブート […]...
統計では、特定の研究上の疑問に答えるためにデータを収集することがよくあります。 たとえば、次のような質問に答えたいと思うかもしれません。 1.フロリダ州マイアミの世帯収入の中央値はいくらですか? 2.特定のカメの個体群の […]...
場合によっては、Python の pandas DataFrame からインデックス列を削除したい場合があります。 pandas DataFrame と Series には常にインデックスがあるため、実際にインデックスを […]...
ブースティングは、高い予測精度のモデルを生成することが証明されている機械学習手法です。 実際にブースティングを実装する最も一般的な方法の 1 つは、「extreme gradient boosting」の略称であるXGB […]...
統計では、次のような質問に答えたいことがよくあります。 ある都市の平均世帯収入はいくらですか? 特定の種のカメの平均体重はどれくらいですか? 大学フットボールの試合の平均入場者数はどれくらいですか? 各シナリオでは、測定 […]...
ピアソン相関係数は、 2 つの変数間の線形関連を測定します。 常に -1 から 1 までの値を取ります。 -1 は、2 つの変数間の完全な負の線形相関を示します。 0 は 2 つの変数間に線形相関がないことを示します 1 […]...
データセット内の値を 0 から 100 の間で正規化するには、次の式を使用できます。 z i = (x i – 最小(x)) / (最大(x) – 最小(x)) * 100 金: z i :データセット内のi 番目の正規 […]...
統計学における観測とは、単に測定したものの発生を指します。 たとえば、特定の種類のカメの体重を測定しているとします。体重を収集した各カメは 1 つの観測値としてカウントされます。 次のデータセットには 15 匹の異なるカ […]...