Statorials

ヒストグラムを比較する方法 (例付き)

ヒストグラムは、一連のデータ内の値の分布を視覚化できるグラフの一種です。 X 軸はデータセットの値を示し、Y 軸は各値の頻度を示します。ヒストグラムは、データセット内の値の分布をすぐに理解できるため便利です。 2 つの […]...

マシューズ相関係数(MCC) は、分類モデルのパフォーマンスを評価するために使用できる指標です。次のように計算されます。 MCC = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)( […]...

列に特定の文字列が含まれている場合は、 dplyrで次の基本構文を使用して変数を変更できます。 library (dplyr) df %>% mutate_at(vars(contains(' starter ') […]...

ヒストグラムは、データセット内の値の分布をすばやく視覚化するために使用できるプロットです。このチュートリアルでは、Google スプレッドシートでヒストグラムを作成し、ボックスの数を変更してヒストグラムが希望通りになる […]...

トリミング平均は、データセット内の最小値と最大値の特定の割合を削除した後に計算されたデータセットの平均です。たとえば、10% トリミング平均は、データセットの端から 10% の値を削除した後のデータセットの平均 […]...

トリミング平均は、データセット内の最小値と最大値の特定の割合を削除した後に計算されたデータセットの平均です。たとえば、10% トリミング平均は、データセットの端から上位 10% の値を削除した後のデータセットの […]...

R プログラミング言語では、 data.frame はR データベースの一部です。 data.tableパッケージのsetDF関数を使用して、任意のdata.frameをdata.tableに変換できます。 data.t […]...

線形回帰モデルでは、回帰係数によって、予測変数の 1 単位の増加に関連する応答変数の平均変化がわかります。次の式を使用して、回帰係数の信頼区間を計算できます。 β 1の信頼区間: b 1 ± t 1-α/2, n-2 […]...

多くの場合、文字列と変数を R の同じ行に出力したいことがあります。幸いなことに、これはprint()関数とpast0()関数を使用して簡単に実行できます。次の例は、これを行う方法を示しています。例: R で文字列 […]...

機械学習で最も一般的に使用されるクラスタリングアルゴリズムの 1 つは、 k-means クラスタリングとして知られています。 K 平均法クラスタリングは、データセットの各観測値をK個のクラスターの 1 つに配置する手 […]...