Statorials

R でワンホットエンコーディングを行う方法

ワンホットエンコーディングは、カテゴリ変数を機械学習アルゴリズムで使用できる形式に変換するために使用されます。ワンホットコーディングの基本的な考え方は、元のカテゴリ値を表す値 0 と 1 を取る新しい変数を作成する […]...

ポリコリック相関は、順序変数間の相関を計算するために使用されます。順序変数は、取り得る値がカテゴリカルであり、自然な順序を持つ変数であることを思い出してください。以下に、順序スケールで測定される変数の例をいくつか示し […]...

ロジスティック回帰は、応答変数が 2 値である場合に、1 つ以上の予測変数と応答変数の間の関係を理解するために使用できる回帰モデルの一種です。予測変数と応答変数が 1 つだけの場合は、次の式を使用して変数間の関係を推定 […]...

フィッシャーの直接確率検定は、 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。これは通常、2 × 2 テーブル内の 1 つ以上のセル数が 5 未満である場合に、独立性のカイ二乗検定の代替 […]...

次の基本構文を使用して、基本 R プロットの軸間隔を変更できます。 #create plot with no axis intervals plot(x, y, xaxt=' n ', yaxt=' n ') #spec […]...

ggplot2 のtheme()引数を使用して、プロットのマージン領域を変更できます。 ggplot(df, aes(x=x)) + geom_histogram() + theme(plot. margin =unit […]...

R のlubridateパッケージの次の関数を使用すると、曜日をすばやく見つけることができます。方法 1: 曜日を数値で確認する (週が日曜日から始まると仮定) wday(df$date_column) 方法 2: 曜 […]...

多くの統計テストは、データセットが正規分布していることを前提としています。 R でこの仮定を確認するには、次の 4 つの一般的な方法があります。 1. (視覚的方法) ヒストグラムを作成します。ヒストグラムがほぼ「ベル […]...

Cramer’s V は、 2 つの名目変数間の関連の強さの尺度です。 0 から 1 まで変化します。 0 は、 2 つの変数間に関連性がないことを示します。 1 は、 2 つの変数間の完全な関連性を示します […]...

回帰勾配の標準誤差は、回帰勾配を推定する際の「不確実性」を測定する方法です。次のように計算されます。金： n : 合計サンプルサイズ y i : 応答変数の実数値 ŷ i : 応答変数の予測値 x i : 予測変数の […]...