カテゴリー: ガイド
68-95-99.7 ルールとも呼ばれる経験則では、正規分布を持つ特定のデータ セットについて次のように述べられています。 データ値の68% は平均値の 1 標準偏差以内にあります。 データ値の95% は平均値の 2 標 […]...
連続数値変数間の相関を計算するには、 ピアソン相関係数をよく使用します。 ただし、カテゴリカル変数、つまり次のような名前またはラベルを持つ変数間の相関を計算するには、別のメトリックを使用する必要があります。 婚姻状況(独 […]...
ワンホット エンコーディングは、カテゴリ変数を機械学習アルゴリズムで簡単に使用できる形式に変換するために使用されます。 ワンホット コーディングの基本的な考え方は、元のカテゴリ値を表す値 0 と 1 を取る新しい変数を作 […]...
次の基本構文を使用して、Python のSeabornデータ視覚化ライブラリでサブプロットを作成できます。 #define dimensions of subplots (rows, columns) fig, axes […]...
次の基本構文を使用して、pandas の日付から月を抽出できます。 df[' month '] = pd. DatetimeIndex (df[' date_column ']). month 次の例は、この関数を実際に […]...
多くの統計テストは、データセットが正規分布していることを前提としています。ただし、実際にはそうではないことがよくあります。 この問題を解決する 1 つの方法は、次の 3 つの変換のいずれかを使用してデータ セット内の値の […]...
ワンホット エンコーディングは、カテゴリ変数を機械学習アルゴリズムで使用できる形式に変換するために使用されます。 ワンホット コーディングの基本的な考え方は、元のカテゴリ値を表す値 0 と 1 を取る新しい変数を作成する […]...
ポリコリック相関は、順序変数間の相関を計算するために使用されます。 順序変数は、取り得る値がカテゴリカルであり、自然な順序を持つ変数であることを思い出してください。 以下に、順序スケールで測定される変数の例をいくつか示し […]...
ロジスティック回帰は、応答変数が 2 値である場合に、1 つ以上の予測変数と応答変数の間の関係を理解するために使用できる回帰モデルの一種です。 予測変数と応答変数が 1 つだけの場合は、次の式を使用して変数間の関係を推定 […]...
フィッシャーの直接確率検定は、 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。 これは通常、2 × 2 テーブル内の 1 つ以上のセル数が 5 未満である場合に、独立性のカイ二乗検定の代替 […]...