次の基本構文を使用して、dplyr で変数をグループ化できます。 df %>% arrange (group_var, numeric_var) %>% group_by (group_var) %>% […]...
次の基本構文を使用して、R の条件に基づいて列を合計できます。 #sum values in column 3 where col1 is equal to 'A' sum(df[ which (df$col1==' A […]...
統計では、ガンマ分布は待ち時間に関連する確率をモデル化するためによく使用されます。 次の関数を使用して、R でガンマ分布を操作できます。 dgamma(x, 形状, レート) – 特定の形状パラメータとレートパラメータを […]...
二項分布は、固定試行回数にわたって特定の数の「成功」が発生する確率をモデル化するために使用される確率分布です。 次の 3 つの前提が満たされる場合、二項分布の使用が適切です。 仮定 1: 各トライアルでは、考えられる結果 […]...
ドット プロットは、積み重ねられた点を使用してデータ セット内の値の頻度を表示するプロットの一種です。 ドット プロットを作成するときは、中心と分布を定量化したいことがよくあります。 Center : データセットの中心 […]...
ヒストグラムは、一連のデータ内の値の分布を視覚化できるグラフの一種です。 X 軸はデータセットの値を示し、Y 軸は各値の頻度を示します。 データセット内の値に応じて、ヒストグラムはさまざまな形状になります。 次の例は、さ […]...
外れ値とは、データセット内の他の値から異常に離れている観測値です。 多くの場合、観測値が第 3 四分位より上の四分位範囲の 1.5 倍、または第 1 四分位より下の四分位範囲の 1.5 倍である場合、その観測値は外れ値と […]...
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。 信頼区間を報告するときは、常に次の形式を使用します。 95% CI [LL、UL] 金 LL : 信頼区間の下限 UL : 信頼区間の上 […]...
R で発生する可能性のある警告メッセージは次のとおりです。 Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred この警告は […]...
統計や機械学習では、値の範囲が 0 から 1 の間になるように変数を正規化することがよくあります。 変数を正規化する最も一般的な理由は、ある種の多変量解析を実行しているとき (つまり、複数の予測変数と 1 つの応答変数の […]...