カテゴリー: ガイド
学生が統計でよく混同する 2 つの用語は、標準誤差と誤差範囲です。 標準誤差は、母集団平均の推定値の精度を測定します。次のように計算されます。 標準誤差 = s / √n 金: s:サンプルの標準偏差 n:サンプルサイズ […]...
ペア プロットは、データ セット内の異なる変数間のペア関係を理解できるようにする散布図行列です。 幸いなことに、 pairs()関数を使用すると、R でペア プロットを簡単に作成できます。このチュートリアルでは、この関数 […]...
二項分布は、 n回の二項実験でk回の成功が得られる確率を表します。 確率変数X が二項分布に従う場合、 X = kが成功する確率は次の式で求められます。 P(X=k) = n C k * p k * (1-p) nk 金 […]...
付随変数(「共変量」と呼ばれることもあります) は、研究において主に関心のある変数ではありませんが、研究対象の関心のある変数と何らかの相互作用を有する可能性がある変数です。 これらのタイプの変数を考慮しないと、分析で偏っ […]...
相対頻度は、データ セット内の値の総数と比較して、データ セット内に特定の値が出現する頻度を測定します。 Python で次の関数を使用して、相対頻度を計算できます。 def rel_freq (x): freqs = […]...
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。 このチュートリアルでは、R でデータセットの信頼区間をプロットする方法について説明します。 例: R での信頼区間のプロット R に 1 […]...
単純な線形回帰を実行する場合、散布図を作成して、x 値と y 値のさまざまな組み合わせや推定回帰直線を視覚化することがよくあります。 幸いなことに、Python でこのタイプのプロットを作成する簡単な方法が 2 つありま […]...
ステムおよびリーフ グラフは、データ セット内の各値をステムとリーフに分割してデータを表示するグラフです。これは、個々のデータの生の値を表示しながら分布の形状を視覚化するのに役立つため、ユニークなプロットです。 このチュ […]...
多くの場合、R のデータ フレームの行を特定の順序で配置したい場合があります。幸いなことに、これはdplyrライブラリのarray()関数を使用して簡単に行うことができます。 このチュートリアルでは、次のデータ フレーム […]...
多くの場合、R のグループごとの観測値の数を数えることに興味があるかもしれません。 幸いなことに、これはdplyrライブラリのcount()関数を使用して簡単に行うことができます。 このチュートリアルでは、次のデータ フ […]...