多くの場合、pandas DataFrame で、列の 1 つに特定の値が表示される行を選択したい場合があります。 幸いなことに、これは.any pandas 関数を使用して簡単に行うことができます。このチュートリアルで […]...
多くの場合、日付を含む列に基づいて pandas DataFrame を並べ替えたい場合があります。幸いなことに、これはsort_values()関数を使用して簡単に行うことができます。 このチュートリアルでは、この機能 […]...
対称平均絶対パーセント誤差 (SMAPE) は、モデルの予測精度を測定するために使用されます。次のように計算されます。 SMAPE = (1/n) * Σ(|予測 – 実績| / ((|実際| + |予測|)/2) * […]...
二次回帰は、真の関係が二次である場合に、予測子変数と応答変数の間の関係を定量化するために使用できる回帰の一種であり、グラフ上の「U」または反転した「U」のように見える場合があります。 つまり、予測変数が増加すると、応答変 […]...
多くの場合、pandas DataFrame の複数の列をグループ化して集約することが必要な場合があります。 幸いなことに、これは pandas の.groupby()関数と.agg()関数を使用して簡単に実行できます。 […]...
多くの場合、pandas DataFrame 内の 1 つ以上の列のデータ値を正規化したい場合があります。 このチュートリアルでは、これを行う 2 つの方法について説明します。 1. 最小値と最大値の正規化 目的:各デー […]...
シャピロ・ウィルク検定は正規性の検定です。これは、サンプルが正規分布に由来するかどうかを判断するために使用されます。 Python で Shapiro-Wilk テストを実行するには、次の構文を使用するscipy.sta […]...
コルモゴロフ・スミルノフ検定は、サンプルが特定の分布に由来するかどうかを検定するために使用されます。 Python でコルモゴロフ-スミルノフ テストを実行するには、1 サンプル テストの場合はscipy.stats.k […]...
研究者は多くの場合、母集団からサンプルを採取し、そのサンプルのデータを使用して母集団全体についての結論を導き出します。 一般的に使用されるサンプリング方法は、層化ランダムサンプリングです。このサンプリングでは、母集団をグ […]...
多くの場合、3 番目の変数に基づいて matplotlib 散布図内の点の色をシェーディングしたい場合があります。幸いなことに、これは次の構文をとるmatplotlib.pyplot.scatter()関数を使用して簡単 […]...