ガイド - Statorials

複数の条件に基づいて r でデータフレームをサブセット化する方法

次のメソッドを使用して、R の複数の条件に基づいてデータフレームをサブ定義できます。方法 1: 「OR」ロジックを使用してデータフレームをサブセットする df_sub <- subset(df, team = […]...

次の基本構文を使用して、R の因子変数に新しいレベルを追加できます。 levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ') 次の例は、この構文 […]...

SAS で次のマクロを使用すると、データセットが存在するかどうかをすばやく確認できます。 %macro check_exists(data); %if %sysfunc ( exist (&data.)) %th […]...

次の基本構文を使用して、SAS のデータセットの四分位を計算できます。 /*calculate quartile values for variable called var1*/ proc univariate dat […]...

統計において、十分位とは、データセットを同じ頻度の 10 個のグループに分割する数値です。最初の十分位数は、すべてのデータ値の 10% が下回る点です。第 2 十分位点は、すべてのデータ値の 20% が下回る点などで […]...

次の基本構文を使用して、SAS のsetステートメントに複数のデータセットを含めることができます。 data new_data; set data1 data2 data3; run ; 次の例は、この構文を実際に使用す […]...

次の構文を使用して、pandas DataFrame の日付列を YYYYMMDD 形式に変換できます。 #convert date column to datetime df[' date_column '] = pd […]...

次のメソッドを使用して、pandas DataFrame の複数の条件に基づいて行を削除できます。方法 1: いくつかの条件のいずれかを満たす行を削除する df = df. loc [ ~ ((df[' col1 '] […]...

pandas で次の構文を使用すると、別の列の値に基づいて列に値を割り当てることができます。 df[' new '] = df[' col ']. map ( lambda x: ' new1 ' if ' A ' in […]...

次のメソッドを使用して、pandas DataFrame の累積数を計算できます。方法1：グループごとの累計集計 df[' cum_count '] = df. groupby (' col1 '). cumcount […]...