カテゴリー: ガイド
次のメソッドを使用して、R の複数の条件に基づいてデータ フレームをサブ定義できます。 方法 1: 「OR」ロジックを使用してデータ フレームをサブセットする df_sub <- subset(df, team = […]...
次の基本構文を使用して、R の因子変数に新しいレベルを追加できます。 levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ') 次の例は、この構文 […]...
SAS で次のマクロを使用すると、データセットが存在するかどうかをすばやく確認できます。 %macro check_exists(data); %if %sysfunc ( exist (&data.)) %th […]...
次の基本構文を使用して、SAS のデータセットの四分位を計算できます。 /*calculate quartile values for variable called var1*/ proc univariate dat […]...
統計において、十分位とは、データセットを同じ頻度の 10 個のグループに分割する数値です。 最初の十分位数は、すべてのデータ値の 10% が下回る点です。 第 2 十分位点は、すべてのデータ値の 20% が下回る点などで […]...
次の基本構文を使用して、SAS のsetステートメントに複数のデータセットを含めることができます。 data new_data; set data1 data2 data3; run ; 次の例は、この構文を実際に使用す […]...
次の構文を使用して、pandas DataFrame の日付列を YYYYMMDD 形式に変換できます。 #convert date column to datetime df[' date_column '] = pd […]...
次のメソッドを使用して、pandas DataFrame の複数の条件に基づいて行を削除できます。 方法 1: いくつかの条件のいずれかを満たす行を削除する df = df. loc [ ~ ((df[' col1 '] […]...
pandas で次の構文を使用すると、別の列の値に基づいて列に値を割り当てることができます。 df[' new '] = df[' col ']. map ( lambda x: ' new1 ' if ' A ' in […]...
次のメソッドを使用して、pandas DataFrame の累積数を計算できます。 方法1:グループごとの累計集計 df[' cum_count '] = df. groupby (' col1 '). cumcount […]...