Как посчитать пропущенные значения в sas: с примерами


Для подсчета количества пропущенных значений в SAS можно использовать следующие методы:

Способ 1: подсчитайте пропущенные значения числовых переменных

 proc means data =my_data
    NMISS ;
run ;

Способ 2: подсчитать недостающие значения для символьных переменных

 proc sql; 
select nmiss(char1) as char1_miss, nmiss(char2) as char2_miss
    from my_data;
quit;

В следующих примерах показано, как использовать каждый метод на практике со следующим набором данных в SAS:

 /*create dataset*/
data my_data;
    input team $pos $rebounds assists;
    datalines ;
GA 10 8
BF4.
. F 7 10
DC. 14
EF. 10
FG 12 7
GC. 11
;
run ;

/*view dataset*/
proc print data =my_data; 

Пример 1: Подсчет пропущенных значений для числовых переменных

Мы можем использовать следующий код для подсчета количества пропущенных значений для каждой числовой переменной в наборе данных:

 /*count missing values for each numeric variable*/
proc means data =my_data
    NMISS ;
run ;

По результату мы видим:

  • Всего в столбце отказов 3 пропущенных значения.
  • Всего в столбце передач пропущено 1 значение.

Пример 2: Подсчет пропущенных значений для символьных переменных

Мы можем использовать следующий код для подсчета количества пропущенных значений для каждой символьной переменной в наборе данных:

 /*count missing for each character variable*/
proc sql ; 
    select nmiss(team) as team_miss, nmiss(pos) as pos_miss
    from my_data; 
quit ;

По результату мы видим:

  • В столбце «Команда» отсутствует 1 значение.
  • В столбце pos 0 пропущенных значений.

Примечание . Полную документацию по функции NMISS можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как нормализовать данные в SAS
Как удалить дубликаты в SAS
Как заменить пропущенные значения нулями в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *