Sas: как указать количество ячеек в гистограмме


Вы можете использовать оператор средних точек , чтобы указать количество групп, которые будут использоваться в гистограмме в SAS.

В этом операторе используется следующий базовый синтаксис:

 proc univariate data =my_data;
    histogram my_variable / midpoints =( 9 to 36 by 3 );
run ;

В этом конкретном примере создается гистограмма со средними точками в диапазоне от 9 до 36 с интервалом 3 .

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: Как указать количество интервалов в гистограмме в SAS

Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетболистах:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 29 8
At 23 6
At 20 6
At 21 9
At 33 14
At 35 11
At 31 10
B 21 9
B 14 5
B 15 7
B 11 10
B 12 6
B 10 8
B 15 10
;
run ;

/*view dataset*/
proc print data =my_data; 

Мы можем использовать следующий синтаксис для создания гистограммы для переменной точек :

 /*create histogram for variable points*/
proc univariate data =my_data;
    histogram points;
run ;

Ось X отображает значения переменной точек , а ось Y отображает процент наблюдений в наборе данных, которые соответствуют различным значениям.

Обратите внимание, что средние точки гистограммы происходят с интервалом 6 .

Чтобы увеличить количество ячеек на гистограмме, мы можем указать, чтобы средние точки находились с интервалом 3 :

 /*create histogram for points variable with custom bins*/
proc univariate data =my_data;
    histogram points / midpoints =( 9 to 36 by 3 );
run ; 

указать интервалы в гистограмме в SAS

Обратите внимание, что на этой гистограмме общее количество групп больше, чем на предыдущей, поскольку мы уменьшили интервалы между средними точками.

Чтобы уменьшить количество ячеек на гистограмме, мы можем указать, чтобы средние точки находились с интервалом 9 :

 /*create histogram for points variable with custom bins*/
proc univariate data =my_data;
    histogram points / midpoints =( 9 to 36 by 9 );
run ; 

Обратите внимание, что на этой гистограмме общее количество групп меньше, чем на предыдущей, поскольку мы увеличили интервалы между средними точками.

Не стесняйтесь экспериментировать со значениями в операторе средней точки , чтобы увеличить или уменьшить количество ячеек в гистограмме.

Дополнительные ресурсы

В следующих руководствах объясняется, как создавать другие диаграммы в SAS:

Как создать линейные графики в SAS
Как создать коробчатые диаграммы по группам в SAS
Как создать диаграмму рассеяния с линией регрессии в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *