Как рассчитать описательную статистику для переменных в spss

К бенджамин андерсон 28 июля, 2023 Гид 0 комментариев

Лучший способ понять набор данных — это рассчитать описательную статистику для переменных в наборе данных. Существует три распространенные формы описательной статистики:

1. Сводная статистика – числа, которые суммируют переменную с использованием одного числа. Примеры включают среднее значение, медиану, стандартное отклонение и диапазон.

2. Таблицы . Таблицы могут помочь нам понять, как распределяются данные. Примером может служить таблица частот, которая сообщает нам, сколько значений данных попадает в определенные диапазоны.

3. Диаграммы . Они помогают нам визуализировать данные. Примером может служить гистограмма .

В этом руководстве объясняется, как рассчитать описательную статистику для переменных в SPSS.

Пример: описательная статистика в SPSS

Предположим, у нас есть следующий набор данных, содержащий четыре переменные для 20 учеников определенного класса:

Результаты экзамена
Часы, потраченные на учебу
Подготовительные экзамены сданы
Текущая оценка в классе

Вот как рассчитать описательную статистику для каждой из этих четырех переменных:

Сводные статистические данные

Чтобы рассчитать сводную статистику для каждой переменной, перейдите на вкладку «Анализ» , затем «Описательная статистика» , затем «Описательные» :

В появившемся новом окне перетащите каждую из четырех переменных в область с надписью «Переменные». При желании вы можете нажать кнопку «Параметры» и выбрать конкретную описательную статистику, которую SPSS должен рассчитать. Затем нажмите Продолжить . Затем нажмите ОК .

После того, как вы нажмете «ОК» , появится таблица со следующей описательной статистикой для каждой переменной:

Описательная статистика в SPSS

Вот как интерпретировать числа в этой таблице для переменной оценки :

N: Общее количество наблюдений. В данном случае их 20.
Минимум: Минимальное значение оценки экзамена. В данном случае это 68.
Максимум: максимальное значение экзаменационной оценки. В данном случае это 99.
Средний: средний балл на экзамене. В данном случае это 82,75.
Стандарт. Отклонение: стандартное отклонение результатов экзамена. В данном случае это 8985.

Эта таблица позволяет нам быстро понять диапазон каждой переменной (используя минимум и максимум), центральное расположение каждой переменной (используя среднее значение) и распределение значений для каждой переменной (используя стандартное отклонение).

столы

Чтобы создать таблицу частот для каждой переменной, перейдите на вкладку «Анализ» , затем «Описательная статистика» , затем «Частоты» .

В появившемся новом окне перетащите каждую переменную в поле с надписью «Переменные». Затем нажмите ОК .

Появится таблица частот для каждой переменной. Например, вот для переменных часов :

Таблица частот в SPSS

Интерпретация таблицы следующая:

В первом столбце отображается каждое уникальное значение переменной часов . В данном случае уникальными значениями являются 1, 2, 3, 4, 5, 6 и 16.
Во втором столбце отображается частота каждого значения. Например, значение 1 появляется 1 раз, значение 2 — 4 раза и т. д.
В третьем столбце отображается процент для каждого значения. Например, значение 1 представляет 5% всех значений в наборе данных. Значение 2 представляет 20% всех значений в наборе данных и так далее.
В последнем столбце отображается совокупный процент. Например, значения 1 и 2 вместе представляют 25% общего набора данных. Значения 1, 2 и 3 представляют в общей сложности 60% набора данных и так далее.

Эта таблица дает нам хорошее представление о распределении значений данных для каждой переменной.

Графика

Графики также помогают нам понять распределение значений данных для каждой переменной в наборе данных. Одной из самых популярных диаграмм для этого является гистограмма.

Чтобы создать гистограмму для заданной переменной в наборе данных, откройте вкладку «Диаграммы» , затем нажмите «Построитель диаграмм» .

В появившемся новом окне выберите « Гистограмма» на панели «Выбрать из». Затем перетащите первый вариант гистограммы в главное окно редактирования. Затем перетащите интересующую переменную на ось X. В этом примере мы будем использовать оценку . Затем нажмите ОК .

Как только вы нажмете ОК , появится гистограмма, отображающая распределение значений переменной оценки :

Гистограмма показывает нам, что диапазон баллов экзамена варьируется от 65 до 100, при этом большинство баллов находится в диапазоне от 70 до 90.

Мы также можем повторить этот процесс, чтобы создать гистограмму для каждой другой переменной в наборе данных.

Об авторе

бенджамин андерсон

Здравствуйте, я Бенджамин, профессор статистики на пенсии, ставший преданным преподавателем Statorials. Имея обширный опыт и знания в области статистики, я хочу поделиться своими знаниями, чтобы расширить возможности студентов с помощью Statorials. Узнать больше