Как рассчитать описательную статистику для переменных в spss
Лучший способ понять набор данных — это рассчитать описательную статистику для переменных в наборе данных. Существует три распространенные формы описательной статистики:
1. Сводная статистика – числа, которые суммируют переменную с использованием одного числа. Примеры включают среднее значение, медиану, стандартное отклонение и диапазон.
2. Таблицы . Таблицы могут помочь нам понять, как распределяются данные. Примером может служить таблица частот, которая сообщает нам, сколько значений данных попадает в определенные диапазоны.
3. Диаграммы . Они помогают нам визуализировать данные. Примером может служить гистограмма .
В этом руководстве объясняется, как рассчитать описательную статистику для переменных в SPSS.
Пример: описательная статистика в SPSS
Предположим, у нас есть следующий набор данных, содержащий четыре переменные для 20 учеников определенного класса:
- Результаты экзамена
- Часы, потраченные на учебу
- Подготовительные экзамены сданы
- Текущая оценка в классе
Вот как рассчитать описательную статистику для каждой из этих четырех переменных:
Сводные статистические данные
Чтобы рассчитать сводную статистику для каждой переменной, перейдите на вкладку «Анализ» , затем «Описательная статистика» , затем «Описательные» :
В появившемся новом окне перетащите каждую из четырех переменных в область с надписью «Переменные». При желании вы можете нажать кнопку «Параметры» и выбрать конкретную описательную статистику, которую SPSS должен рассчитать. Затем нажмите Продолжить . Затем нажмите ОК .
После того, как вы нажмете «ОК» , появится таблица со следующей описательной статистикой для каждой переменной:
Вот как интерпретировать числа в этой таблице для переменной оценки :
- N: Общее количество наблюдений. В данном случае их 20.
- Минимум: Минимальное значение оценки экзамена. В данном случае это 68.
- Максимум: максимальное значение экзаменационной оценки. В данном случае это 99.
- Средний: средний балл на экзамене. В данном случае это 82,75.
- Стандарт. Отклонение: стандартное отклонение результатов экзамена. В данном случае это 8985.
Эта таблица позволяет нам быстро понять диапазон каждой переменной (используя минимум и максимум), центральное расположение каждой переменной (используя среднее значение) и распределение значений для каждой переменной (используя стандартное отклонение).
столы
Чтобы создать таблицу частот для каждой переменной, перейдите на вкладку «Анализ» , затем «Описательная статистика» , затем «Частоты» .
В появившемся новом окне перетащите каждую переменную в поле с надписью «Переменные». Затем нажмите ОК .
Появится таблица частот для каждой переменной. Например, вот для переменных часов :
Интерпретация таблицы следующая:
- В первом столбце отображается каждое уникальное значение переменной часов . В данном случае уникальными значениями являются 1, 2, 3, 4, 5, 6 и 16.
- Во втором столбце отображается частота каждого значения. Например, значение 1 появляется 1 раз, значение 2 — 4 раза и т. д.
- В третьем столбце отображается процент для каждого значения. Например, значение 1 представляет 5% всех значений в наборе данных. Значение 2 представляет 20% всех значений в наборе данных и так далее.
- В последнем столбце отображается совокупный процент. Например, значения 1 и 2 вместе представляют 25% общего набора данных. Значения 1, 2 и 3 представляют в общей сложности 60% набора данных и так далее.
Эта таблица дает нам хорошее представление о распределении значений данных для каждой переменной.
Графика
Графики также помогают нам понять распределение значений данных для каждой переменной в наборе данных. Одной из самых популярных диаграмм для этого является гистограмма.
Чтобы создать гистограмму для заданной переменной в наборе данных, откройте вкладку «Диаграммы» , затем нажмите «Построитель диаграмм» .
В появившемся новом окне выберите « Гистограмма» на панели «Выбрать из». Затем перетащите первый вариант гистограммы в главное окно редактирования. Затем перетащите интересующую переменную на ось X. В этом примере мы будем использовать оценку . Затем нажмите ОК .
Как только вы нажмете ОК , появится гистограмма, отображающая распределение значений переменной оценки :
Гистограмма показывает нам, что диапазон баллов экзамена варьируется от 65 до 100, при этом большинство баллов находится в диапазоне от 70 до 90.
Мы также можем повторить этот процесс, чтобы создать гистограмму для каждой другой переменной в наборе данных.