Вы можете использовать функцию pandas read_html() для чтения HTML-таблиц в DataFrame pandas. Эта функция использует следующий базовый синтаксис: df = pd. read_html (' https://en.wikipedia.org/wiki/National_Basketball_Association ') В следующем примере показано, как использовать эту функцию для чтения таблицы названий команд НБА с этой...
Точный критерий Фишера используется для определения наличия значимой связи между двумя категориальными переменными. Обычно он используется в качестве альтернативы критерию независимости хи-квадрат , когда количество одной или нескольких ячеек в таблице 2 × 2 меньше 5. Точный критерий Фишера использует следующие...
Критерий Колмогорова-Смирнова используется для определения нормального распределения выборки или нет. Этот тест широко используется, поскольку многие статистические тесты и процедуры предполагают нормальное распределение данных. В следующем пошаговом примере показано, как выполнить тест Колмогорова-Смирнова на образце набора данных в SAS. Пример: тест...
Ящики полезны для быстрой визуализации пятизначного сводного набора данных, который включает в себя: Минимальное значение Первый квартиль Медиана Третий квартиль Максимальное значение В следующем примере показано, как создать сгруппированные коробчатые диаграммы в SAS для визуализации распределения нескольких групп одновременно. Пример. Создание...
Вы можете использовать сводку процедур в SAS, чтобы быстро вычислить следующую описательную статистику для одной или нескольких переменных в наборе данных: N : Общее количество наблюдений МИН : Минимальное значение МАКС .: Максимальное значение. СРЕДНЕЕ : Среднее Стандартное отклонение : стандартное...
Вы можете использовать proc freq в SAS для быстрого создания таблиц частот для одной или нескольких переменных в наборе данных. В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики...
Один из способов количественной оценки связи между двумя переменными – использовать коэффициент корреляции Пирсона , который измеряет линейную связь между двумя переменными . Он всегда принимает значение от -1 до 1, где: -1 указывает на совершенно отрицательную линейную корреляцию между двумя...
Критерий согласия хи-квадрат используется для определения того, соответствует ли категориальная переменная гипотетическому распределению. В следующем примере показано, как выполнить критерий согласия хи-квадрат в SAS. Пример: критерий согласия хи-квадрат в SAS Владелец магазина говорит, что в его магазин каждый день недели приходит...
Критерий независимости хи-квадрат используется для определения наличия значимой связи между двумя категориальными переменными . В следующем примере показано, как выполнить проверку независимости по хи-квадрату в SAS. Пример: тест независимости хи-квадрат в SAS Предположим, мы хотим знать, связан ли пол с предпочтением...
Критерий знакового ранга Уилкоксона — это непараметрическая версия t-критерия для парных выборок . Он используется для проверки того, существует ли значительная разница между средними значениями двух популяций, когда распределение различий между двумя выборками нельзя считать нормальным. В следующем примере показано, как...