За замовчуванням блокноти Jupyter відображають лише 20 стовпців pandas DataFrame. Ви можете легко змусити блокнот відображати всі стовпці за допомогою такого синтаксису: p.d. set_option (' max_columns ', None) Ви також можете використовувати такий синтаксис для відображення всіх імен стовпців у DataFrame:...
Ви можете використати один із наведених нижче трьох методів, щоб додати рядок заголовка до pandas DataFrame: #add header row when creating DataFrame df = pd. DataFrame (data=[data_values], columns=[' col1 ', ' col2 ', ' col3 ']) #add header row after creating...
Ви можете використовувати такий синтаксис, щоб відняти один стовпець від іншого в pandas DataFrame: #subtract column 'B' from column 'A' df[' AB '] = df. A - df. B Наступні приклади показують, як використовувати цей синтаксис на практиці. Приклад 1: відніміть...
Ви можете використовувати наступний базовий синтаксис, щоб розділити рядковий стовпець у pandas DataFrame на кілька стовпців: #split column A into two columns: column A and column B df[[' A ',' B ']] = df[' A ']. str . split (' ,...
Ви можете використовувати функцію pct_change() , щоб обчислити відсоткову зміну між значеннями в pandas: #calculate percent change between values in pandas Series s. pct_change () #calculate percent change between rows in pandas DataFrame df[' column_name ']. pct_change () Наступні приклади показують,...
Існує два типи тестів хі-квадрат, які зазвичай використовуються: Критерій відповідності хі-квадрат : використовується для визначення того, чи відповідає категоріальна змінна гіпотетичному розподілу. Критерій незалежності хі-квадрат : використовується для визначення того, чи існує значний зв’язок між двома категоріальними змінними. Ми використовуємо таку...
Ви можете використовувати функції lines() і points() для накладання кількох шляхів у R: #create scatterplot of x1 vs. y1 plot(x1, y1) #overlay line plot of x2 vs. y2 lines(x2, y2) #overlay scatterplot of x3 vs. y3 points(x2, y2) Наступні приклади показують,...
Дисперсійний аналіз із повторними вимірюваннями використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп, у кожній з яких є ті самі суб’єкти. Під час звітування про результати повторних вимірювань ANOVA ми завжди використовуємо таку...