Категорія: Гід

Як використовувати pandas get dummies – pd.get_dummies

Часто в статистиці набори даних, з якими ми працюємо, включають категоріальні змінні . Це змінні, які приймають імена або мітки. Приклади: Сімейний стан («одружений», «неодружений», «розлучений») Статус куріння («курить», «не курить») Колір очей («блакитний», «зелений», «горіховий») Рівень освіти (наприклад, «середня школа»,...

Як збільшити розмір графіка в matplotlib

Ви можете використовувати наступний синтаксис, щоб збільшити розмір окремої діаграми в Matplotlib: import matplotlib. pyplot as plt #define figure size in (width, height) for a single plot plt. figure (figsize=(3,3)) І ви можете використовувати такий синтаксис, щоб збільшити розмір усіх діаграм...

Як використовувати функцію idxmax() у pandas (з прикладами)

Ви можете використовувати функцію pandas.DataFrame.idxmax() , щоб повернути індекс максимального значення на вказаній осі в pandas DataFrame. Ця функція використовує такий синтаксис: DataFrame.idxmax(axis=0, skipna=True) золото: axis : вісь для використання (0 = рядки, 1 = стовпці). Значення за замовчуванням 0. skipna...

Як вибрати окремі рядки в pandas dataframe

Ви можете використовувати наступний синтаксис для вибору окремих рядків у pandas DataFrame: df = df. drop_duplicates () І ви можете використовувати наступний синтаксис, щоб вибрати окремі рядки в певних стовпцях у pandas DataFrame: df = df. drop_duplicates (subset=[' col1 ', '...

Як експортувати pandas dataframe у csv (з прикладом)

Ви можете використовувати такий синтаксис, щоб експортувати pandas DataFrame у файл CSV: df. to_csv (r' C:\Users\Bob\Desktop\my_data.csv ', index= False ) Зауважте, що index=False повідомляє Python видалити стовпець індексу під час експорту DataFrame. Не соромтеся видалити цей аргумент, якщо ви хочете зберегти...

Як замінити na рядками в r (з прикладами)

Ви можете використовувати функцію replace_na() з пакету Tidyr , щоб замінити NA певними рядками в стовпці кадру даних у R: #replace NA values in column x with "missing" df$x %>% replace_na (' none ') Ви також можете використовувати цю функцію, щоб...

Як використовувати str_split в r (з прикладами)

Функцію str_split() пакету stringr у R можна використати, щоб розділити рядок на кілька частин. Ця функція використовує такий синтаксис: str_split(рядок, шаблон) золото: рядок: символьний вектор візерунок: візерунок, на якому потрібно розділити Подібним чином функція str_split_fixed() із пакету stringr може бути використана...

Як використовувати write.table в r (з прикладами)

Ви можете використовувати функцію write.table в R, щоб експортувати кадр даних або матрицю у файл. Ця функція використовує такий базовий синтаксис: write.write. table (df, file=' C:\\Users\\bob\\Desktop\\data.txt ') За замовчуванням значення в експортованому файлі розділені одним пробілом, але ви можете використовувати аргумент...

Як видалити легенду в ggplot2 (з прикладами)

Щоб видалити легенду з графіка в ggplot2, можна використати такий синтаксис: ggplot(df, aes (x=x, y=y, color=z)) + geom_point() + theme( legend.position =" none ") Вказуючи legend.position=”none” ви наказуєте ggplot2 видалити всі легенди з графіка. Наступний покроковий приклад показує, як використовувати цей...

Як обертати мітки осей у ggplot2 (з прикладами)

Ви можете використовувати такий синтаксис, щоб обертати мітки осі на графіку ggplot2: p + theme(axis. text . x = element_text(angle = 45 , vjust = 1 , hjust= 1 )) Angle керує кутом нахилу тексту, тоді як vjust і hjust керує...