Як створити таблицю непередбачуваності в python
Таблиця непередбачених обставин — це тип таблиці, яка підсумовує зв’язок між двома категоріальними змінними.
Щоб створити таблицю непередбачуваності в Python, ми можемо використати функцію pandas.crosstab() , яка використовує такий синтаксис:
pandas.crosstab(індекс, стовпці)
золото:
- індекс: ім’я змінної для відображення в рядках таблиці непередбачуваності
- стовпці: назва змінної для відображення в стовпцях таблиці непередбачуваності
Наступний покроковий приклад показує, як використовувати цю функцію для створення таблиці непередбачених ситуацій у Python.
Крок 1: Створіть дані
По-перше, давайте створимо набір даних, який відображає інформацію про 20 різних замовлень продуктів, включаючи тип придбаного продукту (телевізор, комп’ютер або радіо), а також країну (A, B або C), у якій продукт було придбано:
import pandas as pd #create data df = pd. DataFrame ({'Order': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20], 'Product': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp', 'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio', 'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'], 'Country': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']}) #view data df Order Product Country 0 1 TV A 1 2 TV A 2 3 Comp A 3 4 TV A 4 5 TV B 5 6 Comp B 6 7 Comp B 7 8 Comp B 8 9 TV B 9 10 Radio B 10 11 TV B 11 12 Radio B 12 13 Radio C 13 14 Radio C 14 15 Comp C 15 16 Comp C 16 17 TV C 17 18 TV C 18 19 Radio C 19 20 TV C
Крок 2: Створіть таблицю непередбачених обставин
У наведеному нижче коді показано, як створити таблицю непередбачених обставин для підрахунку кількості кожного продукту, замовленого кожною країною:
#create contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product ']) Product Comp Radio TV Country A 1 0 3 B 3 2 3 C 2 3 3
Ось як інтерпретувати таблицю:
- Загалом у країні А було придбано 1 комп’ютер.
- Загалом у країні B було придбано 3 комп’ютери.
- Загалом у країні C було придбано 2 комп’ютери.
- Загалом у країні А було придбано 0 радіоприймачів.
- Загалом у країні B було придбано 2 радіоприймачі.
- Загалом у країні C було придбано 3 радіоприймачі.
- Всього в країні А було придбано 3 телевізори.
- Всього в країні B було придбано 3 телевізори.
- Загалом у країні C було придбано 3 телевізори.
Крок 3: Додайте загальні суми маржі до таблиці непередбачених обставин
Ми можемо використати аргумент margins=True , щоб додати загальні суми маржі до таблиці непередбачених обставин:
#add margins to contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product '], margins= True ) Product Comp Radio TV All Country A 1 0 3 4 B 3 2 3 8 C 2 3 3 8 All 6 5 9 20
Спосіб інтерпретації табличних значень наступний:
Підсумки рядків:
- Всього було розміщено 4 замовлення з країни А.
- Загалом із країни Б було розміщено 8 замовлень.
- Загалом із країни С було розміщено 8 замовлень.
Підсумки стовпців:
- Всього придбано 6 комп’ютерів.
- Всього придбано 5 радіоприймачів.
- Всього придбано 9 телевізорів.
Значення в нижньому правому куті таблиці показує, що загалом було замовлено 20 продуктів з усіх країн.
Додаткові ресурси
Як створити таблицю непередбачуваності в R
Як створити таблицю непередбачуваності в Excel