Як створити таблицю непередбачуваності в python


Таблиця непередбачених обставин — це тип таблиці, яка підсумовує зв’язок між двома категоріальними змінними.

Щоб створити таблицю непередбачуваності в Python, ми можемо використати функцію pandas.crosstab() , яка використовує такий синтаксис:

pandas.crosstab(індекс, стовпці)

золото:

  • індекс: ім’я змінної для відображення в рядках таблиці непередбачуваності
  • стовпці: назва змінної для відображення в стовпцях таблиці непередбачуваності

Наступний покроковий приклад показує, як використовувати цю функцію для створення таблиці непередбачених ситуацій у Python.

Крок 1: Створіть дані

По-перше, давайте створимо набір даних, який відображає інформацію про 20 різних замовлень продуктів, включаючи тип придбаного продукту (телевізор, комп’ютер або радіо), а також країну (A, B або C), у якій продукт було придбано:

 import pandas as pd

#create data
df = pd. DataFrame ({'Order': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
                            11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
                   'Product': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp',
                               'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio',
                               'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'],
                   'Country': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B',
                               'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']})

#view data
df

        Order Product Country
0 1 TV A
1 2 TV A
2 3 Comp A
3 4 TV A
4 5 TV B
5 6 Comp B
6 7 Comp B
7 8 Comp B
8 9 TV B
9 10 Radio B
10 11 TV B
11 12 Radio B
12 13 Radio C
13 14 Radio C
14 15 Comp C
15 16 Comp C
16 17 TV C
17 18 TV C
18 19 Radio C
19 20 TV C

Крок 2: Створіть таблицю непередбачених обставин

У наведеному нижче коді показано, як створити таблицю непередбачених обставин для підрахунку кількості кожного продукту, замовленого кожною країною:

 #create contingency table
p.d. crosstab (index=df[' Country '], columns=df[' Product '])

Product Comp Radio TV
Country			
A 1 0 3
B 3 2 3
C 2 3 3

Ось як інтерпретувати таблицю:

  • Загалом у країні А було придбано 1 комп’ютер.
  • Загалом у країні B було придбано 3 комп’ютери.
  • Загалом у країні C було придбано 2 комп’ютери.
  • Загалом у країні А було придбано 0 радіоприймачів.
  • Загалом у країні B було придбано 2 радіоприймачі.
  • Загалом у країні C було придбано 3 радіоприймачі.
  • Всього в країні А було придбано 3 телевізори.
  • Всього в країні B було придбано 3 телевізори.
  • Загалом у країні C було придбано 3 телевізори.

Крок 3: Додайте загальні суми маржі до таблиці непередбачених обставин

Ми можемо використати аргумент margins=True , щоб додати загальні суми маржі до таблиці непередбачених обставин:

 #add margins to contingency table
p.d. crosstab (index=df[' Country '], columns=df[' Product '], margins= True )

Product Comp Radio TV All
Country				
A 1 0 3 4
B 3 2 3 8
C 2 3 3 8
All 6 5 9 20

Спосіб інтерпретації табличних значень наступний:

Підсумки рядків:

  • Всього було розміщено 4 замовлення з країни А.
  • Загалом із країни Б було розміщено 8 замовлень.
  • Загалом із країни С було розміщено 8 замовлень.

Підсумки стовпців:

  • Всього придбано 6 комп’ютерів.
  • Всього придбано 5 радіоприймачів.
  • Всього придбано 9 телевізорів.

Значення в нижньому правому куті таблиці показує, що загалом було замовлено 20 продуктів з усіх країн.

Додаткові ресурси

Як створити таблицю непередбачуваності в R
Як створити таблицю непередбачуваності в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *