Таблица сопряженности
В этой статье объясняется, что такое таблицы сопряженности, как их создать и для чего используются эти типы таблиц. Кроме того, вы найдете конкретный пример расчета вероятностей по таблице непредвиденных обстоятельств.
Что такое таблица непредвиденных обстоятельств?
Таблица непредвиденных обстоятельств — это набор строк и столбцов, используемых для классификации собранных данных. В статистике таблицы непредвиденных обстоятельств используются для расчета вероятностей и анализа собранной информации.
Чтобы вы могли понять, что такое таблица непредвиденных обстоятельств, приведем пример результатов матчей, сыгранных футбольной командой в течение всего сезона, выраженных в таблице непредвиденных обстоятельств:

Как видите, таблицы сопряженности очень полезны для стратификации данных. Например, благодаря этой таблице непредвиденных обстоятельств мы знаем, что команда выиграла 19 игр из 25, сыгранных дома, кроме того, всего они сыграли 50 игр.
Поэтому составить таблицу сопряженности очень просто, необходимо предварительно провести исследование и собрать числовые данные по рассматриваемому вопросу. Затем просто отсортируйте данные в соответствии с их характером. Логично, что вам необходимо очень четко понимать, по каким переменным вы хотите классифицировать данные, чтобы сделать правильную интерпретацию.
В настоящее время существует множество компьютерных программ, таких как Excel или Minitab, которые автоматически создают таблицы сопряженности, то есть вам достаточно ввести данные в компьютер и назвать переменные в таблице, при этом эта программа способна классифицировать данные в таблицу непредвиденных обстоятельств и выполнить статистические расчеты.
Пример таблицы непредвиденных обстоятельств
Как только мы узнаем определение таблицы непредвиденных обстоятельств, мы увидим решенное упражнение, чтобы лучше понять эту концепцию.
В приведенной ниже таблице непредвиденных обстоятельств собраны результаты всех матчей футбольной команды за весь сезон. На основе этой информации рассчитайте следующие вероятности:
- Какова предельная вероятность того, что команда проиграет в данном матче?
- Какова совместная вероятность игры на выезде и победы?
- Какова условная вероятность (или условная вероятность) выигрыша, если вы играете дома?

Таблица непредвиденных обстоятельств для этого упражнения имеет размер 2×2, поскольку в ней две строки и два столбца.
Для расчета вероятности количество благоприятных для события случаев необходимо разделить на общее количество возможных случаев, то есть формула расчета вероятностей имеет вид:
Таким образом, для первого вопроса, вычисляющего предельную вероятность поражения, необходимо разделить количество наблюдаемых поражений (20) на общее количество матчей (50):
Во-вторых, чтобы найти совместную вероятность того, что игра на выезде и выигрыш происходят одновременно, нужно разделить количество выигрышей, произошедших при игре на выезде (11), на общее количество случаев (50):
Наконец, чтобы определить условную вероятность победы команды при игре дома, необходимо вычислить частное между количеством домашних побед (19) и общим количеством сыгранных дома матчей (25):
Обратите внимание, что расчет вероятностей не всегда производится одинаково, так как знаменатель формулы (общее количество случаев) меняется в зависимости от вида вероятности .
Для чего используется таблица сопряженности?
В этом последнем разделе мы увидим, для чего используются таблицы непредвиденных обстоятельств, поскольку они очень полезны в статистике и вероятности.
В первую очередь таблица сопряженности используется для анализа данных для категориальной переменной. Статистическое исследование такого типа переменных сложно провести, но с помощью таблиц сопряженности данные можно четко организовать и, следовательно, их легче интерпретировать.
Как мы видели в приведенном выше примере, очень практично рассчитывать вероятности по таблице непредвиденных обстоятельств; нужно просто иметь четкие понятия и подставить в формулу соответствующие данные.
Кроме того, таблицы непредвиденных обстоятельств облегчают вывод о взаимосвязях между переменными в научном исследовании, просто наблюдая за ними, поскольку они представляют данные упорядоченным и ясным образом.