Информация

Что такое двусторонняя таблица категориальных переменных?

Что такое двусторонняя таблица категориальных переменных?

Одной из целей статистики является упорядочение данных. Двусторонние таблицы являются важным способом организации определенного типа парных данных. Как и при построении любых графиков или таблиц в статистике, очень важно знать типы переменных, с которыми мы работаем. Если у нас есть количественные данные, то следует использовать график, такой как гистограмма или график ствола и листа. Если у нас есть категориальные данные, тогда уместна гистограмма или круговая диаграмма.

При работе с парными данными мы должны быть осторожны. Диаграмма рассеяния существует для парных количественных данных, но какой график существует для парных категориальных данных? Всякий раз, когда у нас есть две категориальные переменные, мы должны использовать двустороннюю таблицу.

Описание двухстороннего стола

Во-первых, напомним, что категориальные данные относятся к признакам или категориям. Он не количественный и не имеет числовых значений.

Двусторонняя таблица включает в себя список всех значений или уровней для двух категориальных переменных. Все значения для одной из переменных перечислены в вертикальном столбце. Значения для другой переменной перечислены вдоль горизонтальной строки. Если первая переменная имеет м значения и вторая переменная имеет N значения, то будет в общей сложности Миннесота Записи в таблице. Каждая из этих записей соответствует определенному значению для каждой из двух переменных.

По каждой строке и по каждому столбцу суммируются записи. Эти итоги важны при определении предельных и условных распределений. Эти итоги также важны, когда мы проводим тест хи-квадрат на независимость.

Пример двусторонней таблицы

Например, мы рассмотрим ситуацию, в которой мы рассмотрим несколько разделов курса статистики в университете. Мы хотим построить двустороннюю таблицу, чтобы определить, какие различия, если таковые имеются, существуют между мужчинами и женщинами в курсе. Чтобы достичь этого, мы подсчитываем количество баллов, полученных каждым представителем каждого пола.

Мы отмечаем, что первая категориальная переменная - это пол, и есть два возможных значения в исследовании мужчины и женщины. Вторая категориальная переменная - это буквенная оценка, и есть пять значений, которые задаются A, B, C, D и F. Это означает, что у нас будет двусторонняя таблица с 2 x 5 = 10 записей плюс дополнительная строка и дополнительный столбец, которые понадобятся для табулирования итогов строки и столбца.

Наше исследование показывает, что:

  • 50 мужчин получили оценку A, а 60 женщин получили оценку A.
  • 60 мужчин получили B, а 80 женщин получили B.
  • 100 мужчин получили C, а 50 женщин получили C.
  • 40 мужчин получили D, а 50 женщин получили D.
  • 30 мужчин получили F, а 20 женщин получили F.

Эта информация заносится в двустороннюю таблицу ниже. Сумма каждой строки говорит нам, сколько баллов было получено. В итоговых столбцах указывается количество мужчин и женщин.

Важность двухсторонних таблиц

Двусторонние таблицы помогают организовать наши данные, когда у нас есть две категориальные переменные. Эта таблица может помочь нам сравнить две разные группы в наших данных. Например, мы могли бы рассмотреть относительную производительность мужчин в курсе статистики по сравнению с результатами женщин в курсе.

Следующие шаги

После формирования двусторонней таблицы следующим шагом может стать статистический анализ данных. Мы можем спросить, являются ли переменные, которые находятся в исследовании, независимыми друг от друга или нет. Чтобы ответить на этот вопрос, мы можем использовать критерий хи-квадрат на двусторонней таблице.

Двусторонний стол для классов и полов

мужчинаженскийОбщее
5060110
В6080140
С10050150
D405090
F302050
Общее280260540