Что такое порядковые данные? Определение, примеры, переменные и анализ
Если ваша профессия подразумевает работу с данными в любом качестве, вы должны знать четыре основных типа данных — номинальные, порядковые, интервальные и относительные. В этом руководстве мы сосредоточимся на порядковых данных. Мы определим, что такое порядковые данные, рассмотрим их характеристики и приведем примеры порядковых данных. Читайте дальше, чтобы узнать все, что вам нужно знать об анализе порядковых данных, их использовании и номинальных и порядковых данных.
Что такое порядковые данные?
Порядковые данные — это вид качественных данных, которые группируют переменные в упорядоченные категории, имеющие естественный порядок или ранг на основе некоторой иерархической шкалы, например, от высокого к низкому. Но между категориями отсутствуют четко определенные интервалы. С точки зрения уровней измерения порядковые данные занимают второе место по сложности после номинальных данных.
Мы используем порядковые данные для наблюдения за отзывами клиентов, удовлетворенностью, экономическим положением, уровнем образования и т. д. Такие данные показывают только последовательности и не могут использоваться для статистического анализа. Мы не можем выполнять арифметические задачи с порядковыми данными.
Характеристики порядковых данных
- Порядковые данные не являются числовыми или категориальными, но могут использовать числовые значения в качестве категоризационных меток.
- Порядковые данные всегда ранжируются в некотором естественном порядке или иерархии. Поэтому их называют порядковыми.
- Порядковые данные — это помеченные данные в определенном порядке. Поэтому их можно описать как дополнение к номинальным данным.
- Порядковые данные всегда упорядочены, но значения распределены неравномерно. Различия между интервалами неравномерны или неизвестны.
- Порядковые данные можно использовать для расчета сводных статистик, например, распределения частот, медианы и моды, а также диапазона переменных.
- Порядковые данные имеют медиану.
Порядковые переменные
Порядковые переменные — это категориальные переменные с упорядоченными возможными значениями. Их можно рассматривать как «промежуточные» категориальные и количественные переменные.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Порядковые переменные можно классифицировать следующим образом:
Соответствующая категория
В этой категории каждый член выборки данных сопоставляется с аналогичными членами всех других выборок по всем остальным переменным, кроме рассматриваемой. Это помогает получить более точную оценку различий. Исключение других переменных предотвращает их влияние на результаты проводимого исследования.
Существует два типа тестов, проводимых для сопоставленной категории переменных:
- тест знакового ранга Вилкоксона
- Двухфакторный дисперсионный анализ Фридмана
Непревзойденная категория
В этой категории случайным образом выбираются непарные или независимые выборки с переменными, независимыми от значений других переменных.
Тесты, проведенные на непарной категории переменных, следующие:
- Тест суммы рангов Вилкоксона или U-тест Манна-Уитни
- Однофакторный тест Краскала-Уоллиса
Примеры порядковых данных
Порядковые данные часто включают в себя оценки мнений или чувств, а также демографических факторов, таких как социальный статус или доход, которые классифицируются по уровням.
Интервальная шкала
Интервальная шкала — это разновидность порядковой шкалы, в которой каждый ответ представлен в форме отдельного интервала.
Примеры:
1. Ранжируйте экономическое положение в соответствии с неравномерно распределенным диапазоном уровня дохода:
- Бедные или с низким доходом (10–20 тыс. долл. США)
- Средний доход ($20 тыс.–$35 тыс.)
- Богатые ($35 тыс.–$100 тыс.)
2. Оцените уровень образования по:
- Элементарный
- Средняя школа
- Колледж
- Выпускник
- аспирантура
Шкала Лайкерта
Шкала Лайкерта — это шкала баллов, которую исследователи используют для проведения опросов и получения мнений людей по определенному вопросу.
Примеры:
1. Организация просит сотрудников оценить, насколько они довольны своим руководителем и коллегами, по следующей шкале:
- Очень счастлив – 1
- Счастливые – 2
- Нейронный – 3
- Несчастный – 4
- Крайне несчастлив – 5
2. Компания просит клиентов предоставить обратную связь, опыт или оценку удовлетворенности по шкале
- Очень доволен
- Удовлетворен
- Нейтральный
- Недовольный
- Очень недоволен
Как анализировать порядковые данные?
Уровень измерения, который вы используете для порядковых данных, определяет тип анализа, который вы можете выполнить для данных. Порядковые данные можно анализировать с помощью описательной статистики и выводной статистики.
Описательная статистика позволяет обобщать характеристики набора данных, в то время как выводная статистика помогает делать прогнозы на основе текущих данных.
Используя порядковые данные, можно получить следующую описательную статистику:
- Распределение частот – описывает в числах или процентах, как распределены ваши порядковые данные. Например, вы можете суммировать оценки, полученные студентами, используя сводную таблицу или таблицу частот, где значения представлены в виде процентов или количества. Таблица позволяет вам увидеть, как распределены значения.
- Другой способ обзора распределения частот — визуализация данных с помощью столбчатой диаграммы. Порядок категорий важен при отображении порядковых данных.
- Меры центральной тенденции: Мода и/или медиана — центральная тенденция набора данных — это то, где находится большинство значений. Среднее значение, медиана (центральное значение) и мода (значение, которое чаще всего повторяется) являются наиболее распространенными мерами центральной тенденции. Однако, поскольку порядковые данные не являются числовыми, определение среднего значения с помощью математических операций не может быть выполнено с порядковыми данными.
Режим можно легко определить по таблице частот или гистограмме.
Медианное значение:
Значение в середине набора данных для нечетного набора
Среднее значение двух значений в середине четного набора данных.
Меры изменчивости: Диапазон – изменчивость можно оценить, найдя минимум, максимум и диапазон набора данных. Для расчета этого необходимо использовать числовые коды. Диапазон полезен, поскольку он показывает, насколько разбросаны значения в наборе данных.
Выводная статистика
Inferential Statistics помогает делать более широкие выводы о ваших данных. Статистические тесты работают, проверяя гипотезы и делая выводы на основе знаний. Эти тесты могут быть параметрическими или непараметрическими. Только непараметрические тесты могут использоваться с порядковыми данными, поскольку данные являются качественными.
Вот некоторые непараметрические тесты, которые можно использовать для порядковых данных:
- Медианный тест Муда — для сравнения медиан двух или более выборок и определения их различий.
- U-критерий Манна-Уитни сравнивает, принадлежат ли две независимые выборки к одной и той же совокупности или наблюдения в одной выборочной группе имеют тенденцию быть больше, чем в другой.
- Критерий знаковых рангов Уилкоксона — для сравнения того, как и насколько различается распределение баллов в двух зависимых выборках данных или повторных измерениях одной и той же выборки.
- Тест H Краскела-Уоллиса – сравнивает средние рейтинги оценок в трех или более независимых выборках данных. Тест помогает определить, происходят ли выборки из одного распределения.
Коэффициент ранговой корреляции Спирмена – для исследования корреляций между двумя порядковыми переменными. Этот тест измеряет статистическую зависимость между рангами переменных.
Номинальные и порядковые данные
Номинальные данные — это еще один качественный тип данных, используемый для маркировки переменных без определенного порядка или количественного значения.
Основные различия между номинальными данными и порядковыми данными:
- В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый предопределенный или естественный порядок.
- Номинальные данные — это качественные или категориальные данные, в то время как порядковые данные считаются «промежуточными» между качественными и количественными данными.
- Номинальные данные не предоставляют никакой количественной ценности, и вы не можете выполнять с ними числовые операции или сравнивать их друг с другом. Однако порядковые данные предоставляют последовательность, и данным можно присваивать номера. Числовые операции выполнять нельзя. Но порядковые данные позволяют сравнивать один элемент с другим с точки зрения ранжирования.
- Пример номинальных данных — цвет глаз, пол; Пример порядковых данных — отзывы клиентов, экономический статус.
Часто задаваемые вопросы
1. Что такое порядковые данные?
Порядковые данные — это вид качественных данных, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале, например, от высокого к низкому. Но между категориями нет четко определенного интервала.
2. Каковы четыре уровня измерения?
Уровни измерения показывают, насколько точно были записаны переменные. Четыре уровня измерения:
- Номинальный: простейший тип данных, данные можно только категоризировать.
- Порядковый: данные можно категоризовать, вводя порядок или рейтинг.
- Интервал: данные можно категоризировать и ранжировать, а также размещать их через равные интервалы.
- Соотношение: самый сложный уровень измерения. Здесь данные можно категоризировать, ранжировать и равномерно распределять. Также имеет истинный ноль.
3. В чем разница между номинальными и порядковыми данными?
Номинальный и порядковый — это два уровня измерения. В то время как номинальные данные могут быть классифицированы только без какого-либо внутреннего порядка или ранга, порядковые данные могут быть классифицированы и имеют некий предопределенный или естественный порядок.
4. Являются ли порядковые переменные категориальными или количественными?
Порядковые переменные — это категориальные переменные, которые содержат категориальные или нечисловые данные, представляющие группировки.
5. Являются ли шкалы Лайкерта порядковыми или интервальными?
Шкала Лайкерта относится к шкале баллов, которую исследователи используют для проведения опросов и получения мнений людей по определенному вопросу. Индивидуальный балл шкалы Лайкерта обычно считается порядковыми данными, поскольку значения имеют четкий ранг или порядок, но не имеют равномерного распределения.
Однако общие показатели шкалы Лайкерта часто рассматриваются как интервальные данные, обладающие направленностью и равномерным распределением.
Заключение
То, что мы здесь обсудили, — это лишь верхушка айсберга с порядковыми данными, примерами, переменными и анализом. Если вы заинтересованы в глубоком погружении в эти темы или хотите построить карьеру в прибыльной области науки о данных, мы рекомендуем изучить наши высокорейтинговые курсы, такие как Caltech Post Graduate Program In Data Science.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)