Что такое порядковые данные? Определение, примеры, переменные и анализ
Если ваша профессия предполагает работу с данными в любом качестве, вы должны знать четыре основных типа данных — номинальные, порядковые, интервальные и пропорциональные. В этом руководстве мы сосредоточимся на порядковых данных. Мы определим, что такое порядковые данные, рассмотрим их характеристики и приведем примеры порядковых данных. Читайте дальше, чтобы узнать все, что вам нужно знать об анализе порядковых данных, их использовании, а также сравнении номинальных и порядковых данных.
Что такое порядковые данные?
Порядковые данные — это своего рода качественные данные, которые группируют переменные в упорядоченные категории, которые имеют естественный порядок или ранг, основанный на некоторой иерархической шкале, например, от высокого к низкому. Однако между категориями отсутствуют четко определенные интервалы. По уровням измерения порядковые данные занимают второе место по сложности после номинальных данных.
Мы используем порядковые данные для наблюдения за отзывами клиентов, их удовлетворенностью, экономическим статусом, уровнем образования и т. д. Такие данные показывают только последовательность и не могут использоваться для статистического анализа. Мы не можем выполнять арифметические задачи с порядковыми данными.
Характеристики порядковых данных
- Порядковые данные не являются числовыми или категориальными, но могут использовать числовые цифры в качестве меток категоризации.
- Порядковые данные всегда ранжируются в некотором естественном порядке или иерархии. Поэтому их называют порядковыми.
- Порядковые данные — это данные, помеченные в определенном порядке. Таким образом, его можно охарактеризовать как дополнение к номинальным данным.
- Порядковые данные всегда упорядочены, но значения распределены неравномерно. Различия между интервалами неравномерны или неизвестны.
- Порядковые данные можно использовать для расчета сводной статистики, например, распределения частот, медианы, режима и диапазона переменных.
- Порядковые данные имеют медиану.
Порядковые переменные
Порядковые переменные — это категориальные переменные с упорядоченными возможными значениями. Их можно рассматривать как «промежуточные» категориальные и количественные переменные.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Порядковые переменные можно классифицировать как:
Соответствующая категория
В этой категории каждый член выборки данных сопоставляется с аналогичными членами всех других выборок с точки зрения всех других переменных, кроме рассматриваемой. Это помогает лучше оценить различия. Устранение других переменных предотвращает их влияние на результаты проводимого исследования.
Существует два типа тестов, выполняемых для соответствующей категории переменных:
- Знаковый тест Уилкоксона
- Двухфакторный дисперсионный анализ Фридмана
Непревзойденная категория
В этой категории случайным образом отбираются несовпадающие или независимые выборки с переменными, независимыми от значений других переменных.
Тесты, проведенные для несовпадающей категории переменных:
- Критерий суммы рангов Уилкоксона или U-критерий Манна-Уитни
- Односторонний тест Крускала-Уоллиса
Примеры порядковых данных
Порядковые данные часто включают оценки мнений или чувств или демографические факторы, такие как социальный статус или доход, которые разбиты по уровням.
Интервальная шкала
Интервальная шкала — это своего рода порядковая шкала, в которой каждый ответ имеет форму отдельного интервала.
Примеры:
1. Ранжируйте экономический статус в соответствии с неравномерно распределенным диапазоном уровней доходов:
- Плохой или низкий доход (10–20 тыс. долларов США)
- Средний доход (20–35 тыс. долларов США)
- Богатые (35–100 тыс. долларов США)
2. Оцените уровень образования по:
- элементарный
- Средняя школа
- Колледж
- Выпускник
- аспирант
Шкала Лайкерта
Шкала Лайкерта представляет собой балльную шкалу, которую исследователи используют для проведения опросов и получения мнения людей по тому или иному вопросу.
Примеры:
1. Организация просит сотрудников оценить, насколько они довольны своим руководителем и коллегами по следующей шкале:
- Очень счастлив – 1
- Счастья – 2
- Нейронные – 3
- Несчастный – 4
- Крайне несчастен – 5
2. Компания просит клиентов оставить отзыв, опыт или удовлетворенность по шкале.
- Очень доволен
- Удовлетворен
- Нейтральный
- Неудовлетворенный
- Очень недоволен
Как анализировать порядковые данные?
Уровень измерения, который вы используете для порядковых данных, определяет тип анализа, который вы можете выполнить над данными. Порядковые данные можно анализировать с помощью описательной статистики и логической статистики.
Описательная статистика позволяет суммировать характеристики набора данных, а логическая статистика помогает делать прогнозы на основе текущих данных.
Следующая описательная статистика может быть получена с использованием порядковых данных:
- Распределение частот – описывает в числах или процентах, как распределяются ваши порядковые данные. Например, вы можете суммировать оценки, полученные учащимися, с помощью сводной таблицы или таблицы частот, где значения представлены в процентах или количестве. Таблица позволяет увидеть, как распределяются значения.
- Другой способ обзора распределения частот — визуализация данных с помощью гистограммы. Порядок категорий важен при отображении порядковых данных.
- Меры центральной тенденции: мода и/или медиана – центральная тенденция набора данных находится там, где находится большинство значений. Среднее значение, медиана (центральное значение) и мода (значение, которое чаще всего повторяется) являются наиболее распространенными показателями центральной тенденции. Однако, поскольку порядковые данные не являются числовыми, определение среднего значения с помощью математических операций невозможно выполнить с порядковыми данными.
Режим можно легко определить по таблице частот или гистограмме.
Среднее значение составляет:
Значение в середине набора данных для набора с нечетным номером.
Среднее значение двух значений в середине набора данных с четным номером.
Меры изменчивости: Диапазон – изменчивость можно оценить, найдя минимум, максимум и диапазон набора данных. Для расчета необходимо использовать числовые коды. Диапазон полезен, поскольку он указывает, насколько разбросаны значения в наборе данных.
Инференциальная статистика
Инференциальная статистика помогает получить более широкое представление о ваших данных. Статистические тесты работают, проверяя гипотезы и делая выводы, основанные на знаниях. Эти тесты могут быть параметрическими и непараметрическими. С порядковыми данными можно использовать только непараметрические тесты, поскольку данные являются качественными.
Некоторые непараметрические тесты, которые можно использовать для порядковых данных:
- Медианный тест настроения – для сравнения медиан двух или более выборок и определения их различий.
- U-критерий Манна-Уитни – сравнивает, принадлежат ли две независимые выборки к одной и той же совокупности или наблюдения в одной группе выборок имеют тенденцию быть больше, чем в другой.
- Знако-ранговый критерий Уилкоксона – для сравнения того, как и насколько распределение оценок различается в двух зависимых выборках данных или повторных измерениях одной и той же выборки.
- Критерий Крускала-Уоллиса H – сравнивает средние рейтинги оценок в трех или более независимых выборках данных. Тест помогает определить, происходят ли образцы из одного дистрибутива.
- Коэффициент ранговой корреляции Спирмена – для изучения корреляции между двумя порядковыми переменными. Этот тест измеряет статистическую зависимость между рейтингами переменных.
Номинальные и порядковые данные
Номинальные данные — это еще один качественный тип данных, используемый для обозначения переменных без определенного порядка или количественного значения.
Основные различия между номинальными данными и порядковыми данными:
- В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый заранее определенный или естественный порядок.
- Номинальные данные — это качественные или категориальные данные, тогда как порядковые данные считаются «промежуточными» качественными и количественными данными.
- Номинальные данные не несут никакой количественной ценности, и с ними нельзя выполнять числовые операции или сравнивать их друг с другом. Однако порядковые данные обеспечивают последовательность, и данным можно присвоить номера. Никакие числовые операции не могут быть выполнены. Но порядковые данные позволяют сравнивать один элемент с другим с точки зрения ранжирования.
- Пример номинальных данных: цвет глаз, пол; Пример порядковых данных: отзывы клиентов, экономический статус
Часто задаваемые вопросы
1. Что такое порядковые данные?
Порядковые данные — это своего рода качественные данные, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале, например, от высокого к низкому. Но четко определенного интервала между категориями нет.
2. Каковы четыре уровня измерения?
Уровни измерения показывают, насколько точно переменные были записаны. Четыре уровня измерения:
- Номинальный: самый простой тип данных, для которого данные можно только классифицировать.
- Порядковый номер: данные можно классифицировать при введении порядка или ранжирования.
- Интервал: данные можно классифицировать и ранжировать, а также размещать через равные промежутки времени.
- Соотношение: самый сложный уровень измерения. Здесь данные можно классифицировать, ранжировать и равномерно распределять. Он также имеет истинный ноль.
3. В чем разница между номинальными и порядковыми данными?
Номинальный и порядковый – два уровня измерения. В то время как номинальные данные могут быть классифицированы только без какого-либо внутреннего порядка или ранга, порядковые данные могут быть классифицированы и имеют некоторый заранее определенный или естественный порядок.
4. Являются ли порядковые переменные категориальными или количественными?
Порядковые переменные — это категориальные переменные, которые содержат категориальные или нечисловые данные, представляющие группы.
5. Являются ли шкалы Лайкерта порядковыми или интервальными?
Шкала Лайкерта представляет собой балльную шкалу, которую исследователи используют для проведения опросов и получения мнения людей по конкретному вопросу. Индивидуальный балл по шкале Лайкерта обычно считается порядковыми данными, поскольку значения имеют четкий ранг или порядок, но не имеют равномерного распределения.
Однако общие оценки по шкале Лайкерта часто считаются интервальными данными, обладающими направленностью и даже интервалом.
Заключение
То, что мы здесь обсуждали, представляет собой лишь верхушку айсберга с порядковыми данными, примерами, переменными и анализом. Если вы хотите углубиться в эти темы или хотите построить карьеру в прибыльной области науки о данных, мы рекомендуем изучить наши ведущие курсы, такие как последипломная программа Калифорнийского технологического института в области науки о данных.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)