Что такое номинальные данные? Определение, примеры, переменные и анализ

Уровень измерения переменных имеет важное значение в статистическом анализе, поскольку он определяет, как вы можете анализировать свои данные. Четыре основных уровня измерения — номинальный, порядковый, интервальный и относительный — обеспечивают разные уровни детализации — номинальный обеспечивает мизерную детализацию, тогда как интервальный и относительный — максимальную.

Если вам интересно изучить основы номинальных данных, это руководство для вас. Мы определим, что такое номинальные данные, рассмотрим характеристики номинальных данных, примеры номинальных данных, как анализировать номинальные данные и номинальные против порядковых данных.

Что такое номинальные данные?

Номинальные данные — это качественные данные, используемые для наименования или маркировки переменных без предоставления числовых значений. Это самый простой тип шкалы измерения. Номинальные переменные маркируются в категории, которые не перекрываются. В отличие от других типов данных, номинальные данные нельзя упорядочить или измерить; они не имеют равного расстояния между значениями или истинного нулевого значения.

Номинальные данные являются основой статистического анализа и всех других математических наук. Они включают в себя отдельные фрагменты информации, записанные и используемые для анализа.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Например, предпочитаемый вид транспорта является номинальной переменной, поскольку мы можем отсортировать данные по взаимоисключающим категориям, таким как автомобиль, автобус, поезд, велосипед и т. д. Числа и слова могут обозначать номинальные переменные, но числовые метки не имеют числового значения.

Характеристики номинальных данных

Основными характеристиками номинальных данных являются:

  • Номинальные данные являются категориальными, категории являются взаимоисключающими и не пересекаются.
  • Категории номинальных данных являются чисто описательными, то есть они не обладают никакой количественной или числовой ценностью. Номинальные данные никогда не могут быть количественно выражены
  • Номинальные данные не могут быть помещены в какой-либо определенный порядок или иерархию. Ни одна из категорий не может быть больше или ценнее другой.
  • Среднее значение номинальных данных невозможно рассчитать, даже если данные расположены в алфавитном порядке.
  • Мода является единственной мерой центральной тенденции для номинальных данных.
  • В большинстве случаев номинальные данные располагаются в алфавитном порядке.

Номинальный анализ данных

Большинство номинальных данных собирается с помощью открытых или закрытых вопросов, которые предоставляют респонденту список меток на выбор.

Закрытые вопросы используются в том случае, если все данные можно собрать с помощью нескольких возможных меток.

С другой стороны, если выбранная переменная имеет много возможных меток, предпочтительным является открытый вопрос.

Например,

Какая у вас национальность? __ (далее следует раскрывающийся список национальностей)

Номинальные данные можно организовать и визуализировать в таблицах и диаграммах. После этого вы можете получить описательную статистику о вашем наборе данных для расчета распределения частот и центральной тенденции ваших данных.

Общие шаги, которые необходимо предпринять для анализа номинальных данных, включают:

Описательная статистика

На этом этапе описательная статистика позволит вам увидеть, как распределены ваши данные. Наиболее распространенными методами описательной статистики для номинальных данных являются

  • Распределение частот – таблица распределения частот создана для упорядочивания номинальных данных. Такая таблица наглядно показывает количество ответов для каждой категории в переменной. Таким образом, вы можете использовать эти таблицы для визуализации распределения данных с помощью графиков и диаграмм.

Центральная тенденция

это мера того, где находится большинство значений. Наиболее часто используемые меры центральной тенденции — это среднее значение, медиана и мода. Однако, поскольку номинальные данные являются чисто качественными, для номинальных данных можно рассчитать только одну моду.

Вы можете найти моду, определив наиболее часто встречающееся значение в таблице частот.

Статистические тесты

Выводная статистика позволяет вам проверять научные гипотезы о данных и глубже проникать в то, что передают данные. Непараметрические тесты используются для номинальных данных, поскольку данные не могут быть упорядочены каким-либо осмысленным образом.

Непараметрические тесты, используемые для номинальных данных:

  • Тест согласия хи-квадрат – этот тест помогает оценить, являются ли собранные данные выборки репрезентативными для всей совокупности данных. Тест используется, когда данные собираются из одной совокупности посредством случайной выборки.

  • Тест независимости хи-квадрат исследует связь между двумя номинальными переменными. Проверка гипотез позволяет проверить, являются ли две номинальные переменные из одной выборки независимыми.

Примеры номинальных данных

Большинство номинальных данных сортируются по категориям, где каждый ответ попадает только в одну категорию.

Вот некоторые примеры номинальных данных:

1. В каком штате вы живете? (Далее следует раскрывающийся список названий штатов)

2.Какую из перечисленных начинок вы обычно выбираете в качестве начинки для пиццы?

  • Лук
  • Помидоры
  • Шпинат
  • Пепперони
  • Оливки
  • Колбаса
  • Дополнительный сыр
  • Какая самая любимая порода собак?
  • Доберман – 1
  • Далматинец – 2
  • Лабрадор – 3
  • Немецкая овчарка – 4

3. Цвет волос (черный, коричневый, седой, светлый)

4. Предпочтительный вид общественного транспорта (автобус, трамвай, поезд)

5. Статус занятости (работающий, безработный, пенсионер)

6. Литературный жанр (комедия, трагедия, драма, эпос, сатира)

Номинальные и порядковые данные

Порядковые данные — это вид качественных данных, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале.

Основные различия между номинальными данными и порядковыми данными:

  • В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый предопределенный или естественный порядок.
  • Номинальные данные — это качественные или категориальные данные, в то время как порядковые данные считаются «промежуточными» между качественными и количественными данными.
  • Номинальные данные не предоставляют никакой количественной ценности, и вы не можете выполнять с ними числовые операции или сравнивать их друг с другом. Однако порядковые данные предоставляют последовательность, и данным можно присваивать номера. Числовые операции выполнять нельзя. Но порядковые данные позволяют сравнивать один элемент с другим с точки зрения ранжирования.
  • Пример номинальных данных — цвет глаз, пол; Пример порядковых данных — отзывы клиентов, экономический статус.

Часто задаваемые вопросы

1. Что такое номинальные или порядковые данные?

Существует четыре основных типа данных или уровня измерения — номинальный, порядковый, интервальный и относительный. Номинальные данные — это качественные данные, используемые для наименования или маркировки переменных без предоставления числовых значений. Это самая простая форма уровня измерения.

Порядковые данные также являются качественными данными, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале, например, от высокого к низкому.

В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый предопределенный или естественный порядок.

2. Что такое номинальная статистика данных?

В статистике номинальные данные — это качественные данные, которые группируют переменные в категории, которые не пересекаются. Номинальные данные — это простейший уровень измерения, который считается основой статистического анализа и всех других математических наук. Это отдельные фрагменты информации, записанные и используемые для анализа. Номинальные данные нельзя упорядочить и нельзя измерить.

3. Что такое примеры номинальных и порядковых данных?

1. Пример номинальных данных — В каком штате вы живете? (Далее следует раскрывающийся список названий штатов)

2. Пример порядковых данных – Оцените уровень образования по:

  • Элементарный
  • Средняя школа
  • Колледж
  • Выпускник
  • аспирантура

4. Каковы характеристики номинальных данных?

Основными характеристиками номинальных данных являются:

  • Номинальные данные являются категориальными, категории являются взаимоисключающими и не пересекаются.
  • Категории номинальных данных являются чисто описательными, то есть они не обладают никакой количественной или числовой ценностью. Номинальные данные никогда не могут быть количественно выражены
  • Номинальные данные не могут быть помещены в какой-либо определенный порядок или иерархию. Ни одна из категорий не может быть больше или ценнее другой.
  • Среднее значение номинальных данных невозможно рассчитать, даже если данные расположены в алфавитном порядке.
  • Мода является единственной мерой центральной тенденции для номинальных данных.
  • В большинстве случаев номинальные данные располагаются в алфавитном порядке.

5. Что является примером порядковых данных?

Организация просит сотрудников оценить, насколько они довольны своим руководителем и коллегами, по следующей шкале:

  • Очень счастлив – 1
  • Счастливые – 2
  • Нейронный – 3
  • Несчастный – 4
  • Крайне несчастлив – 5

6. Что является примером номинальных данных?

Пример номинальных данных:

  1. Какая самая любимая порода собак?
  • Доберман – 1
  • Далматинец – 2
  • Лабрадор – 3
  • Немецкая овчарка – 4

Агент по недвижимости проводит опрос, чтобы понять ответ на этот вопрос:

Какие дома предпочитают жители города X?

  • Апартаменты -А
  • Бунгало – Б
  • Виллы – С

Выберите правильную программу

Сделайте осознанный выбор и ускорьте свою карьеру в области науки о данных, выбрав идеальную программу. Мы тщательно провели детальное сравнение наших курсов, что позволит вам изучить специфику и найти программу, которая идеально соответствует вашим целям и стремлениям в динамичной области науки о данных.

Название программыМагистерская программа «Специалист по данным»Программа последипломного образования в области науки о данныхПрограмма последипломного образования в области науки о данных
ГеоВсе ГеоВсе ГеоНе применимо в США.
УниверситетSimplelearnПердьюКалтех
Продолжительность курса11 месяцев11 месяцев11 месяцев
Требуется опыт кодированияБазовыйБазовыйНет
Навыки, которые вы приобрететеБолее 10 навыков, включая структуру данных, обработку данных, NumPy, Scikit-Learn, Tableau и многое другое8+ навыков, включая
Исследовательский анализ данных, описательная статистика, выводная статистика и многое другое
8+ навыков, включая
Контролируемое и неконтролируемое обучение
Глубокое обучение
Визуализация данных и многое другое
Дополнительные преимуществаПрикладное обучение через Capstone и более 25 проектов по науке о данныхЧленство в Ассоциации выпускников Пердью
Бесплатное членство IIMJobs Pro на 6 месяцев
Помощь в составлении резюме
До 14 кредитов CEU Членство в кружке Caltech CTME
Расходы$$$$$$$$$$
Программа исследованияПрограмма исследованияПрограмма исследования

Заключение

В этой статье обсуждаются основы номинальных данных, их определение, примеры, переменные и анализ. Если вы хотите узнать об этих темах более подробно, наша программа Caltech Post Graduate Program In Data Science идеально вам подойдет. Это также отличный способ получить сертификат от отраслевых экспертов и вывести свою карьеру в области аналитики данных или науки о данных на новый уровень.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *