Что такое номинальные данные? Определение, примеры, переменные и анализ
Уровень измерения переменных важен в статистическом анализе, поскольку он определяет, как вы можете анализировать свои данные. Четыре основных уровня измерения — номинальный, порядковый, интервальный и коэффициентный — обеспечивают различные уровни детализации: номинальный обеспечивает минимальную детализацию, а интервальный и коэффициентный уровень дают максимальную детализацию.
Если вы заинтересованы в изучении основ номинальных данных, это руководство для вас. Мы определим, что такое номинальные данные, рассмотрим характеристики номинальных данных, примеры номинальных данных, способы анализа номинальных данных, а также номинальные и порядковые данные.
Что такое номинальные данные?
Номинальные данные — это качественные данные, используемые для обозначения или обозначения переменных без указания числовых значений. Это самый простой тип шкалы измерения. Номинальные переменные помечены по категориям, которые не перекрываются. В отличие от других типов данных, номинальные данные нельзя упорядочить или измерить; он не имеет равного интервала между значениями или истинного нулевого значения.
Номинальные данные составляют основу статистического анализа и всех других математических наук. Они включают отдельные фрагменты информации, записанные и используемые для анализа.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Например, предпочтительным видом транспорта является номинальная переменная, поскольку мы можем сортировать данные по взаимоисключающим категориям, таким как автомобиль, автобус, поезд, велосипед и т. д. Числа и слова могут обозначать номинальные переменные, но числовые метки не имеют никаких значений. числовое значение.
Характеристики номинальных данных
Основными характеристиками номинальных данных являются:
- Номинальные данные являются категориальными, категории являются взаимоисключающими и не пересекаются.
- Категории номинальных данных носят чисто описательный характер, т. е. не имеют ни количественного, ни числового значения. Номинальные данные никогда не могут быть определены количественно.
- Номинальные данные нельзя расположить в каком-либо определенном порядке или иерархии. Ни одна из категорий не может быть больше или стоить больше, чем одна другая.
- Среднее значение номинальных данных невозможно вычислить, даже если данные расположены в алфавитном порядке.
- Мода является единственной мерой центральной тенденции для номинальных данных.
- В большинстве случаев номинальные данные располагаются в алфавитном порядке.
Анализ номинальных данных
Большая часть номинальных данных собирается с помощью открытых или закрытых вопросов опроса, которые предоставляют респонденту список ярлыков на выбор.
Закрытые вопросы используются, если все данные можно собрать с помощью нескольких возможных ярлыков.
С другой стороны, если выбранная переменная имеет множество возможных ярлыков, предпочтительным является открытый вопрос.
Например,
Какова ваша этническая принадлежность? __ (за которым следует раскрывающийся список национальностей)
Номинальные данные можно систематизировать и визуализировать в виде таблиц и диаграмм. После этого вы можете получить описательную статистику о вашем наборе данных, чтобы рассчитать частотное распределение ваших данных и центральную тенденцию.
Общие шаги, которые необходимо предпринять для анализа номинальных данных, включают:
Описательная статистика
На этом этапе описательная статистика позволит вам увидеть, как распределяются ваши данные. Наиболее распространенными методами описательной статистики для номинальных данных являются:
- Распределение частот – таблица распределения частот создается для упорядочивания номинальных данных. Такая таблица наглядно показывает количество ответов по каждой категории в переменной. Таким образом, вы можете использовать эти таблицы для визуализации распределения данных с помощью графиков и диаграмм.
Центральная тенденция
это мера того, где находится большинство ценностей. Наиболее часто используемыми мерами центральной тенденции являются среднее значение, медиана и мода. Однако, поскольку номинальные данные являются чисто качественными, для номинальных данных можно рассчитать только один режим.
Вы можете найти режим, определив наиболее часто встречающееся значение в вашей таблице частот.
Статистические тесты
Инференциальная статистика позволяет вам проверять научные гипотезы о данных и глубже разбираться в том, что они передают. Непараметрические тесты используются для номинальных данных, поскольку данные не могут быть упорядочены каким-либо значимым образом.
Непараметрические тесты, используемые для номинальных данных:
Критерий соответствия хи-квадрат – этот тест помогает оценить, являются ли собранные выборочные данные репрезентативными для всей совокупности данных. Тест используется, когда данные собираются из одной популяции посредством случайной выборки.
- Тест независимости Хи-квадрат исследует взаимосвязь между двумя номинальными переменными. Проверка гипотез позволяет проверить, являются ли две номинальные переменные из одной выборки независимыми.
Примеры номинальных данных
Большинство номинальных данных рассортировано по категориям, где каждый ответ соответствует только одной категории.
Некоторые примеры номинальных данных:
1. В каком штате вы живете? (Затем следует раскрывающийся список названий штатов)
2. Что из перечисленного вы обычно выбираете в качестве начинки для пиццы?
- Лук
- Помидоры
- Шпинат
- Пепперони
- Оливки
- Колбаса
- Экстра сыр
- Какая порода собак самая любимая?
- Доберман – 1
- Далматинец – 2
- Лабрадор – 3
- Немецкая овчарка – 4
3. Цвет волос (черный, коричневый, серый, блондин)
4. Предпочитаемый вид общественного транспорта (автобус, трамвай, поезд)
5. Статус занятости (работающий, безработный, пенсионер)
6. Литературный жанр (комедия, трагедия, драма, эпопея, сатира)
Номинальные и порядковые данные
Порядковые данные — это своего рода качественные данные, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале.
Основные различия между номинальными данными и порядковыми данными:
- В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый заранее определенный или естественный порядок.
- Номинальные данные — это качественные или категориальные данные, тогда как порядковые данные считаются «промежуточными» качественными и количественными данными.
- Номинальные данные не несут никакой количественной ценности, и с ними нельзя выполнять числовые операции или сравнивать их друг с другом. Однако порядковые данные обеспечивают последовательность, и данным можно присвоить номера. Никакие числовые операции не могут быть выполнены. Но порядковые данные позволяют сравнивать один элемент с другим с точки зрения ранжирования.
- Пример номинальных данных: цвет глаз, пол; Пример порядковых данных: отзывы клиентов, экономический статус
Часто задаваемые вопросы
1. Что такое номинальные или порядковые данные?
Существует четыре основных типа данных или уровней измерения: номинальный, порядковый, интервальный и относительный. Номинальные данные — это качественные данные, используемые для обозначения или обозначения переменных без указания числовых значений. Это наиболее простая форма измерения уровня.
Порядковые данные — это также качественные данные, которые группируют переменные в упорядоченные категории. Категории имеют естественный порядок или ранг, основанный на некоторой иерархической шкале, например, от высокого к низкому.
В то время как номинальные данные классифицируются без какого-либо внутреннего порядка или ранга, порядковые данные имеют некоторый заранее определенный или естественный порядок.
2. Что такое статистика номинальных данных?
В статистике номинальные данные — это качественные данные, которые группируют переменные в категории, которые не перекрываются. Номинальные данные представляют собой простейший уровень измерения и считаются основой статистического анализа и всех других математических наук. Это отдельные фрагменты информации, записанные и используемые для анализа. Номинальные данные не могут быть заказаны и не могут быть измерены.
3. Каковы примеры номинальных и порядковых данных?
1. Пример номинальных данных. В каком штате вы живете? (Затем следует раскрывающийся список названий штатов)
2. Пример порядковых данных. Оцените уровень образования в соответствии с:
- элементарный
- Средняя школа
- Колледж
- Выпускник
- аспирант
4. Каковы характеристики номинальных данных?
Основными характеристиками номинальных данных являются:
- Номинальные данные являются категориальными, категории являются взаимоисключающими и не пересекаются.
- Категории номинальных данных носят чисто описательный характер, т. е. не имеют ни количественного, ни числового значения. Номинальные данные никогда не могут быть определены количественно.
- Номинальные данные нельзя расположить в каком-либо определенном порядке или иерархии. Ни одна из категорий не может быть больше или стоить больше, чем одна другая.
- Среднее значение номинальных данных невозможно вычислить, даже если данные расположены в алфавитном порядке.
- Мода является единственной мерой центральной тенденции для номинальных данных.
- В большинстве случаев номинальные данные располагаются в алфавитном порядке.
5. Какой пример порядковых данных?
Организация просит сотрудников оценить, насколько они довольны своим руководителем и коллегами по следующей шкале:
- Очень счастлив – 1
- Счастья – 2
- Нейронные – 3
- Несчастный – 4
- Крайне несчастен – 5
6. Что является примером номинальных данных?
Пример номинальных данных:
- Какая порода собак самая любимая?
- Доберман – 1
- Далматинец – 2
- Лабрадор – 3
- Немецкая овчарка – 4
Агент по недвижимости проводит опрос, чтобы понять ответ на этот вопрос:
Какие дома предпочитают жители города X?
- Апартаменты -А
- Бунгало – Б
- Виллы – С
Выберите правильную программу
Сделайте осознанный выбор и ускорьте свою карьеру в области науки о данных, выбрав идеальную программу. Мы тщательно подготовили детальное сравнение наших курсов, что позволит вам изучить специфику и найти программу, которая идеально соответствует вашим целям и стремлениям в динамичной области науки о данных.
Название программы | Магистерская программа Data Scientist | Последипломная программа в области науки о данных | Последипломная программа в области науки о данных |
Гео | Все регионы | Все регионы | Не применимо в США |
Университет | Простое обучение | Пердью | Калтех |
Продолжительность курса | 11 месяцев | 11 месяцев | 11 месяцев |
Требуется опыт кодирования | Базовый | Базовый | Нет |
Навыки, которые вы изучите | Более 10 навыков, включая структуру данных, манипулирование данными, NumPy, Scikit-Learn, Tableau и многое другое. | 8+ навыков, включая Исследовательский анализ данных, описательная статистика, логическая статистика и многое другое. | 8+ навыков, включая Контролируемое и неконтролируемое обучение Глубокое обучение Визуализация данных и многое другое. |
Дополнительные преимущества | Прикладное обучение через Capstone и более 25 проектов по науке о данных | Членство в Ассоциации выпускников Purdue Бесплатное членство IIMJobs Pro на 6 месяцев Возобновить помощь в построении | До 14 кредитов CEU Членство в кружке Caltech CTME |
Расходы | $$ | $$$$ | $$$$ |
Изучите программу | Изучите программу | Изучите программу |
Заключение
В этой статье обсуждались основы номинальных данных, их определение, примеры, переменные и анализ. Если вы хотите узнать об этих темах более подробно, наша программа последипломного образования Калифорнийского технологического института в области науки о данных идеально подойдет вам. Это также отличный способ получить сертификат от отраслевых экспертов и поднять свою карьеру в области анализа данных или науки о данных на новый уровень.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)