Различия между таблицей фактов и таблицей измерений

Таблицы фактов и таблицы измерений являются ключевыми компонентами схемы в хранилище данных. Таблица фактов содержит записи, объединяющие атрибуты из разных таблиц измерений. Эти записи позволяют пользователям анализировать различные аспекты своего бизнеса, что может помочь в принятии решений и улучшении бизнеса.

Таблицы измерений, с другой стороны, предоставляют контекстную и исходную информацию для показателей, записанных в таблице фактов. Одно из основных различий между таблицами фактов и таблицами измерений заключается в том, что таблицы измерений содержат атрибуты, на которых основаны меры в таблице фактов.

В этой статье мы обсудим обе эти концепции, а также их различия, чтобы иметь возможность принимать более эффективные решения в области анализа данных!

Что такое таблица фактов?

В хранилище данных таблица фактов — это таблица, в которой хранятся измерения, показатели или факты, связанные с бизнес-операцией.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Он расположен в центре схемы звезды или снежинки и окружен размерными таблицами.

  • Когда используется несколько таблиц фактов, их можно организовать с помощью «схемы совокупности фактов».
  • Таблица фактов имеет два типа столбцов: те, которые содержат факты, и те, которые служат внешними ключами, связывающимися с таблицами измерений.
  • Первичный ключ таблицы фактов часто представляет собой составной ключ, состоящий из всех внешних ключей таблицы.
  • Таблицы фактов могут содержать различные типы измерений, такие как аддитивные, неаддитивные и частично аддитивные меры, а также хранить важную информацию в хранилище данных.
  • Они полезны для оценки атрибутов измерений, поскольку предоставляют аддитивные значения, которые могут действовать как независимые переменные.

Давайте посмотрим на некоторые основные характеристики таблицы фактов.

Характеристики таблицы фактов

Ниже приведены некоторые характеристики таблицы фактов:

  • Размеры выносных опор: Размеры выносных опор — это размеры, которые относятся к любой другой таблице размеров.
  • Ключи. Каждая таблица фактов имеет ключ, состоящий из первичных ключей всех таблиц измерений, подключенных к этой таблице фактов. Объединенный ключ — это один из таких ключей, который конкретно идентифицирует строку таблицы фактов.
  • Аддитивные меры. Атрибуты таблицы фактов могут быть полностью, частично или не аддитивными. Меры, которые применяются ко всем измерениям, называются полностью сложенными или аддитивными мерами. Квазимеры — это те, которые хранят фундаментальную единицу измерения любого бизнес-процесса, тогда как полуаддитивные меры добавляют меры к некоторым измерениям, но не ко всем.
  • Зернистость таблицы фактов. Уровень детализации или глубины информации, записанной в таблице фактов, называется зернистостью таблицы. Успешная таблица фактов должна быть разработана на самом высоком уровне.
  • Вырожденные измерения: Вырожденное измерение — это любое измерение или атрибут, который доступен в таблице фактов, но не может быть добавлен или не является аддитивным.
  • Разреженные данные. Некоторые записи в таблице фактов имеют характеристики с нулевыми значениями или измерениями, что означает, что содержащаяся в них информация не задается и не предоставляется.
  • Сжатые измерения свертки. Измерения, созданные путем разделения столбцов и строк базового измерения, называются сжатыми измерениями свертки.

Понимание детализации таблицы фактов

Детализация таблицы фактов является распространенным способом ее описания. Зерно таблицы фактов относится к самому базовому уровню, на котором могут быть определены факты. Например, структурой таблицы фактов продаж может быть «объем продаж по дневным побочным продуктам по магазинам», что означает, что каждая запись в таблице однозначно идентифицируется по дню, продукту и магазину. Другие измерения, такие как местоположение или регион, также могут быть включены в таблицу фактов, но они не способствуют уникальности записей. Эти «партнерские измерения» могут предоставить дополнительную информацию для анализа, но обычно они дают информацию на более высоком уровне агрегирования (поскольку в регионе много магазинов).

Теперь мы поймем динамику Таблицы измерений.

Что такое таблица размеров?

Таблицы измерений содержат описания объектов в таблице фактов и предоставляют информацию об измерениях, такую ​​как значения, характеристики и ключи.

  • Эти таблицы обычно небольшие, с количеством строк от нескольких сотен до нескольких тысяч.
  • Термин «таблица измерений» относится к набору данных, относящихся к любому измеримому событию, и является основой для многомерного моделирования.
  • В таблицах измерений есть столбец, который служит первичным ключом, позволяя однозначно идентифицировать каждую строку или запись измерения. Этот ключ используется для связи таблицы измерений с таблицами фактов. Суррогатный ключ, который представляет собой ключ, сгенерированный системой, часто используется для уникальной идентификации строк в таблице измерений.

Чтобы лучше это понять, давайте посмотрим на некоторые характеристики таблицы измерений.

Характеристики таблицы размеров

Ниже приведены некоторые характеристики таблицы измерений:

  • Связь между атрибутами. Хотя все они включены в одну и ту же таблицу измерений, атрибуты в ней обычно не имеют прямой связи друг с другом.
  • Записи. Таблица измерений содержит больше характеристик, чем записей.
  • Ключи: для каждой таблицы измерений требуется основной ключ, чтобы можно было однозначно идентифицировать каждую запись.
  • Нормализация: таблица измерений не нормализуется, поскольку при этом данные разбиваются на разные таблицы и затрудняется быстрое выполнение запросов, поскольку им приходится проходить через эти дополнительные таблицы, чтобы получить измерения из таблицы фактов для каждого соответствующего атрибута в таблице измерений. .
  • Атрибуты. Поскольку таблица измерений имеет так много атрибутов, кажется, что она расширяется по горизонтали.
  • Детализация, свертывание: наличие атрибутов в таблице измерений позволяет извлекать информацию путем детализации с более высокого уровня на более низкий уровень или путем свертывания с более низкого уровня на более высокий уровень атрибутов.
  • Значения атрибутов. Большинство значений в таблице измерений выражаются в виде текста, а не чисел.

Теперь, когда у нас есть общее представление о таблицах фактов и измерений, давайте поймем ключевые различия между этими двумя типами таблиц в хранилище данных.

Таблица фактов и таблица измерений

Несмотря на то, что таблицы фактов и измерений связаны друг с другом, они имеют множество различий.

Вот некоторые из их основных отличий:

Основа различия

Таблица фактов

Таблица размеров

Определение

Факты о бизнес-процессе, такие как измерения или метрики.

Описательные характеристики в сопутствующей таблице к таблице фактов могут использоваться в качестве ограничений запроса.

Характеристики

Расположен в середине схемы снежинки или звезды, окруженной размерами.

Края схемы снежинки или звезды, прикрепленные к таблице фактов,

Дизайн

Определяется по крупицам или на атомном уровне.

Оно должно быть обширным, глубоким и самого высокого уровня.

Задача

Таблица фактов — это поддающееся количественному измерению событие, для которого данные из таблицы измерений собираются и используются для отчетности и анализа.

Сбор исходной информации о компании.

Тип данных

Таблицы фактов могут включать данные о продажах по ряду параметров, таких как «Продукт» и «Дата».

Каждая таблица измерений имеет атрибуты, которые предоставляют информацию об особенностях измерения. Например, измерения продукта могут включать идентификатор продукта, категорию и т. д.

Ключ

Первичный ключ таблицы фактов сопоставляется с измерениями как внешний ключ.

Каждое измерение в таблице измерений содержит столбец первичного ключа, который однозначно идентифицирует его.

Хранилище

Помогает сохранять метки отчетов и фильтровать значения домена в таблицах измерений.

Загрузите размерные структуры с подробными атомарными данными.

Иерархия

Не содержит иерархии.

Иерархии присутствуют. Например, местоположение может включать страну, штат, город, почтовый индекс и т. д.

Чтобы лучше понять основной контекст каждой из этих концепций, нам необходимо понять их различные типы. В следующем разделе мы разберемся с типами фактов и измерений, а также с их подробными примерами.

Типы фактов

Ниже приведены различные категории фактов:

Типы фактов

Объяснение

Добавка

Все размеры следует умножить на меры.

Неаддитивный

Меры могут быть введены для некоторых измерений в этом типе данных, но не для других.

Полудобавка

Он отслеживает некоторые фундаментальные показатели бизнес-процессов. Примеры из реального мира включают заказы, телефонные звонки и продажи.

Типы размеров

Основные типы размеров подразделяются на следующие категории:

Типы размеров

Объяснение

Уменьшенные размеры свертки

Сжимает строки и столбцы базового измерения, которые делятся на свернутые измерения. Для создания сводных таблиц фактов полезно использовать несколько типов измерений.

Размеры выносных опор

В измерении может быть ссылка на другую таблицу измерений. Размеры выносных опор — это название этих дополнительных размеров. Использование этих измерений должно быть разумным.

Ролевые измерения

Одно конкретное измерение может упоминаться в структуре таблицы более одного раза, поскольку каждое упоминание указывает на одну из логически отдельных ролей измерения.

Размеры шага

Каждый шаг последовательных операций, таких как события веб-страницы, часто имеет собственную строку в таблице фактов. Он указывает, где во всем сеансе следует использовать конкретный шаг.

Вырожденные размеры

Без сравнимого измерения измерение является вырожденным. Он используется в транзакциях и сборе таблиц фактов для снимков. Поскольку оно берется из таблицы фактов, этот тип измерения не имеет собственного измерения.

Соответствующие размеры

Обратитесь к самой реальности согласованных измерений. Это измерение используется в витринах данных или схемах с более чем одной звездочкой.

Ненужные размеры

Он состоит из группы случайно выбранных транзакционных кодов, флагов или текстовых свойств. Логически это может не подпадать под какое-либо одно измерение.

Соединения таблиц измерений с измерениями

В измерении могут быть ссылки на некоторые другие измерения. Однако размеры выносных опор можно использовать для моделирования этих взаимодействий.

Сменные размеры

Они применяются, когда различные итерации одного измерения сочетаются с одной и той же таблицей фактов.

После изучения таблиц фактов и измерений, их основных различий и типов пришло время суммировать ключевые различия между ними, чтобы укрепить наше понимание их.

Таблица фактов и таблица измерений: ключевые различия

Ключевые различия между таблицами фактов и таблицами измерений заключаются в следующем:

  • Таблица измерений является партнером таблицы фактов и содержит описательные свойства, которые можно использовать в качестве ограничений запроса. Таблица фактов включает измерения, показатели или факты о бизнес-операциях.
  • Ядро схемы «звезда и снежинка» — это место, где расположена содержащая ее таблица, а ее края — это место, где расположена таблица измерений.
  • Таблица фактов должна быть длинной, описательной, полной и гарантированного качества, тогда как таблица фактов характеризуется зернистостью или даже наиболее атомарным уровнем.
  • Хотя база данных измерений содержит обширную информацию, таблица фактов используется для хранения меток отчета.
  • В отличие от таблицы измерений, которая включает иерархии, в таблице нет.

Чтобы еще лучше понять эти ключевые различия, давайте рассмотрим пример, связывающий отношения между таблицами фактов и измерений.

Пример таблицы фактов и таблицы измерений

Допустим, компания продает товары клиентам. Каждая транзакция — это факт, который действительно происходит, и таблица фактов — это место, где эти факты записываются.

Например:

Идентификатор заказа

Хороший идентификатор

Идентификатор клиента

Продано единиц

142

897

45

9

143

452

76

6

144

16

28

30

Теперь мы можем включить таблицу размеров для клиентов:

Идентификатор клиента

Имя

Пол

Доход

Образование

Область

28

Мариана Джонс

Ф

300000

3

3

45

Кристофер Нолан

М

600000

2

2

76

Миа Риана

Ф

1000000

3

6

Столбец идентификатора клиента в таблице фактов используется для подключения к таблице измерений. Например, если вы посмотрите на строку 2 таблицы фактов, вы увидите, что клиент 3, Миа Риана, совершила покупку шести товаров с идентификатором заказа 143. Чтобы узнать дополнительную информацию о том, что купила Миа и когда компания также иметь таблицу продуктов и расписание.

При разработке таблиц фактов необходимо учитывать как физические ограничения, так и ограничения данных. Важно подумать о размере таблицы и способах доступа к ней. Индексы могут быть полезны для оптимизации обоих этих факторов. Однако с точки зрения логического проектирования не должно быть никаких ограничений на структуру таблицы. Он должен быть спроектирован с учетом текущих и будущих потребностей и иметь как можно большую гибкость, чтобы обеспечить возможность будущих обновлений без необходимости полной перестройки данных.

Выберите правильную программу

Хотите построить карьеру в захватывающей области анализа данных? Наши курсы по анализу данных созданы для того, чтобы предоставить вам навыки и знания, необходимые для достижения успеха в этой быстрорастущей отрасли. Наши опытные инструкторы проведут вас через практические проекты, реальные сценарии и тематические исследования, предоставив вам практический опыт, необходимый для достижения успеха. На наших курсах вы научитесь анализировать данные, создавать подробные отчеты и принимать решения на основе данных, которые помогут добиться успеха в бизнесе.

Название программыАналитик данныхПоследипломная программа по аналитике данныхУчебный курс по аналитике данных
ГеоВсе регионыВсе регионыНАС
УниверситетПростое обучениеПердьюКалифорнийский технологический институт
Продолжительность курса11 месяцев8 месяцев6 месяцев
Требуется опыт кодированияНетБазовыйНет
Навыки, которые вы изучитеБолее 10 навыков, включая Python, MySQL, Tableau, NumPy и другие.Аналитика данных, статистический анализ с использованием Excel, анализ данных Python и R и многое другое.Визуализация данных с помощью таблиц, линейной и логистической регрессии, манипулирования данными и многого другого.
Дополнительные преимуществаПрикладное обучение через Capstone и более 20 отраслевых проектов по анализу данныхЧленство в Ассоциации выпускников Purdue
Бесплатное членство IIMJobs Pro на 6 месяцев
Доступ к интегрированным практическим лабораториям. Членство в кружке CTME Caltech.
Расходы$$$$$$$$$$
Изучите программуИзучите программуИзучите программу

Узнайте больше о таблицах фактов и таблицах измерений с помощью сертификационного курса Simplilearn по аналитике данных PCP

Таблицы фактов и таблицы измерений играют разные, но важные роли в хранилище данных. Таблицы фактов содержат числовые данные, а таблицы измерений предоставляют контекстную и справочную информацию. Оба типа таблиц необходимы для эффективного анализа данных и принятия решений.

Подумайте о посещении сертификационного учебного курса по аналитике данных PCP, предоставленного Simplilearn, если вы хотите узнать больше об анализе данных и о том, как использовать эти концепции в реальных ситуациях. Вы можете получить навыки и информацию, необходимые для успеха в отрасли, записавшись на этот подробный курс, который охватывает широкий спектр тем, включая хранилища данных и бизнес-аналитику.

Часто задаваемые вопросы

1. Что такое таблица измерений и фактов с примерами?

Основное различие между таблицей фактов, также известной как таблица реальности, и таблицей измерений состоит в том, что последняя включает в себя свойства, на основе которых производятся фактические измерения.

2. Что такое факты и измерения?

Терминология хранилищ данных включает факты и измерения. Факт — это часть информации с определенным числовым значением, например продажа или загрузка. Факты хранятся в таблицах фактов, которые связаны с несколькими таблицами измерений внешним ключом. Факты сопровождаются измерениями, которые описывают элементы в таблице фактов.

3. Почему таблица фактов больше таблицы измерений?

Таблицы фактов содержат больше записей и меньше атрибутов, тогда как таблицы измерений содержат больше атрибутов и меньше записей. В то время как таблица измерений расширяется по горизонтали, таблица фактов расширяется по вертикали. Хотя таблица измерений имеет первичный ключ, таблица имеет составной ключ.

4. Какова связь между фактами и измерениями?

Членство в одном измерении может быть связано со многими фактами в большинстве измерений, где каждый факт связан с одним и только одним членом измерения. На жаргоне реляционных баз данных это называется «каждое отношение». Однако часто бывает полезно связать одно доказательство с несколькими членами измерения.

5. Каковы 5 типов размеров?

Существует 9 типов размеров:

  • Уменьшенные размеры свертки
  • Размеры выносных опор
  • Ролевые измерения
  • Размеры шага
  • Вырожденные размеры
  • Соответствующие размеры
  • Ненужные размеры
  • Соединения таблиц измерений с измерениями
  • Сменные размеры

6. Какие три типа таблиц фактов существуют?

Существует три типа таблиц фактов:

  • Добавка
  • Неаддитивный
  • Полудобавка

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *