Схема «Звезда» и схема «Снежинка»: ключевые различия между ними

Отдельные лица и организации постоянно производят данные. В большинстве случаев мы хотим сохранить сгенерированные данные, чтобы иметь к ним доступ позже. Все аспекты хранения данных, включая скорость, стоимость, надежность, безопасность и т. д., должны быть практичными. По этой причине существуют различные методы хранения данных. Наиболее широко используемый метод — хранилище данных.

Данные последних операционных процедур хранятся в хранилищах данных. Информация, которую можно использовать для таких целей, как бизнес-аналитика или аналитика, обычно хранится в хранилищах данных.

Существуют различные методы и рекомендации относительно того, как следует проектировать хранилище данных, какую архитектуру использовать и т. д. Тип схемы является одним из факторов, которые должен учитывать проектировщик хранилища данных.

В этой статье мы углубимся в схему «звезда» и схему «снежинка» и изучим ключевые различия между ними, включая их основные свойства и характеристики, преимущества и варианты использования. К концу этой статьи вы должны хорошо понимать плюсы и минусы каждой схемы с примерами и быть в состоянии принять обоснованное решение о том, какая из них лучше всего подходит для ваших потребностей в хранении данных.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Ваша карьера в области аналитики данных не за горами! Магистерская программа по аналитике данныхИзучите программуВаша карьера аналитика данных не за горами!

Что такое схема-снежинка?

Этот особый тип схемы хранилища данных имеет форму снежинки. Схема «снежинка» направлена ​​на нормализацию денормализованных данных схемы «звезда». Когда измерения звездообразной схемы сложны, высокоструктурированы и имеют множество степеней связи, а дочерние таблицы имеют несколько родительских таблиц, возникает структура «снежинка». Некоторые распространенные проблемы схемы «звезда» решаются с помощью схемы «снежинка».

Схему снежинки можно рассматривать как «многомерную» структуру. Центральный компонент схемы «снежинка» включает таблицы фактов, которые связывают данные внутри таблиц измерений, которые затем расходятся наружу, как схема «звезда». С другой стороны, схема снежинки делит таблицы измерений на несколько таблиц, в результате чего получается узор снежинки. До тех пор, пока они не будут полностью нормализованы, таблицы измерений разделены на несколько таблиц.

Характеристики схемы «снежинка»

Схема «снежинка» характеризуется нормализованной структурой данных, в которой данные разделены на более мелкие и более специализированные таблицы, связанные друг с другом посредством внешних ключей.

Вот его основные характеристики:

  • Для схемы «снежинка» требуется небольшое дисковое пространство.
  • Новое измерение схемы легко реализовать.
  • На производительность влияет большое количество таблиц.
  • Два или даже более набора атрибутов, описывающих данные различной степени детализации, составляют таблицу измерений.
  • Наборы характеристик единой таблицы измерений заполняются различными исходными системами.

Теперь, когда у нас есть базовое представление о схеме «снежинка», давайте углубимся в особенности схемы «звезда» и выясним, что отличает ее от других методов организации данных.

Что такое звездообразная схема?

Схема «звезда» — это наиболее простой метод организации данных в хранилище данных. Любая или даже несколько таблиц фактов, которые индексируют несколько таблиц измерений, могут присутствовать в центральной области звездообразной схемы. Ключи, значения и атрибуты измерений находятся в таблицах измерений, которые используются для определения измерений.

Цель звездообразной схемы — отличить описательные или «РАЗМЕРНЫЕ» данные от числовых «ФАКТИЧЕСКИХ» данных, относящихся к бизнесу.

Информация, отображаемая в числовом формате, такая как стоимость, скорость, вес и количество, может считаться фактическими данными. Помимо чисел, размерные данные могут также содержать нечисловые элементы, такие как цвета, места, имена продавцов и сотрудников и т. д.

Хотя данные измерений содержатся в таблицах измерений, фактические данные располагаются в таблицах фактов. В звездной схеме таблицы фактов являются объединяющими точками в ядре звезды.

Характеристики звездообразной схемы

Схема «звезда» характеризуется денормализованной структурой данных, при которой все данные, относящиеся к конкретному субъекту, хранятся в одной большой таблице и связаны с меньшими размерными таблицами посредством одного соединения.

Вот некоторые из основных характеристик звездообразной схемы:

  • Одна одномерная таблица может представлять каждый аспект звездообразной схемы.
  • Коллекция атрибутов должна находиться в таблице измерений.
  • С помощью внешнего ключа таблица измерений соединяется с таблицей фактов.
  • Между таблицами измерений не устанавливается никаких связей.
  • Ключ и мера будут находиться в таблице фактов.
  • Схема «Звезда» обеспечивает максимально эффективное использование диска и проста для понимания.
  • Таблицы размеров не стандартизированы. В соответствии с архитектурой OLTP идентификатор страны на изображении выше не имеет таблицы поиска страны.
  • Инструменты BI обеспечивают обширную поддержку схемы.

Имея за плечами базовое понимание схемы снежинки и звезды, пришло время изучить ключевые различия между ними.

Ваша карьера в области аналитики данных не за горами! Магистерская программа по аналитике данныхИзучите программуВаша карьера аналитика данных не за горами!

Схема «Звезда» против схемы «Снежинка»

При их сравнении важно помнить о фундаментальных различиях между схемами «звезда» и «снежинка»: схемы «звезда» предоставляют эффективный метод организации данных в хранилище данных, тогда как схемы «снежинка» представляют собой версию схем «звезда», которая способствует более быстрой обработке данных.

Имея это в виду, давайте рассмотрим различные особенности и различия между этими двумя схемами.

Основа различия

Звездная схема

Схема снежинки

Определение и значение

В звездообразной схеме присутствуют как таблицы фактов, так и таблицы измерений.

Таблицы измерений, таблицы подизмерений и таблицы фактов включены в схему «снежинка».

Тип модели

Звездообразная схема представляет собой модель нисходящего типа.

Схема снежинки представляет собой модель восходящего типа.

Космос

Схема «звезда» использует больше места по сравнению со схемой «снежинка».

Схема «снежинка» занимает сравнительно меньше места.

Совместные отношения

В звездообразной схеме связи между таблицами представлены одним соединением, что обеспечивает простую структуру данных для быстрого выполнения запросов и простого анализа данных.

Схема «снежинка» имеет сложную структуру данных с несколькими уровнями связей между таблицами, представленными несколькими соединениями. Это может затруднить понимание структуры данных и привести к снижению производительности запросов.

Время ответа на запросы

Звездообразные схемы имеют более быстрое время выполнения запроса благодаря одному соединению таблицы фактов и ее атрибутов в таблицах измерений.

Схемы «снежинка» требуют сложных соединений между таблицами, что может замедлить обработку запросов и повлиять на другие продукты OLAP.

Нормализация

В звездообразной схеме таблицы измерений не организованы в нормализованной форме. Они обычно денормализованы и содержат несколько уровней информации о конкретном предмете в одной таблице.

Таблицы размерностей в схеме «снежинка» нормализованы.

Сложность дизайна

Имеет более простую конструкцию по сравнению со схемой снежинки.

Более сложная конструкция по сравнению со звездообразной схемой.

Сложность запроса

Звездообразные схемы имеют более простую структуру запросов, поскольку таблица присоединяется только к таблицам измерений одного уровня.

С другой стороны, схемы «снежинка» имеют более сложную структуру запросов из-за необходимости многократного соединения между таблицей фактов и ее таблицами измерений. Это приводит к дополнительным накладным расходам при написании запросов.

Понимание сложности

Ее проще понять по сравнению со схемой снежинки.

Более сложна для понимания по сравнению со звездообразной схемой.

Внешние ключи

Имейте меньшее количество внешних ключей.

Сравнительно имеет больше внешних ключей.

Избыточность данных

Звездообразная схема хранит избыточные данные в таблицах измерений.

Конструкция снежинки полностью нормализует таблицы измерений и предотвращает избыточность данных.

Преимущества

  • Простая и понятная структура данных.
  • Высокая производительность запросов благодаря единому соединению между таблицей фактов и ее таблицами измерений.
  • Подходит для больших объемов данных
  • Подходит для специальных запросов и анализа данных.
  • Нормализованная структура данных уменьшает избыточность и повышает целостность данных.
  • Позволяет создавать более сложные связи между данными.
  • Позволяет упростить обслуживание и управление данными.
  • Хорошо подходит для более структурированных предсказуемых запросов.

Недостатки

  • Звездообразная схема имеет ограниченную возможность отображать сложные отношения между данными.
  • Может пострадать из-за избыточности данных и снижения целостности данных.
  • Может не подойти для небольших объемов данных.
  • Более сложную структуру данных сложнее понять и работать с ней.
  • Множественные соединения между таблицами могут привести к снижению производительности запросов.
  • Требует больше ресурсов хранения и обработки из-за большего количества таблиц.

Схема «Звезда» и схема «Снежинка» — ключевые различия

Чтобы дать четкое представление об основных различиях между схемами «звезда» и «снежинка» и обрисовать соответствующие варианты их использования, вот несколько ключевых выводов, которые следует учитывать:

  • Самый простой тип схемы хранения данных — это звездообразная схема. Из-за своей звездообразной структуры ее называют звездной схемой.
  • При сравнении схем «снежинка» и «звезда» схема «снежинка» расширяет схему «звезда», добавляя дополнительные измерения. Из-за того, насколько ее диаграмма напоминает снежинку, ее называют снежинкой.
  • Только одно соединение в звездообразной схеме описывает связь между таблицей фактов и любыми таблицами измерений.
  • Таблица фактов и таблицы измерений окружают друг друга в звездообразной схеме.
  • Таблицы измерений окружают схему «снежинка», которая, в свою очередь, окружена таблицами измерений.
  • Данные должны быть получены через несколько объединений в схеме «снежинка».
  • При сравнении схем «снежинка» и «звезда» видно, что схема «снежинка» имеет очень сложную структуру базы данных, а схема «звезда» имеет базовую структуру базы данных.

Какая схема лучше всего подходит для ваших потребностей в хранении данных?

Когда дело доходит до хранилищ данных и бизнес-аналитики, выбор правильной схемы имеет важное значение для организации и структурирования ваших данных таким образом, чтобы они отвечали вашим конкретным потребностям и требованиям. Схема «звезда» и схема «снежинка» — популярные подходы, каждый из которых имеет свои уникальные характеристики и преимущества.

Звездообразная схема может быть лучшим выбором, если вы ищете быстрое и простое решение для облачного хранилища данных. Однако схема «снежинка» может быть лучшим вариантом, если вам требуется большая адаптируемость для удовлетворения меняющихся требований к данным.

Чтобы более четко понять различия между схемой «снежинка» и «звезда», давайте более подробно рассмотрим обе схемы на примерах.

Поднимите свои навыки специалиста по данным на новый уровень с помощью магистерской программы Data Scientist от IBMExplore ProgrammeПоднимите свои навыки специалиста по данным на новый уровень

Пример звездообразной схемы

В следующем примере звездообразной схемы центральная таблица фактов содержит ключи для каждой таблицы измерений (например, Dealer_ID, Model_ID, Date_ID, Product_ID, Branch_ID) и атрибуты, такие как проданные единицы и доход:

Звезда_Схема

Источник

Пример схемы снежинки

В следующем примере схемы «снежинка» таблица «Страна» была дополнительно нормализована в отдельную таблицу:

Снежинка_Схема

Источник

Изучите более дюжины инструментов и навыков анализа данных в рамках программы профессиональных сертификатов по анализу данных и получите доступ к мастер-классам преподавателей Purdue и экспертов IBM. Зарегистрируйтесь и добавьте звездочку в свое резюме по аналитике данных прямо сейчас!

Поднимите свои навыки анализа данных на новый уровень с помощью Simplilearn

Схема «звезда» и схема «снежинка» — два популярных подхода к организации и структурированию данных в проектах хранилищ данных и бизнес-аналитики. Каждая схема имеет свои уникальные характеристики и преимущества, и наилучшее соответствие вашим конкретным потребностям будет зависеть от требований вашего проекта.

Схема «звезда» характеризуется денормализованной структурой данных и хорошо подходит для быстрого выполнения запросов и простого анализа данных, тогда как схема «снежинка» имеет нормализованную структуру данных и лучше подходит для поддержания целостности данных и уменьшения избыточности. При выборе схемы, которая лучше всего соответствует вашим потребностям, важно тщательно учитывать компромисс между простотой, производительностью и целостностью данных.

Если вы хотите узнать больше о хранилищах данных и бизнес-аналитике, рассмотрите возможность записаться на сертификационный курс обучения, например курс PGP Data Analytics, предлагаемый Simplilearn. Этот комплексный курс охватывает широкий спектр концепций и методов анализа данных и даст вам навыки и знания, необходимые для достижения успеха в этой области.

Часто задаваемые вопросы

1. Что лучше: схема снежинка или схема звезда?

С одной стороны, звездообразные схемы менее сложны, выполнение запросов происходит быстрее, а настройка проще. С другой стороны, схемы-снежинки занимают меньше места, их проще поддерживать и они менее подвержены проблемам с целостностью данных.

2. Что такое схема «звезда» и схема «снежинка»?

Можно разделить факты и измерения на разные таблицы, используя схемы «звезда» и «снежинка».

3. В чем преимущество схемы «звезда» перед 3НФ «снежинка»?

Схема «звезда» имеет более простую структуру данных с одним соединением между таблицей фактов и ее таблицами измерений, что может привести к повышению производительности запросов и упрощению анализа данных по сравнению со схемой «снежинка». Кроме того, он, как правило, лучше подходит для обработки больших объемов данных, его проще понять и с ним легче работать.

4. Является ли звездная схема лучшей?

Одной из основных причин того, что звездообразная схема широко признана лучшим методом организации данных, является ее простота. По сравнению с традиционными моделями исходных систем эта стратегия проще для понимания бизнес-заказчика.

5. Какой инструмент ETL лучше всего подходит для создания снежинок?

Схему «снежинка» можно использовать с рядом инструментов ETL, включая Talend, Informatica, SSIS и Talend Cloud. В зависимости от ваших уникальных требований и требований вы можете выбрать идеальный инструмент.

6. Является ли звездообразная схема OLAP или OLTP?

Все системы OLAP широко используют звездообразную схему для эффективного создания кубов OLAP. Режим работы ROLAP, в котором в качестве входных данных используется звездообразная схема без создания структуры куба, фактически предоставляется большинством основных систем OLAP.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *