Схема «Звезда» и схема «Снежинка»: ключевые различия между ними
Отдельные лица и организации постоянно производят данные. В большинстве случаев мы хотим сохранить сгенерированные данные, чтобы иметь к ним доступ позже. Все аспекты хранения данных, включая скорость, стоимость, надежность, безопасность и т. д., должны быть практичными. По этой причине существуют различные методы хранения данных. Наиболее широко используемый метод — хранилище данных.
Данные последних операционных процедур хранятся в хранилищах данных. Информация, которую можно использовать для таких целей, как бизнес-аналитика или аналитика, обычно хранится в хранилищах данных.
Существуют различные методы и рекомендации относительно того, как следует проектировать хранилище данных, какую архитектуру использовать и т. д. Тип схемы является одним из факторов, которые должен учитывать проектировщик хранилища данных.
В этой статье мы углубимся в схему «звезда» и схему «снежинка» и изучим ключевые различия между ними, включая их основные свойства и характеристики, преимущества и варианты использования. К концу этой статьи вы должны хорошо понимать плюсы и минусы каждой схемы с примерами и быть в состоянии принять обоснованное решение о том, какая из них лучше всего подходит для ваших потребностей в хранении данных.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Ваша карьера в области аналитики данных не за горами! Магистерская программа по аналитике данныхИзучите программу
Что такое схема-снежинка?
Этот особый тип схемы хранилища данных имеет форму снежинки. Схема «снежинка» направлена на нормализацию денормализованных данных схемы «звезда». Когда измерения звездообразной схемы сложны, высокоструктурированы и имеют множество степеней связи, а дочерние таблицы имеют несколько родительских таблиц, возникает структура «снежинка». Некоторые распространенные проблемы схемы «звезда» решаются с помощью схемы «снежинка».
Схему снежинки можно рассматривать как «многомерную» структуру. Центральный компонент схемы «снежинка» включает таблицы фактов, которые связывают данные внутри таблиц измерений, которые затем расходятся наружу, как схема «звезда». С другой стороны, схема снежинки делит таблицы измерений на несколько таблиц, в результате чего получается узор снежинки. До тех пор, пока они не будут полностью нормализованы, таблицы измерений разделены на несколько таблиц.
Характеристики схемы «снежинка»
Схема «снежинка» характеризуется нормализованной структурой данных, в которой данные разделены на более мелкие и более специализированные таблицы, связанные друг с другом посредством внешних ключей.
Вот его основные характеристики:
- Для схемы «снежинка» требуется небольшое дисковое пространство.
- Новое измерение схемы легко реализовать.
- На производительность влияет большое количество таблиц.
- Два или даже более набора атрибутов, описывающих данные различной степени детализации, составляют таблицу измерений.
- Наборы характеристик единой таблицы измерений заполняются различными исходными системами.
Теперь, когда у нас есть базовое представление о схеме «снежинка», давайте углубимся в особенности схемы «звезда» и выясним, что отличает ее от других методов организации данных.
Что такое звездообразная схема?
Схема «звезда» — это наиболее простой метод организации данных в хранилище данных. Любая или даже несколько таблиц фактов, которые индексируют несколько таблиц измерений, могут присутствовать в центральной области звездообразной схемы. Ключи, значения и атрибуты измерений находятся в таблицах измерений, которые используются для определения измерений.
Цель звездообразной схемы — отличить описательные или «РАЗМЕРНЫЕ» данные от числовых «ФАКТИЧЕСКИХ» данных, относящихся к бизнесу.
Информация, отображаемая в числовом формате, такая как стоимость, скорость, вес и количество, может считаться фактическими данными. Помимо чисел, размерные данные могут также содержать нечисловые элементы, такие как цвета, места, имена продавцов и сотрудников и т. д.
Хотя данные измерений содержатся в таблицах измерений, фактические данные располагаются в таблицах фактов. В звездной схеме таблицы фактов являются объединяющими точками в ядре звезды.
Характеристики звездообразной схемы
Схема «звезда» характеризуется денормализованной структурой данных, при которой все данные, относящиеся к конкретному субъекту, хранятся в одной большой таблице и связаны с меньшими размерными таблицами посредством одного соединения.
Вот некоторые из основных характеристик звездообразной схемы:
- Одна одномерная таблица может представлять каждый аспект звездообразной схемы.
- Коллекция атрибутов должна находиться в таблице измерений.
- С помощью внешнего ключа таблица измерений соединяется с таблицей фактов.
- Между таблицами измерений не устанавливается никаких связей.
- Ключ и мера будут находиться в таблице фактов.
- Схема «Звезда» обеспечивает максимально эффективное использование диска и проста для понимания.
- Таблицы размеров не стандартизированы. В соответствии с архитектурой OLTP идентификатор страны на изображении выше не имеет таблицы поиска страны.
- Инструменты BI обеспечивают обширную поддержку схемы.
Имея за плечами базовое понимание схемы снежинки и звезды, пришло время изучить ключевые различия между ними.
Ваша карьера в области аналитики данных не за горами! Магистерская программа по аналитике данныхИзучите программу
Схема «Звезда» против схемы «Снежинка»
При их сравнении важно помнить о фундаментальных различиях между схемами «звезда» и «снежинка»: схемы «звезда» предоставляют эффективный метод организации данных в хранилище данных, тогда как схемы «снежинка» представляют собой версию схем «звезда», которая способствует более быстрой обработке данных.
Имея это в виду, давайте рассмотрим различные особенности и различия между этими двумя схемами.
Основа различия | Звездная схема | Схема снежинки |
Определение и значение | В звездообразной схеме присутствуют как таблицы фактов, так и таблицы измерений. | Таблицы измерений, таблицы подизмерений и таблицы фактов включены в схему «снежинка». |
Тип модели | Звездообразная схема представляет собой модель нисходящего типа. | Схема снежинки представляет собой модель восходящего типа. |
Космос | Схема «звезда» использует больше места по сравнению со схемой «снежинка». | Схема «снежинка» занимает сравнительно меньше места. |
Совместные отношения | В звездообразной схеме связи между таблицами представлены одним соединением, что обеспечивает простую структуру данных для быстрого выполнения запросов и простого анализа данных. | Схема «снежинка» имеет сложную структуру данных с несколькими уровнями связей между таблицами, представленными несколькими соединениями. Это может затруднить понимание структуры данных и привести к снижению производительности запросов. |
Время ответа на запросы | Звездообразные схемы имеют более быстрое время выполнения запроса благодаря одному соединению таблицы фактов и ее атрибутов в таблицах измерений. | Схемы «снежинка» требуют сложных соединений между таблицами, что может замедлить обработку запросов и повлиять на другие продукты OLAP. |
Нормализация | В звездообразной схеме таблицы измерений не организованы в нормализованной форме. Они обычно денормализованы и содержат несколько уровней информации о конкретном предмете в одной таблице. | Таблицы размерностей в схеме «снежинка» нормализованы. |
Сложность дизайна | Имеет более простую конструкцию по сравнению со схемой снежинки. | Более сложная конструкция по сравнению со звездообразной схемой. |
Сложность запроса | Звездообразные схемы имеют более простую структуру запросов, поскольку таблица присоединяется только к таблицам измерений одного уровня. | С другой стороны, схемы «снежинка» имеют более сложную структуру запросов из-за необходимости многократного соединения между таблицей фактов и ее таблицами измерений. Это приводит к дополнительным накладным расходам при написании запросов. |
Понимание сложности | Ее проще понять по сравнению со схемой снежинки. | Более сложна для понимания по сравнению со звездообразной схемой. |
Внешние ключи | Имейте меньшее количество внешних ключей. | Сравнительно имеет больше внешних ключей. |
Избыточность данных | Звездообразная схема хранит избыточные данные в таблицах измерений. | Конструкция снежинки полностью нормализует таблицы измерений и предотвращает избыточность данных. |
Преимущества |
|
|
Недостатки |
|
|
Схема «Звезда» и схема «Снежинка» — ключевые различия
Чтобы дать четкое представление об основных различиях между схемами «звезда» и «снежинка» и обрисовать соответствующие варианты их использования, вот несколько ключевых выводов, которые следует учитывать:
- Самый простой тип схемы хранения данных — это звездообразная схема. Из-за своей звездообразной структуры ее называют звездной схемой.
- При сравнении схем «снежинка» и «звезда» схема «снежинка» расширяет схему «звезда», добавляя дополнительные измерения. Из-за того, насколько ее диаграмма напоминает снежинку, ее называют снежинкой.
- Только одно соединение в звездообразной схеме описывает связь между таблицей фактов и любыми таблицами измерений.
- Таблица фактов и таблицы измерений окружают друг друга в звездообразной схеме.
- Таблицы измерений окружают схему «снежинка», которая, в свою очередь, окружена таблицами измерений.
- Данные должны быть получены через несколько объединений в схеме «снежинка».
- При сравнении схем «снежинка» и «звезда» видно, что схема «снежинка» имеет очень сложную структуру базы данных, а схема «звезда» имеет базовую структуру базы данных.
Какая схема лучше всего подходит для ваших потребностей в хранении данных?
Когда дело доходит до хранилищ данных и бизнес-аналитики, выбор правильной схемы имеет важное значение для организации и структурирования ваших данных таким образом, чтобы они отвечали вашим конкретным потребностям и требованиям. Схема «звезда» и схема «снежинка» — популярные подходы, каждый из которых имеет свои уникальные характеристики и преимущества.
Звездообразная схема может быть лучшим выбором, если вы ищете быстрое и простое решение для облачного хранилища данных. Однако схема «снежинка» может быть лучшим вариантом, если вам требуется большая адаптируемость для удовлетворения меняющихся требований к данным.
Чтобы более четко понять различия между схемой «снежинка» и «звезда», давайте более подробно рассмотрим обе схемы на примерах.
Поднимите свои навыки специалиста по данным на новый уровень с помощью магистерской программы Data Scientist от IBMExplore Programme
Пример звездообразной схемы
В следующем примере звездообразной схемы центральная таблица фактов содержит ключи для каждой таблицы измерений (например, Dealer_ID, Model_ID, Date_ID, Product_ID, Branch_ID) и атрибуты, такие как проданные единицы и доход:
Пример схемы снежинки
В следующем примере схемы «снежинка» таблица «Страна» была дополнительно нормализована в отдельную таблицу:
Изучите более дюжины инструментов и навыков анализа данных в рамках программы профессиональных сертификатов по анализу данных и получите доступ к мастер-классам преподавателей Purdue и экспертов IBM. Зарегистрируйтесь и добавьте звездочку в свое резюме по аналитике данных прямо сейчас!
Поднимите свои навыки анализа данных на новый уровень с помощью Simplilearn
Схема «звезда» и схема «снежинка» — два популярных подхода к организации и структурированию данных в проектах хранилищ данных и бизнес-аналитики. Каждая схема имеет свои уникальные характеристики и преимущества, и наилучшее соответствие вашим конкретным потребностям будет зависеть от требований вашего проекта.
Схема «звезда» характеризуется денормализованной структурой данных и хорошо подходит для быстрого выполнения запросов и простого анализа данных, тогда как схема «снежинка» имеет нормализованную структуру данных и лучше подходит для поддержания целостности данных и уменьшения избыточности. При выборе схемы, которая лучше всего соответствует вашим потребностям, важно тщательно учитывать компромисс между простотой, производительностью и целостностью данных.
Если вы хотите узнать больше о хранилищах данных и бизнес-аналитике, рассмотрите возможность записаться на сертификационный курс обучения, например курс PGP Data Analytics, предлагаемый Simplilearn. Этот комплексный курс охватывает широкий спектр концепций и методов анализа данных и даст вам навыки и знания, необходимые для достижения успеха в этой области.
Часто задаваемые вопросы
1. Что лучше: схема снежинка или схема звезда?
С одной стороны, звездообразные схемы менее сложны, выполнение запросов происходит быстрее, а настройка проще. С другой стороны, схемы-снежинки занимают меньше места, их проще поддерживать и они менее подвержены проблемам с целостностью данных.
2. Что такое схема «звезда» и схема «снежинка»?
Можно разделить факты и измерения на разные таблицы, используя схемы «звезда» и «снежинка».
3. В чем преимущество схемы «звезда» перед 3НФ «снежинка»?
Схема «звезда» имеет более простую структуру данных с одним соединением между таблицей фактов и ее таблицами измерений, что может привести к повышению производительности запросов и упрощению анализа данных по сравнению со схемой «снежинка». Кроме того, он, как правило, лучше подходит для обработки больших объемов данных, его проще понять и с ним легче работать.
4. Является ли звездная схема лучшей?
Одной из основных причин того, что звездообразная схема широко признана лучшим методом организации данных, является ее простота. По сравнению с традиционными моделями исходных систем эта стратегия проще для понимания бизнес-заказчика.
5. Какой инструмент ETL лучше всего подходит для создания снежинок?
Схему «снежинка» можно использовать с рядом инструментов ETL, включая Talend, Informatica, SSIS и Talend Cloud. В зависимости от ваших уникальных требований и требований вы можете выбрать идеальный инструмент.
6. Является ли звездообразная схема OLAP или OLTP?
Все системы OLAP широко используют звездообразную схему для эффективного создания кубов OLAP. Режим работы ROLAP, в котором в качестве входных данных используется звездообразная схема без создания структуры куба, фактически предоставляется большинством основных систем OLAP.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)