Schneeflockenschema
Was ist ein Schneeflockenschema?
Ein Schneeflockenschema ist ein mehrdimensionales Datenmodell, das eine Erweiterung eines Sternschemas darstellt, bei dem die Dimensionstabellen in Unterdimensionen aufgeteilt sind. Schneeflockenschemata werden häufig für Business Intelligence und Reporting in OLAP Data Warehouses, Data Marts und relationalen Datenbanken verwendet.
In einem Schneeflockenschema unterteilen Engineers einzelne Dimensionstabellen in logische Teildimensionen. Dadurch wird das Datenmodell zwar komplexer, kann aber – insbesondere bei bestimmten Datentypen – für Analysten einfacher zu bearbeiten sein.
Vom Schneeflockenschema ist die Rede, weil sein Entity-Relationship-Diagramm (ERD) – wie nachfolgend gezeigt – wie eine Schneeflocke aussieht.
Schneeflocken- und Sternschemata im Vergleich
Wie Sternschemata haben auch Schneeflockenschemata eine zentrale Faktentabelle, die über Fremdschlüssel mit mehreren Dimensionstabellen vernetzt ist. Der Hauptunterschied besteht allerdings darin, dass sie stärker normalisiert sind als Sternschemata.
Schneeflockenschemata bieten aufgrund ihrer strikten Einhaltung hoher Normalisierungsstandards mehr Speichereffizienz, doch ist die Abfrageleistung nicht so gut wie bei stärker denormalisierten Datenmodellen. Denormalisierte Datenmodelle wie Sternschemata weisen mehr Datenredundanz (d. h. duplizierte Daten) auf, wodurch die Abfrageleistung auf Kosten der Datenduplizierung beschleunigt wird.
Vorteile von Schneeflockenschemata
- Schneller Datenabruf
- Sicherstellung von Datenqualität
- Einfaches und gängiges Datenmodell für Data Warehousing
Nachteile von Schneeflockenschemata
- Erheblicher Aufwand bei der Ersteinrichtung
- Starres Datenmodell
- Hohe Unterhaltskosten