Vet om hovedskjema: Stjerne vs. Snowflake

Flerdimensjonalt skjema er designet for å bygge en datavarehussystemmodell.

Hovedformålet med disse skjemaene er å møte behovene til større databaser bygget for analytiske formål (OLAP).

Denne metoden brukes til å bestille data i databasen med en god ordning av innholdet i en database. Skjemaet lar kunder stille spørsmål knyttet til forretnings- eller markedstrender.

Videre representerer et flerdimensjonalt skjema dataene i form av datakuber som gjør det mulig å se og modellere data fra ulike perspektiver og dimensjoner.

Det er av tre typer, men mange forveksler mellom stjerne og Snowflake. Derfor blir det vanskelig for dem å velge den foretrukne modellen.

Hvis du er en av dem, la oss diskutere forskjellene mellom stjerne- og snøfnuggskjemaet, og begynne med definisjonen og forstå fordelene, utfordringene, diagrammet og egenskapene deres.

Hva er et flerdimensjonalt skjema?

Skjema refererer til den logiske beskrivelsen av en komplett database og datamars. Den inkluderer navnet på poster og deres beskrivelser, inkludert aggregater og tilhørende dataelementer.

En database bruker vanligvis en relasjonsmodell for å beskrive, mens et datavarehussystem bruker en Schema-modell.

Flerdimensjonalt skjema kan defineres med Data Mining Query Language (DMQL).

For å definere datamarts og datavarehus, bruker den to primitiver – dimensjonsdefinisjon og kubedefinisjon.

Det flerdimensjonale skjemaet bruker forskjellige typer skjemamodeller. De er:

  • Stjerneskjema
  • Snøfnuggskjema
  • Galaxy-skjema

La oss diskutere hva stjerne- og Snowflake-skjemaer er.

Stjerne vs. Snowflake: Hva er de?

Hva er Star Schema?

Et stjerneskjema er en arkitektonisk datavarehus- og business intelligence-modell som krever en enkelt faktatabell for å lagre målte og transaksjonelle data. Den bruker også forskjellige mindre dimensjonale tabeller for å inneholde attributter om forretningsdata.

Den er navngitt i henhold til strukturen. Som en stjerne tar faktatabellen sin plass i midten av diagrammet, og små dimensjonstabeller sitter som grener til midtbordet for å danne en stjernelignende struktur.

Hvert stjerneskjema består av en enkelt faktatabell, men flere små dimensjonale tabeller. Faktatabellene inkluderer spesifikke, målbare data som må analyseres, for eksempel logget ytelse, økonomiske data eller salgsposter. Det kan være et knips av historiske data om gangen eller transaksjoner.

Dessuten er Star-skjemaet det enkleste og mest grunnleggende blant datavarehusene og datamart-skjemaene. Det er effektivt å håndtere grunnleggende spørsmål. Stjerneskjema støtter generelt forretningsintelligens, ad hoc-spørringer, analytisk applikasjon og online analytisk behandlingskuber.

  Slik fikser du feilen "Denne enheten kan ikke starte". (Kode 10)

Stjerneskjema støtter også antall, gjennomsnitt, sum og andre aggregeringer av mange poster. Brukere kan enkelt filtrere og gruppere aggregeringene etter dimensjoner. For eksempel genererer brukere spørringer som «finn alle salgspostene i juni» eller «analyserer totalinntekter fra XYZ-kontoret i 2022».

Hva er Snowflake Schema?

Et snøfnuggskjema er en flerdimensjonal datamodell som også kan bli kjent som utvidelsen av stjerneskjemaet. Dette er fordi dimensjonstabeller i snøfnuggskjemaet brytes ned i underdimensjoner.

Et skjema er et snøfnugg hvis en og flere dimensjonstabeller ikke lenker direkte til faktatabellen men heller kobles gjennom andre dimensjonstabeller.

Snøfnugg er et fenomen som normaliserer dimensjonstabellene i et stjerneskjema. Når du normaliserer alle dimensjonstabellene, ligner den resulterende strukturen et snøfnugg som inneholder en faktatabell i midten av strukturen.

Snøfnuggskjemaet består med enkle ord av én faktatabell i midten av modellen, som er koblet til dimensjonstabeller, som igjen er knyttet til andre dimensjonstabeller. Dette skjemaet brukes til å forbedre ytelsen til spørringene.

Modellen er laget for rask, fleksibel spørring på tvers av komplekse relasjoner og dimensjoner. Det er nyttig for en til mange og mange til mange relasjoner mellom ulike dimensjonsnivåer.

På grunn av den tettere overholdelse av mer normaliseringsstandarder, vil du få mer lagringseffektivitet. Men dataredundansen er ubetydelig, og ytelsen er lav sammenlignet med denormaliserte datamodeller som stjerneskjema.

Star vs. Snowflake: Hvordan fungerer de?

Hvordan fungerer et stjerneskjema?

Faktatabellen i midten av stjernemodellen lagrer to typer informasjon – numeriske og dimensjonsattributtverdier. La oss forstå dem med et eksempel på en salgsdatabase.

  • Numeriske verdier er unike for hver rad og datapunkt. Dette er ikke relatert til eller relatert til dataene som er lagret i en annen rad. Dette er fakta om en gitt transaksjon, for eksempel totalbeløp, ordreantall, nøyaktig tidspunkt, nettofortjeneste, ordre-ID, etc.
  • Dimensjonsattributtverdier lagrer ikke data direkte, men de lagrer fremmednøkkelverdier for raden i en dimensjonstabell. Ulike rader i midttabellen vil referere til denne informasjonen, for eksempel dataverdi, salgsmedarbeider-ID, avdelingskontor-ID, produkt-ID osv.

Dimensjonstabeller lagrer alltid støtteinformasjon fra faktatabellen. Hver dimensjonstabell er relatert til kolonnen i en faktatabell sammen med en dimensjonsverdi og lagrer tilleggsdata om denne verdien.

Eksempel: Ansattdimensjonstabellen bruker ansatt-ID som nøkkelverdi og inneholder også informasjon, for eksempel navn, kjønn, adresse og telefonnummer. På samme måte lagrer en produktdimensjonstabell informasjon, inkludert produktnavn, farge, første dato til markedet, produksjonskostnad, etc.

Hvordan fungerer et snøfnuggskjema?

Tenk på et snøfnuggdesign med en midtboks og forskjellige koblinger gjennom den boksen til forskjellige prikker. For å vedlikeholde datamars og datavarehus kommer snøfnuggskjemadesign inn i bildet.

Det ligner på stjerneskjemaet, men med små endringer. I motsetning til stjerneskjema, utvider snøfnuggskjema underdimensjonstabeller, som er koblet til dimensjonstabeller.

Hovedformålet med denne modellen er å normalisere den denormaliserte informasjonen til stjernemodellen. På denne måten kan den løse vanlige problemer knyttet til et stjerneskjema.

  Bevegelsesbasert kalkulatorapp som lagrer resultater [Paid]

I kjernen av skjemaet finner du en faktatabell som kobler til informasjonen i dimensjonstabeller. Disse tabellene stråler igjen utover til underdimensjonstabeller som har detaljert informasjon som beskriver dimensjonstabellinformasjonen.

Eksempel: Snøfnuggskjemaet inneholder en salgsfaktatabell og tabeller for butikkplassering, linje, familie, produkt og tidsdimensjoner. Markedsdimensjonene består av to dimensjonstabeller, med butikken som primær dimensjonstabell og butikkens plassering som underdimensjonstabell. Produktdimensjonen har tre underdimensjonstabeller som nevner en produkt-, linje- og familieunderdimensjonstabell.

Stjerne vs. Snowflake: Kjennetegn

Kjennetegn ved stjerneskjema

  • Stjerneskjema kan filtrere data fra normaliserte data for å møte datavarehusbehov. Den unike nøkkelen genereres fra den tilknyttede informasjonen for hver faktatabell for å identifisere hver rad.
  • Det gir raske beregninger og aggregeringer, for eksempel inntekter fra oppnådd inntekt og totalt antall solgte varer ved slutten av hver måned. Disse detaljene kan filtreres i henhold til behovene ved å sette inn passende søk.
  • Det er målingen av hendelser som inkluderer endelige tallverdier som består av fremmednøkkelen. Disse nøklene er relatert til dimensjonstabellene. Det finnes ulike typer faktatabeller som er innrammet med verdier på atomnivå.
  • Transaksjonsfaktatabellen inneholder data om spesifikke hendelser, for eksempel salg og helligdager.
  • Registreringsfakta inkluderer gitte perioder som kontoinformasjon på slutten av året eller hvert kvartal.
  • Dimensjonstabellen gir detaljerte data om attributter eller poster funnet i midttabellen.
  • Brukeren kan selv designe et bord etter behov.
  • Du kan bruke stjerneskjema for å samle øyeblikksbildetabeller.

Kjennetegn ved Snowflake Schema

  • Snøfnuggskjemaet trenger liten diskplass.
  • Denne modellen er enkel å implementere på grunn av dens separate og hoveddimensjonstabeller.
  • Dimensjonstabellene inneholder minst to attributter for å definere informasjon ved flere korn.
  • På grunn av flere tabeller er ytelsen lav sammenlignet med stjerneskjemaet.
  • Snøfnuggskjemaet har det høyeste dataintegritetsnivået og lave redundanser på grunn av normalisering.

Stjerne vs. Snowflake: Fordeler

Fordeler med Star Schema

  • Stjerneskjema er den enkleste måten blant datamart-skjemaene.
  • Den har en enkel rapporteringslogikk. Denne logikken er underforstått dynamisk.
  • Den er utformet ved å bruke matekuber brukt gjennom onlinetransaksjonsprosessen for å få kuber til å fungere effektivt.
  • Stjerneskjema er dannet med enkel logikk og spørringer som er enkle å trekke ut fra transaksjonsprosessen.
  • Det gir forbedret ytelse for rapporteringsapplikasjoner.
  • Den er distribuert for å kontrollere rask gjenoppretting av data.
  • Den filtrerte og valgte informasjonen kan enkelt brukes i forskjellige tilfeller.

Fordeler med Snowflake Schema

  • Stjerneskjema brukes til å utvikle søkeytelse på grunn av færre krav til disklagring.
  • Det gir større skalerbarhet i forholdet mellom komponenter og dimensjonsnivåer.
  • Det er lettere å vedlikeholde.
  • Stjerneskjema gir rask datainnhenting.
  • Det er et vanlig og enkelt dataskjema for datavarehus.
  • Det bidrar til å forbedre datakvaliteten.
  • De strukturerte dataene reduserer problemet med dataintegritet.
  4 Hundehelse/aktivitetssporere for å ta vare på pelsbarnene dine

Stjerne vs. Snowflake: Begrensninger

Begrensninger for stjerneskjema

Den har en høy denormalisert og integritetstilstand. Hele prosessen vil kollapse hvis brukeren ikke klarer å oppdatere dataene. Sikkerheten og beskyttelsen er også begrenset. I tillegg er ikke stjerneskjemaet like fleksibelt som den analytiske modellen. Det gir ikke effektiv støtte til ulike relasjoner.

Begrensninger for Snowflake Schema

Hovedbegrensningen du vil finne med Snowflake er den ekstra vedlikeholdsinnsatsen på grunn av det økende antallet små dimensjonstabeller. Mange komplekse søk gjør det utfordrende å finne de nødvendige dataene. I tillegg er implementeringstiden for spørsmålet høy på grunn av høyere tabeller. Denne modellen er også stiv og krever høyere vedlikeholdskostnader.

Stjerne vs. Snowflake: Forskjeller

Stjerne og snøfnugg er typer flerdimensjonale skjemaer, men har forskjellige strukturer og egenskaper. Førstnevnte er som en stjerne, og sistnevnte ligner et snøfnugg, som definerer navnene deres.

I stjerneskjemaet bygger bare en enkelt sammenføyning et forhold mellom den sentrale faktatabellen og sidedimensjonstabellene. På den annen side, i snøfnuggskjemaet, er det nødvendig med flere sammenføyninger for å koble til dimensjonstabeller.

Stjerneskjema brukes vanligvis når du har mindre antall rader i dimensjonstabellen, mens snøfnuggskjema brukes når en dimensjonstabell er relativt stor.

Diagrammet under skiller de to modellene og hvordan dimensjonstabellene og faktatabellen er koblet sammen i ulike skjemaer.

ParametersStjerneskjemaSnøfnuggskjemaDiskplassStjerneskjema bruker mer diskplass.Snøfnuggskjema bruker mindre diskplass.DatareundansDet har høy dataredundans.Det har lav dataredundans.NormaliseringDimensjonstabellene er denormalisert, noe som betyr at den samme verdien i tabellen gjentas.Dimensjonstabellene er fullstendig normalisert.SpørringsytelseDet tar minimum tid å utføre spørringene, noe som resulterer i bedre ytelse.Det tar mer tid enn stjerneskjemaet for utføringen av spørringen, noe som gjør det dårligere enn stjerneskjemaet.SpørringskompleksitetSpørringskompleksiteten er lav.Spørringskompleksiteten er lav. er høyere enn stjerneskjemaet.Vedlikehold På grunn av høy dataredundans er det litt vanskelig å opprettholde stjerneskjemaet.På grunn av lav dataredundans er det enkelt å vedlikeholde og endre snøfnuggskjemaet.DataintegritetDataintegriteten er høy fordi data lagres redundant der flere kopier finnes i dimensjonstabellene. Dataintegriteten er lav da den normaliserer dimensjonstabellene fullstendig. Hierarkier Hierarkier for dimensjonstabellene i stjerneskjemaet er lagret i dimensjonstabellen. Hierarkier er delt inn i separate dimensjonstabeller.DB-designDen har en enkel DB-design.Den har en svært kompleks DB-design.FaktatabellFlere dimensjonstabeller omgir en faktatabell. Faktatabellen er omgitt av dimensjonstabeller som også er omgitt av underdimensjonstabeller.Set upStar-skjemaet er enkelt å designe og sette opp ettersom direkte relasjoner representerer dem. På den annen side er snøfnuggskjemaet litt komplisert å sette opp. KubebehandlingKubebehandling er raskere. På grunn av kompleks sammenføyning er kubebehandlingen litt treg. FremmednøklerDen har et minimum antall fremmednøkler.Den har maksimalt antall fremmednøkler.

Konklusjon

Både Star- og Snowflake-skjemaer er nyttige i forskjellige sektorer. Så å bestemme hvilken som er best blant dem er basert på kravene deres.

Snøfnuggskjemaet er forlengelsen av stjerneskjemaet, hvor det normaliserer dimensjonstabellene i stjerneskjemaet.

Stjerneskjemaet er enkelt i design, kjører spørringer raskere, og oppsettet er enkelt. På den annen side er snøfnuggskjemaet enklere å vedlikeholde, tar mindre diskplass og er mindre utsatt for problemer med dataintegritet.

Så et stjerneskjema kan være det bedre alternativet hvis du trenger en enkel design, færre fremmednøkler og raskere kubebehandling. Men hvis du trenger mindre diskplass, lav dataintegritet og lite vedlikehold, kan snøfnuggskjemaet være mer egnet.

Du kan også utforske noen av de beste grafdatabaseløsningene.