Wprowadzenie do schematu gwiezdnego

Schemat gwiaździsty jest najłatwiejszym podejściem i modelem wymiarowym, w którym tabele funkcji, wymiary i fakty są uporządkowane w uporządkowany sposób i jest najczęściej stosowany w analizie biznesowej i hurtowni danych. Schemat gwiazdy jest tworzony przez ułożenie każdego faktu z powiązanymi wymiarami, które przypominają gwiazdę. Faktem jest nieskończony wynik, taki jak szczegóły sprzedaży i liczby logowania. Wymiar to gromadzenie danych referencyjnych, w tym faktów, takich jak data, szczegóły dotyczące produktu i klientów. Schemat gwiaździsty jest zoptymalizowany pod kątem ogromnych zapytań danych w hurtowniach danych, kostek danych przetwarzania analitycznego online, a także zapytań ad hoc.

Jak stworzyć schemat gwiazdy?

Tutaj użytkownik ma zamiar utworzyć schemat gwiezdny poprzez konwersję modelu relacji encja-związek. Modele relacji między istotami są zbyt złożone, aby wyjaśnić wielkości funkcjonalne i atrybuty, dlatego uproszczono je do schematu gwiazdy w następujący sposób:

  • Znajdź procedurę korporacyjną z widoku relacji między jednostkami i zrozum model, który można podzielić na kilka modeli wymiarowych. Relacja między podmiotami składa się z danych biznesowych.
  • Znajdź wiele do wielu tabel w relacjach między bytami, które wyjaśniają procedurę firmy i przekonwertuj je na tabele rzeczywistości modelu wymiarowego. Ta tabela zawiera dane zawierające tabelę faktów i tabelę wymiarów z wartościami liczbowymi i unikalnymi kluczowymi atrybutami.
  • Ideą tego procesu jest rozróżnienie tabel informacji opartych na wymianie lub tabel usuniętych informacji. Konieczne jest więc zaprojektowanie wielu do wielu relacji. Na przykład w bazie danych ERP znajdują się szczegóły faktury, które są tabelą wymiany. Szczegóły, które są aktualizowane i odświeżane, to tabele oparte na wymianie. Porównując obie tabele, wywnioskowano, że dane są naprawdę statyczne.
  • Tabela rzeczywistości jest reprezentacją modelu wymiarowego, który pokazuje wiele do wielu sieci między skończonymi pomiarami. To powoduje, że klucze obce w tabelach rzeczywistości dzielą wiele do wielu, co jest policzalną relacją. większość tej tabeli należy do tabel opartych na wymianie
  • Ostatnim krokiem w projektowaniu schematu gwiaździstego jest zdenormalizowanie tabel rezydujących do tabel pomiarowych. Kluczem obowiązkowym jest utworzenie duplikatu klucza. Ten klucz opiera się na tabeli rzeczywistości, która pomaga w lepszym zrozumieniu. Znajdź datę i godzinę z projektu relacji jednostka i zapisz tabelę wymiarów. Daty są zapisywane jako znaczniki daty i godziny. Kolumna wymiaru daty reprezentuje rok, miesiąc lub datę lub godzinę

Przykład: Tabela wymiarów czasowych ma TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, które mogą być ważnymi kryteriami tabel wymiarowych. Podobnie wszystkie tabele mają unikalny identyfikator i atrybuty. Języki zapytań, takie jak SQL, można stosować do eksploracji danych, hurtowni danych i analizy danych.

Składnia definicji kostki:

Define cube (cube-name)(dimension-list): (measure-list)

Kostki są rozmieszczane, aby reagować na alerty na różnych poziomach, a czas odpowiedzi na zapytanie jest minimalny. Jest dostępny jako gotowy projekt i może być stosowany w wymaganych sytuacjach. Tworzenie schematu Star jest bardzo łatwe i wydajne w zastosowaniu, a także można je dostosowywać. Uzupełnienie tabeli faktów i tabeli wymiarów jest obowiązkowe, które z kolei tworzą postać gwiazdy i można je utworzyć za pomocą zapytań SQL lub uruchomionego kodu. Ten projekt został stworzony dla lepszego zrozumienia i łatwego pobierania danych.

Charakterystyka schematu gwiezdnego

1. Schemat gwiezdny zapewnia szybkie agregacje i obliczenia, takie jak łączna liczba sprzedanych przedmiotów i przychody z dochodów uzyskanych na koniec każdego miesiąca. Te szczegóły i proces można filtrować zgodnie z wymaganiami, tworząc odpowiednie zapytania.

2. Ma zdolność filtrowania danych ze znormalizowanych danych i zapewnia potrzeby w zakresie hurtowni danych. Powiązane informacje ze znormalizowanej tabeli są umieszczane w zakładce wielu wymiarów. Dla każdej tabeli faktów generowany jest unikalny klucz w celu identyfikacji każdego wiersza.

3. Tabela faktów jest pomiarem określonych zdarzeń, w tym wartości liczb skończonych, i składa się z kluczy obcych związanych z tabelami wymiarów. Ta tabela jest otoczona wartościami faktów na poziomie atomowym i pozwala na przechowywanie wielu rekordów jednocześnie. Istnieją trzy różne typy tabeli faktów.

4. Tabele faktów transakcji zawierają dane o konkretnych zdarzeniach, takich jak wydarzenia świąteczne, zdarzenia sprzedażowe.

5. Rejestrowanie faktów dla danych okresów, takich jak informacje o koncie na koniec każdego kwartału.

6. Tabele z szybką agregacją przez pewien okres są nazywane tabelami akumulacji migawek.

7. Tabele wymiarowe zawierają szczegółowe dane atrybutów, rekordy znalezione w tabeli faktów. Tabela wymiarów może mieć różne funkcje. Tabele wymiarów są używane głównie jako Data i godzina Tabela wymiarów, Produkt i zamówienie Zakup Tabela wymiarów, Dane pracownika i konta Tabela wymiarów, Tabela wymiarów geografii i lokalizacji. Tabelom tym przypisany jest jeden typ danych całkowitych, który jest duplikatem klucza podstawowego.

8. Użytkownik może zaprojektować swój stół zgodnie z wymaganiami. Na przykład, jeśli potrzebuje tabeli wymiarów sprzedaży z kluczem produktu i klienta, kluczem daty i godziny, kluczem do generowanego przychodu przychodu. Jeśli biznesmen obramia tabelę wymiarów produktu z kluczowymi atrybutami, takimi jak kolor, data zakupu, klucz promocyjny i klucz klienta.

Zalety

  • Składa się z prostej logiki i zapytań łatwych do wyodrębnienia danych z procesu transakcyjnego.
  • Ma wspólną logikę raportowania, która jest implikowana dynamicznie.
  • Schemat gwiaździsty może zwiększyć wydajność aplikacji raportujących.
  • Schemat gwiaździsty zaprojektowany przez karmienie kostek stosowanych w procesie transakcji online w celu zbudowania i usprawnienia pracy kostek.

Niedogodności

  • Ma wysoką integralność i wysoki stan zdenormalizowany. Jeśli użytkownik nie zaktualizuje wartości, cały proces zostanie zwinięty. Zabezpieczenia i zabezpieczenia nie są niezawodne do granic możliwości. Nie jest tak elastyczny jak model analityczny i nie rozszerza efektywnego wsparcia na wiele relacji.
  • Schemat gwiaździsty jest wdrażany w bazie danych, aby kontrolować szybsze odzyskiwanie danych. Zapytanie służy do wybrania potrzeby zamiast przeszukiwania całej bazy danych. Przefiltrowane i wybrane dane można zastosować w różnych przypadkach. Dlatego ten schemat gwiazdy jest prostym modelem, który można łatwo zastosować.

Polecany artykuł

To jest przewodnik po czym jest schemat gwiazd? Tutaj omawiamy Wprowadzenie do schematu gwiezdnego i jego cechy wraz z zaletami i wadami. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Przegląd tabeli faktów
  2. Schemat gwiezdny kontra schemat płatka śniegu | Najważniejsze różnice
  3. Modelowanie hurtowni danych z typami
  4. Bazy danych AWS z zaletami
  5. Potok danych AWS

Kategoria: