Wprowadzenie do tabeli wymiarów

Tabela wymiarów jest obecna w schemacie gwiazdy lub płatka śniegu. Tabele wymiarów pomagają opisywać wymiary, tj. Wartości wymiarów, atrybuty i klucze. Jest ogólnie mały. Rozmiar może wynosić od kilku do tysięcy wierszy. Opisuje obiekty obecne w tabeli faktów. Tabela wymiarów odnosi się do zbioru lub grupy informacji związanych z każdym mierzalnym zdarzeniem. Stanowią one rdzeń do modelowania wymiarowego. Zawiera kolumnę, którą można uznać za kolumnę klucza podstawowego, która pomaga jednoznacznie zidentyfikować każdy wiersz lub rekord wymiaru. Jest łączony z tabelami faktów za pomocą tego klucza. Po utworzeniu klucz o nazwie klucz zastępczy generowany przez system służy do jednoznacznej identyfikacji wierszy w wymiarze.

Dlaczego musimy korzystać?

  • Pomaga przechowywać historię informacji lub informacji wymiarowych.
  • Jest łatwy do zrozumienia niż znormalizowane tabele.
  • Więcej kolumn można dodać do tabeli bez wpływu na istniejące aplikacje, które ich używają.

Rodzaje tabeli wymiarów

Poniżej przedstawiono różne typy tabeli wymiarów:

1. SCD (powoli zmieniające się wymiary)

Atrybuty wymiarów, które zwykle zmieniają się powoli z czasem, a nie zmieniają się w regularnych odstępach czasu, nazywane są powoli zmieniającymi się wymiarami. Na przykład zmiany adresu i numeru telefonu, ale nie regularnie. Zobaczmy przykład człowieka, który podróżuje do różnych krajów, więc musi zmienić adres w zależności od tego kraju. Można to zrobić na trzy sposoby:

Typ 1: Zastąp poprzednią wartość. Ta metoda jest łatwa do zastosowania i pomaga zaoszczędzić miejsce, a tym samym obniżyć koszty. Ale historia jest zagubiona w tym scenariuszu.

Tabela przed zmianą

IDNAZWAKRAJNARODOWOŚĆ
1001RachelIndieIndianin

Tabela po zmianie

IDNAZWAKRAJNARODOWOŚĆ
1001RachelChinyIndianin

Type2: Dodaj nowy wiersz z nową wartością. W tej metodzie historia jest zapisywana i można z niej korzystać w razie potrzeby. Ale zajmuje dużo miejsca, dlatego zwiększa koszt.

Tabela przed zmianą

IDNAZWAKRAJNARODOWOŚĆ
1001RachelIndieIndianin

Tabela po zmianie

IDNAZWAKRAJNARODOWOŚĆ
1001RachelIndieIndianin
1001RachelChinyIndianin

Type3: Dodaj nową kolumnę. Jest to najlepsze podejście, ponieważ historię można łatwo utrzymać.

Tabela przed zmianą

IDNAZWAKRAJNARODOWOŚĆ
1001RachelIndieIndianin

Tabela po zmianie

IDNAZWAKRAJSTARY KRAJNARODOWOŚĆ
1001RachelChinyIndieIndianin

2. Zgodny wymiar

Wymiar ten jest wspólny dla wielu obszarów tematycznych lub centrów danych. To samo można zastosować w różnych projektach bez modyfikacji w tym samym. Służy to do zachowania spójności. Zgodne wymiary to wymiary dokładnie takie same lub właściwy podzbiór dowolnego innego wymiaru.

3. Wymiar śmieci

Wymiar śmieci to grupa atrybutów o niskiej liczności. Zawiera różne lub różne atrybuty niezwiązane z żadnym innym atrybutem. Można ich użyć do wdrożenia RCD (szybko zmieniającego się wymiaru), takiego jak flagi, ciężary itp.

4. Zdegenerowany wymiar

Atrybuty, które są przechowywane w samej tabeli faktów, a nie jako osobna tabela wymiarów, są to tak zwane wymiary zdegenerowane. Na przykład numer biletu, numer faktury, numer transakcji itp.

5. Wymiar fabularny

Posiadanie wielu relacji z tabelą faktów nazywa się wymiarem odgrywania ról. Innymi słowy, następuje to, gdy ten sam klucz wymiaru ze wszystkimi powiązanymi atrybutami jest dołączany do wielu kluczy obcych w tabeli faktów. Może spełniać wiele celów w ramach tej samej istniejącej bazy danych.

Jak to działa w hurtowni danych?

  • Wymiar odnosi się do zbioru lub grupy informacji związanych z każdym mierzalnym zdarzeniem. Stanowią one rdzeń do modelowania wymiarowego. Po utworzeniu wymiaru generowana jest struktura projektu. Utworzony może być używany w różnych projektach i odzwierciedla ideę ponownego użycia. Kiedy w którymkolwiek z nich zostanie dokonana zmiana, wówczas jej efekt zostanie odzwierciedlony tylko w tej konkretnej tabeli. Podczas tworzenia raportu użytkownik może pobrać dane, ponieważ tabele wymiarów zawierają wszystkie niezbędne informacje.
  • Podczas wykonywania modelowania wymiarów dane atomowe są ładowane do struktur wymiarowych. Następnie modele wymiarowe są generowane lub budowane wokół procesów biznesowych. Podczas tworzenia należy pamiętać o filtrowaniu wartości domen i przechowywaniu etykiet raportów w tych tabelach. Należy upewnić się, że klucz zastępczy (klucz generowany przez system używany podczas tworzenia tabeli wymiarów, który pomaga jednoznacznie zidentyfikować każdy rekord obecny w tabeli wymiarów) musi być używany podczas tworzenia tabeli wymiarów. Trzeba to zdenormalizować, ponieważ ich zadaniem jest umożliwienie użytkownikowi łatwego odczytu i analizy danych, a nie zarządzanie transakcjami. Głównym celem wymiaru jest zapewnienie filtrowania, grupowanie i wydajne etykietowanie.

Zalety

Poniżej przedstawiamy różne zalety tabeli wymiarów:

  • Ma prostą strukturę.
  • Łatwo to przeanalizować i zrozumieć.
  • Dane zdormalizowane.
  • Pomaga zachować informacje historyczne dla dowolnego wymiaru.
  • Łatwe odzyskiwanie z niego danych.
  • Szybkie tworzenie i wdrażanie.
  • Daje kontekst otaczającego każdego procesu biznesowego.

Wnioski - Tabela wymiarów

Jest to integralna część modelowania danych. Jest stosowany w schemacie gwiazdy lub płatka śniegu. Zawiera wymiary, klucze i wartości atrybutów tabeli faktów. Istnieją różne typy, które są używane w różnych scenariuszach.

Polecane artykuły

Jest to przewodnik po tabeli wymiarów. Tutaj omówiliśmy typy, w jaki sposób tabela wymiarów działa w hurtowni danych z zaletami. Możesz również przejrzeć nasze inne powiązane artykuły, aby dowiedzieć się więcej-

  1. Tabela faktów a tabela wymiarów
  2. Co to jest tabela faktów?
  3. Co to jest Tableau?
  4. Mieszanie danych w Tableau

Kategoria: