Wprowadzenie do tabeli wymiarów
Tabela wymiarów jest obecna w schemacie gwiazdy lub płatka śniegu. Tabele wymiarów pomagają opisywać wymiary, tj. Wartości wymiarów, atrybuty i klucze. Jest ogólnie mały. Rozmiar może wynosić od kilku do tysięcy wierszy. Opisuje obiekty obecne w tabeli faktów. Tabela wymiarów odnosi się do zbioru lub grupy informacji związanych z każdym mierzalnym zdarzeniem. Stanowią one rdzeń do modelowania wymiarowego. Zawiera kolumnę, którą można uznać za kolumnę klucza podstawowego, która pomaga jednoznacznie zidentyfikować każdy wiersz lub rekord wymiaru. Jest łączony z tabelami faktów za pomocą tego klucza. Po utworzeniu klucz o nazwie klucz zastępczy generowany przez system służy do jednoznacznej identyfikacji wierszy w wymiarze.
Dlaczego musimy korzystać?
- Pomaga przechowywać historię informacji lub informacji wymiarowych.
- Jest łatwy do zrozumienia niż znormalizowane tabele.
- Więcej kolumn można dodać do tabeli bez wpływu na istniejące aplikacje, które ich używają.
Rodzaje tabeli wymiarów
Poniżej przedstawiono różne typy tabeli wymiarów:
1. SCD (powoli zmieniające się wymiary)
Atrybuty wymiarów, które zwykle zmieniają się powoli z czasem, a nie zmieniają się w regularnych odstępach czasu, nazywane są powoli zmieniającymi się wymiarami. Na przykład zmiany adresu i numeru telefonu, ale nie regularnie. Zobaczmy przykład człowieka, który podróżuje do różnych krajów, więc musi zmienić adres w zależności od tego kraju. Można to zrobić na trzy sposoby:
Typ 1: Zastąp poprzednią wartość. Ta metoda jest łatwa do zastosowania i pomaga zaoszczędzić miejsce, a tym samym obniżyć koszty. Ale historia jest zagubiona w tym scenariuszu.
Tabela przed zmianą
ID | NAZWA | KRAJ | NARODOWOŚĆ |
1001 | Rachel | Indie | Indianin |
Tabela po zmianie
ID | NAZWA | KRAJ | NARODOWOŚĆ |
1001 | Rachel | Chiny | Indianin |
Type2: Dodaj nowy wiersz z nową wartością. W tej metodzie historia jest zapisywana i można z niej korzystać w razie potrzeby. Ale zajmuje dużo miejsca, dlatego zwiększa koszt.
Tabela przed zmianą
ID | NAZWA | KRAJ | NARODOWOŚĆ |
1001 | Rachel | Indie | Indianin |
Tabela po zmianie
ID | NAZWA | KRAJ | NARODOWOŚĆ |
1001 | Rachel | Indie | Indianin |
1001 | Rachel | Chiny | Indianin |
Type3: Dodaj nową kolumnę. Jest to najlepsze podejście, ponieważ historię można łatwo utrzymać.
Tabela przed zmianą
ID | NAZWA | KRAJ | NARODOWOŚĆ |
1001 | Rachel | Indie | Indianin |
Tabela po zmianie
ID | NAZWA | KRAJ | STARY KRAJ | NARODOWOŚĆ |
1001 | Rachel | Chiny | Indie | Indianin |
2. Zgodny wymiar
Wymiar ten jest wspólny dla wielu obszarów tematycznych lub centrów danych. To samo można zastosować w różnych projektach bez modyfikacji w tym samym. Służy to do zachowania spójności. Zgodne wymiary to wymiary dokładnie takie same lub właściwy podzbiór dowolnego innego wymiaru.
3. Wymiar śmieci
Wymiar śmieci to grupa atrybutów o niskiej liczności. Zawiera różne lub różne atrybuty niezwiązane z żadnym innym atrybutem. Można ich użyć do wdrożenia RCD (szybko zmieniającego się wymiaru), takiego jak flagi, ciężary itp.
4. Zdegenerowany wymiar
Atrybuty, które są przechowywane w samej tabeli faktów, a nie jako osobna tabela wymiarów, są to tak zwane wymiary zdegenerowane. Na przykład numer biletu, numer faktury, numer transakcji itp.
5. Wymiar fabularny
Posiadanie wielu relacji z tabelą faktów nazywa się wymiarem odgrywania ról. Innymi słowy, następuje to, gdy ten sam klucz wymiaru ze wszystkimi powiązanymi atrybutami jest dołączany do wielu kluczy obcych w tabeli faktów. Może spełniać wiele celów w ramach tej samej istniejącej bazy danych.
Jak to działa w hurtowni danych?
- Wymiar odnosi się do zbioru lub grupy informacji związanych z każdym mierzalnym zdarzeniem. Stanowią one rdzeń do modelowania wymiarowego. Po utworzeniu wymiaru generowana jest struktura projektu. Utworzony może być używany w różnych projektach i odzwierciedla ideę ponownego użycia. Kiedy w którymkolwiek z nich zostanie dokonana zmiana, wówczas jej efekt zostanie odzwierciedlony tylko w tej konkretnej tabeli. Podczas tworzenia raportu użytkownik może pobrać dane, ponieważ tabele wymiarów zawierają wszystkie niezbędne informacje.
- Podczas wykonywania modelowania wymiarów dane atomowe są ładowane do struktur wymiarowych. Następnie modele wymiarowe są generowane lub budowane wokół procesów biznesowych. Podczas tworzenia należy pamiętać o filtrowaniu wartości domen i przechowywaniu etykiet raportów w tych tabelach. Należy upewnić się, że klucz zastępczy (klucz generowany przez system używany podczas tworzenia tabeli wymiarów, który pomaga jednoznacznie zidentyfikować każdy rekord obecny w tabeli wymiarów) musi być używany podczas tworzenia tabeli wymiarów. Trzeba to zdenormalizować, ponieważ ich zadaniem jest umożliwienie użytkownikowi łatwego odczytu i analizy danych, a nie zarządzanie transakcjami. Głównym celem wymiaru jest zapewnienie filtrowania, grupowanie i wydajne etykietowanie.
Zalety
Poniżej przedstawiamy różne zalety tabeli wymiarów:
- Ma prostą strukturę.
- Łatwo to przeanalizować i zrozumieć.
- Dane zdormalizowane.
- Pomaga zachować informacje historyczne dla dowolnego wymiaru.
- Łatwe odzyskiwanie z niego danych.
- Szybkie tworzenie i wdrażanie.
- Daje kontekst otaczającego każdego procesu biznesowego.
Wnioski - Tabela wymiarów
Jest to integralna część modelowania danych. Jest stosowany w schemacie gwiazdy lub płatka śniegu. Zawiera wymiary, klucze i wartości atrybutów tabeli faktów. Istnieją różne typy, które są używane w różnych scenariuszach.
Polecane artykuły
Jest to przewodnik po tabeli wymiarów. Tutaj omówiliśmy typy, w jaki sposób tabela wymiarów działa w hurtowni danych z zaletami. Możesz również przejrzeć nasze inne powiązane artykuły, aby dowiedzieć się więcej-
- Tabela faktów a tabela wymiarów
- Co to jest tabela faktów?
- Co to jest Tableau?
- Mieszanie danych w Tableau