Co to jest Data Mart? - Rodzaje, funkcje i etapy wdrażania Data Mart

Spisie treści:

Anonim

Wprowadzenie do Data Mart

Świat staje się coraz bardziej cyfrowy, a każda organizacja generuje kilka petabajtów danych. Data Mart to jedna z takich klasyfikacji danych z hurtowni danych, w której koncentruje się na jednym temacie.

Można powiedzieć, że są to dane dotyczące jednego określonego działu lub kategorii, takich jak sprzedaż, finanse lub marketing itp. Zasadniczo jest to podzbiór hurtowni danych. Ponieważ koncentruje się na konkretnych tematach lub działach, możemy powiedzieć, że jego źródło jest ograniczone lub zależy od bardzo niewielu źródeł.

Data Mart vs Data Warehouse

Hurtownia danych to hurtownia z kolekcją danych z wielu strumieni podmiotu. Częścią związaną z utrzymaniem i kontrolą, taką jak gromadzenie surowych danych i ich przetwarzanie, zajmują się głównie grupy IT ds. Technologii informatycznych, które zapewniają różne usługi organizacjom macierzystym.

Hurtownia danych jest również nazywana hurtownią danych centralną lub korporacyjną. Zatem źródło do hurtowni danych będzie wielokrotne w przeciwieństwie do hurtowni danych, która w niektórych przypadkach jest podzbiorem hurtowni danych.

Rodzaje Data Mart

Zazwyczaj istnieją trzy typy rzutników danych. Oni są:

1. Zależna hurtownia danych

Zależna mart data pochodzi wyłącznie z hurtowni danych, a wszystkie zależne od niej grupy utworzą hurtownię danych przedsiębiorstwa. Jest to wyłącznie podzbiór hurtowni danych, ponieważ jest tworzony z centralnej DW.

Ponieważ czyste i podsumowane dane są już obecne w centralnej hurtowni danych proces ETT lub wyodrębnij transformację i transport jest uproszczony. Musimy tylko zidentyfikować konkretny podzbiór tutaj i wykonać ETT na nim.

Te marty danych są zwykle budowane w celu osiągnięcia lepszej dostępności i dużej wydajności przy lepszej kontroli i wydajności.

2. Independent Data Mart

To nie jest tworzone z centralnej hurtowni danych, a źródło tego może być inne. Ponieważ dane pochodzą z innego niż centralny proces ET ET DW jest nieco inny.

Większość niezależnych baz danych jest wykorzystywana przez mniejszą grupę organizacji, a ich źródło jest również ograniczone. Niezależna martwa baza danych jest generalnie tworzona, gdy musimy znaleźć rozwiązanie w stosunkowo krótszym czasie.

3. Hybrid Data Mart

Hybrydowa baza danych pozwoli Ci grupować dane ze wszystkich innych źródeł innych niż centralna hurtownia danych DW. Gdy zajmiemy się integracją ad hoc, będzie to bardzo korzystne dla najwyższej pracy nad wszystkimi produktami, które zostały dodane do organizacji zewnętrznie.

Funkcje Data Mart

Poniżej znajdują się niektóre cechy mart data:

  • Ponieważ źródło danych jest skoncentrowane na temacie, czas reakcji użytkownika jest wydłużony dzięki jego użyciu.
  • W przypadku często wymaganych danych korzystne będzie korzystanie z rzutników danych, ponieważ jest ono podzielone na centralną DW, a zatem rozmiar danych będzie mniejszy.
  • Również ponieważ ilość danych jest ograniczona, czas przetwarzania będzie znacznie skrócony w porównaniu do centralnego Dws.
  • Są one w zasadzie sprawne i mogą dość szybko i skutecznie uwzględniać zmiany w modelu w porównaniu do hurtowni danych.
  • Datamart wymaga od jednego eksperta przedmiotowego do obsługi, w przeciwieństwie do danych magazynowych, wiedzy specjalistycznej wymaganej w magazynach o wielu przedmiotach. Z tego powodu mówimy, że data mart jest bardziej zwinny.
  • Możemy segregować kategorie dostępu do niskiego poziomu za pomocą danych podzielonych na partycje, a dzięki usłudze Data Mart jest to bardzo łatwe.
  • Zależność od infrastruktury jest dość ograniczona, a dane mogą być przechowywane na różnych platformach sprzętowych po segmentacji.

Kroki do wdrożenia Data Mart

Poniżej znajdują się kroki wymagane do jego wdrożenia.

1. Projektowanie

Będzie to pierwszy etap wdrażania, w którym zidentyfikowane zostaną wszystkie wymagane zadania i źródła w celu zebrania informacji technicznych i biznesowych. Później wdrażany jest plan logiczny i po przejrzeniu zostanie on przekształcony w plan fizyczny. Tutaj decyduje się także logiczna i fizyczna struktura danych, podobnie jak podział danych i pole podziału, takie jak data lub dowolny inny plik.

2. Budowa

Jest to drugi etap wdrażania, w którym fizyczne bazy danych zostały wygenerowane za pomocą RDBMS, który został określony w ramach procesu projektowania i struktur logicznych. Wszystkie obiekty, takie jak schemat, indeksy, tabele, widoki itp. Są tworzone.

3. Ludność

To jest trzecia faza i tutaj dane są zapełniane po ich pozyskaniu. Wszystkie wymagane transformacje są wdrażane przed zapełnieniem danych na nim.

4. Dostęp

Jest to kolejny etap implementacji, w którym wykorzystamy zapełnione dane do zapytania w celu utworzenia raportów. Użytkownik końcowy korzysta z tego kroku, aby zrozumieć dane za pomocą zapytań.

5. Zarządzanie

Jest to ostatni etap implementacji hurtowni danych i tutaj zajmowane są różne zadania, takie jak zarządzanie dostępem, optymalizacja systemu i dostrajanie, zarządzanie i dodawanie świeżych danych do hurtowni danych oraz planowanie scenariuszy odzyskiwania w celu obsługi przypadków awarii.

Korzyści z Data Mart

Oto niektóre z zalet korzystania z niego.

  • Jest to jedna z najlepszych opłacalnych alternatyw dla hurtowni danych, w której trzeba pracować tylko na niewielkim segmencie danych.
  • Segregacja danych ze źródeł sprawi, że dane będą wydajne, ponieważ określona grupa ludzi może przetwarzać dane z określonego źródła zamiast korzystać z hurtowni danych.
  • Szybszy dostęp do danych jest możliwy przy użyciu mart data, jeśli wiemy, do którego podzbioru potrzebujemy dostępu.
  • Datamart jest znacznie łatwiejszy w użyciu, więc użytkownicy końcowi mogą łatwo wyszukiwać na nim zapytania.
  • Dochodzenie do czasu implementacji mart data wymaga mniej czasu w porównaniu z hurtownią danych, ponieważ dane są podzielone na grupy.
  • Dane historyczne z określonego przedmiotu można wykorzystać do łatwej analizy trendów.

Wniosek

Ponieważ koncentruje się na jednym obszarze funkcjonalnym, zarówno realizator procesu, jak i użytkownik końcowy mają wiele zalet. Dlatego wymagana jest wydajna implementacja marts wraz z hurtownią danych w organizacji.

Polecane artykuły

To jest przewodnik po What Mart Data Mart. Tutaj omawiamy wprowadzenie, funkcje i 3 najlepsze typy wraz z jego funkcjami i krokami. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Oracle Data Warehousing
  2. R Typy danych
  3. Typy danych w języku Python
  4. Modelowanie danych Cassandra
  5. Kompletny przewodnik po modelu danych w Cassandrze