Wprowadzenie do tabeli zrzutu ula

Słowo kluczowe „DROP” odnosi się do usunięcia. Aby usunąć dane, wymagamy obecności danych w ulu.

W Hadoop mamy dwie funkcje:

  1. Przechowywanie danych
  2. Przetwarzanie danych

W przypadku przechowywania danych na obraz wchodzi HDFS (Hadoop Distributed File System). Teraz, gdy mówimy, że mamy dane w tabeli gałęzi, oznacza to dwie rzeczy:

  1. Dane są w HDFS
  2. Mamy tabelę gałęzi utworzoną na tym pliku HDFS i ładujemy dane tego pliku HDFS do tabeli gałęzi.

Zasadniczo, aby tabela upuszczania gałęzi zawierała dane, plik danych jest warunkiem koniecznym. W tym artykule zobaczymy, jak upuścić tabele w ulu, co się stanie, gdy tabela zostanie upuszczona i wszystkie rzeczy związane z tabelą upuszczania w ulu.

Rodzaje tabeli zrzutu w ulu

W ulu są dwa rodzaje tabel:

  1. Tabela wewnętrzna lub tabela zarządzana
  2. Tabela zewnętrzna lub tabela niezarządzana

Tabela zarządzana / tabela wewnętrzna:

  1. W gałęzi user / hive / warehouse to katalog domyślny. Tabele wewnętrzne są domyślnie przechowywane w tym katalogu. Podczas tworzenia tabeli nie musimy podawać lokalizacji ręcznie.
  2. Polecenie „Upuść tabelę” powoduje trwałe usunięcie danych.
  3. Hive zarządza wszystkimi zabezpieczeniami zarządzanych tabel.

Mam już tabelę w katalogu „user / hive / warehouse” o nazwie „code”.

Aby sprawdzić, czy istniejąca tabela jest zarządzana czy niezarządzana, możemy użyć poniższej komendy:

Składnia polecenia:

Opisz sformatowaną nazwę_tabeli;

Wynik:

Zobaczmy dane przedstawione w tabeli „kody”.

Po pierwsze, używając polecenia gałęzi-

Po drugie, używając Hue (Hadoop User Experience a Web UI)

Usuń polecenie: Usuń tabelę nazwa_tabeli;

Wynik:

Teraz, jeśli chcę wybrać dane z „kodów”, da mi błąd, ponieważ tabela jest usunięta.

Ponadto nie będzie w stanie zobaczyć tej tabeli w domyślnym katalogu, którym jest

„Użytkownik / ul / magazyn”

Obserwuj tutaj,

Stół niezarządzany / Stół zewnętrzny:

  1. Tabele zewnętrzne, musimy podać ścieżkę, w której musimy przechowywać tę tabelę, używając słowa kluczowego „lokalizacja” w poleceniu tworzenia tabeli.

Na przykład:

UTWÓRZ STÓŁ ZEWNĘTRZNY stg_s2_json.products

(produkt bez ciągu, ciąg z nazwą produktu, ciąg z opisem, aktywny ciąg, utworzony ciąg daty, zaktualizowany ciąg daty) pola rozdzielane formatem wierszy zakończone znakiem „, ”

LOKALIZACJA '/user/data/hive/stg_s2_json.db/products';

  1. Hive usuwa tylko metadane. Dane są trwałe.
  2. Te tabele mogą być używane przez każdego, kto ma dostęp do HDFS, dlatego muszą zarządzać bezpieczeństwem na poziomie folderu.

Aby zrozumieć zrzut tabeli zewnętrznej, użyjemy tabeli „produkty”.

Sprawdźmy, czy tabela jest wewnętrzna czy zewnętrzna. Ponownie polecenie „opisz sformatowaną nazwę_tabeli”.

Obserwuj „limit 10” w poleceniu wyboru. Tabela produktów zawiera następujące dane:

Aby to sprawdzić w Hue, wygląda to tak:

Zobaczmy, co się stanie, gdy upuszczymy ten stół:

Składnia:

Drop table table_name;

Wynik:

Teraz, jeśli próbujesz odzyskać dane tabeli, zgłasza błąd.

Po pierwsze, używając polecenia „wybierz” na terminalu, wyśle ​​mi błąd, co oznacza, że ​​metadane dla tabeli zewnętrznej zostaną usunięte.

Zwróć uwagę na błąd tutaj:

Po drugie, sprawdzając odcień stanu danych, plik „products.json” jest nadal obecny w HDFS, co oznacza, że ​​dane są trwałe.

Wniosek

Ułatwię ci to i przedstawię ci kluczowe punkty dla obu rodzajów stołów. Ty decydujesz, który typ będzie pasował do twoich wymagań.

Tabela wewnętrzna

Tabela zewnętrzna

Zwany także „tabelą zarządzaną”Zwany także „niezarządzanym stołem”
Nie trzeba podawać lokalizacji, domyślny katalog Hive zarządza tymi danymiMusisz podać lokalizację
Usuwa metadane tabeli oraz (Dane są tymczasowe)Hive pozostawi dane nietknięte (dane są stałe)
Sam ul kontroluje bezpieczeństwo stołuPotrzebujesz zarządzać bezpieczeństwem na poziomie folderu

Polecane artykuły

Jest to przewodnik po tabeli upuszczania gałęzi. Tutaj omawiamy wprowadzenie tabeli upuszczania gałęzi, Rodzaje tabeli upuszczania w gałęzi wraz ze składnią. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Co to jest ul?
  2. Architektura ula
  3. Polecenia gałęzi
  4. Co to jest baza danych Oracle
  5. Hive Order By
  6. Instalacja ula

Kategoria: