10 najważniejszych pytań i odpowiedzi na wywiad HBase (Zaktualizowane dla 2019)

Wprowadzenie do wywiadu Hbase Pytania i odpowiedzi

HBase to popularny zorientowany na kolumny system zarządzania bazą danych NoSQL działający na bazie rozproszonego systemu plików Hadoop (HDFS). Jest dobrze dostosowany do rzadkich zestawów danych, które są powszechne w wielu przypadkach użycia dużych zbiorów danych.

Oto 10 najczęściej zadawanych pytań i odpowiedzi na wywiad HBase 2019: W końcu znalazłeś wymarzoną pracę w HBase, ale zastanawiasz się, jak złamać wywiad Hbase i jakie mogą być prawdopodobne pytania na wywiad Hbase 2019. Każda rozmowa kwalifikacyjna jest inna, a zakres pracy również inny. Mając to na uwadze, opracowaliśmy najczęstsze pytania i odpowiedzi podczas wywiadu Hbase, aby pomóc Ci odnieść sukces w rozmowie. Te pytania są podzielone na dwie części:

Część 1 - Pytania do wywiadu HBase (podstawowe)

Ta pierwsza część obejmuje podstawowe pytania i odpowiedzi z wywiadu HBase.

1. Kiedy należy stosować HBase?

Odpowiedź:
Hbase nie jest odpowiedni dla wszystkich przypadków użycia. Najlepszy odpowiedni scenariusz można zidentyfikować za pomocą następujących kontroli -
i. Wolumen danych: Powinny mieć petabajty danych do przetworzenia w środowisku rozproszonym.
ii.Zastosowanie: HBase nie jest odpowiedni dla systemów OLTP (Online Transaction Processing), które wymagają skomplikowanych transakcji wieloskładnikowych. Brakuje również złożonej obsługi SQL wymaganej do analizy relacyjnej. Jest to preferowane, gdy masz dużą ilość danych z nieco inny schemat.
iii. Sprzęt klastrowy: HBase działa na HDFS. A HDFS działa skutecznie z dużą liczbą węzłów (minimum 5). Tak więc HBase może być dobrym wyborem tylko przy dobrym wsparciu sprzętowym.
iv. Nie tradycyjny RDBMS: Hbase nie może obsłużyć żadnego przypadku użycia, który wymaga tradycyjnych funkcji, takich jak Połącz wiele tabel, Złożone SQl z funkcjami zagnieżdżonymi lub oknem itp.
v.Szybki losowy dostęp do danych: jeśli potrzebujesz losowego dostępu do swoich danych, HBase jest odpowiednim kandydatem. Doskonale nadaje się również do przechowywania dużych tabel z danymi o wielu strukturach.

2. Jaka jest różnica między Cassandrą a HBase?

Odpowiedź:
Zarówno HBase, jak i Cassandra rozpowszechniły bazę danych NoSQL dla Big Data z ekosystemu Hadoop. Oba zbudowane dla różnych przypadków użycia.
HBase ma rodzaj architektury master-slave z kilkoma komponentami, takimi jak Zookeeper, Namenode, HBase Master (Hmaster) i Data Nodes itp. Cassandra traktuje wszystkie węzły jak mastery, co oznacza, że wszystkie węzły są równe i wykonują wszystkie funkcje.
HBase jest zoptymalizowany do odczytu, zapis dzieje się tylko w węźle głównym i ma silną spójność odczytu po zapisie. Cassandra ma doskonałą wydajność odczytu w jednym wierszu, jeśli wybrana zostanie ostateczna spójność.
Hbase nie obsługuje natywnie indeksów wtórnych, Cassandra obsługuje indeksy wtórne dla rodzin kolumn, w których nazwa kolumny jest znana.
Początkowo Hbase jest tworzony w Google i nazwali go BigTable. Nawet teraz interfejsy API Bigtable i HBase są kompatybilne. Pochodzenie Cassandry pochodzi z artykułu dla DynamoDB, który jest bazą danych NoSQL z AWS.

Przejdźmy do następnych pytań do wywiadu HBase.

3. Jakie są główne składniki Hbase?

Odpowiedź:
HBase a ma trzy ważne komponenty - HMaster, Region Server i ZooKeeper.
i.HBase Master - Tabele HBase są podzielone na regiony. Podczas uruchamiania Master decyduje, który region przypisać do którego serwera regionalnego (serwer regionalny będzie węzłem w klastrze), ale obsługuje również operacje na metadanych tabeli, takie jak tworzenie lub zmiana schematu. Ten składnik odgrywa również ważną rolę w odzyskiwaniu po awarii
ii. Region Server - jak wspomniano powyżej, w tym miejscu zdarzają się rzeczywiste zapisywanie i odczytywanie danych. Są to rzeczywiste węzły klastra. Będzie to miało regiony wielu tabel, o których decydują początkowe i końcowe klucze wierszy. Typowy serwer regionalny może obsługiwać do tysiąca regionów
iii.ZooKeeper - ZooKeeper to struktura koordynacji klastrów szeroko stosowana w ekosystemie Hadoop. Zookeeper śledzi wszystkie serwery (serwery główne i regionalne) obecne w kontaktach klastra HMaster ZooKeeper i powiadomienia są generowane w przypadku błędów.

4. Co to jest filtr Bloom HBase?

Odpowiedź:
Jest to typowe pytanie podczas wywiadu HBase. Filtr Bloom HBase jest skutecznym mechanizmem do sprawdzania, czy plik sklepu (Kiedy coś jest zapisywane do HBase, jest najpierw zapisywane w sklepie w pamięci, gdy ten magazyn osiągnie określony rozmiar, jest opróżniany na dysk do pliku sklepu ) zawiera określoną komórkę wiersza lub wiersza-kolumny. Zwykle jedynym sposobem na określenie, czy klucz wiersza jest obecny w pliku sklepu, jest sprawdzenie indeksu bloku pliku, który ma początkowy klucz wiersza każdego bloku w pliku sklepu. Filtry Bloom działają jako struktura danych w pamięci, która pomaga zredukować odczyt dysku tylko do plików, które mogą zawierać ten wiersz - nie wszystkie pliki przechowują. Działa więc jak indeks w pamięci, wskazując prawdopodobieństwo znalezienia wiersza w określonym pliku sklepu.

5. Co to jest zagęszczanie? Wyjaśnij różne jego rodzaje.

Odpowiedź:
HBase przechowuje wszystkie otrzymane operacje w swoim obszarze pamięci. Gdy bufor pamięci jest pełny, jest opróżniany na dysk. Ponieważ może to tworzyć wiele małych plików w HDFS, od czasu do czasu HBase może wybrać pliki, które mają zostać skompaktowane razem w jeden większy. Zagęszczanie nazywa się Minor, gdy HBase wybiera tylko niektóre HFile do zagęszczenia, ale nie wszystkie. W przypadku dużego zagęszczania wszystkie pliki są wybierane do kompaktowania razem. Duże zagęszczanie działa jak pomniejsze, z wyjątkiem tego, że znaczniki usuwania można usunąć po zastosowaniu ich do wszystkich powiązanych komórek, a wszystkie dodatkowe wersje tej samej komórki również zostaną usunięte.

Część 2 - pytania do wywiadu HBase (zaawansowane)

Rzućmy teraz okiem na zaawansowane pytania wywiadu HBase.

6.Jak dane w wersji HBase?

Odpowiedź:
Po wstawieniu / aktualizacji / usunięciu fragmentu danych HBase utworzy nową wersję dla tej kolumny. Rzeczywiste usuwanie ma miejsce tylko podczas zagęszczania. Jeśli określona komórka przekroczy liczbę dozwolonych wersji, dodatkowe wersje zostaną upuszczone podczas kompaktowania

7. Jaka jest różnica między pobieraniem a skanowaniem?

Odpowiedź:
Get zwróci tylko jeden wiersz z tabeli Hbase na podstawie podanego klucza wiersza. Polecenie skanowania zwraca zestaw wierszy w zależności od podanych warunków wyszukiwania. Zwykle get jest szybszy niż skanowanie. Dlatego też wolę używać tego, jeśli to możliwe.

Przejdźmy do następnych pytań do wywiadu HBase.

8. Co dzieje się podczas usuwania wiersza?

Odpowiedź:
W momencie usuwania dane polecenia nie są fizycznie usuwane z systemu plików, lecz stają się niewidoczne po ustawieniu znacznika. Fizyczne usuwanie ma miejsce podczas zagęszczania
Znaczniki usuwania kolumn, wersji i rodziny to trzy różne typy znaczników, które oznaczają usunięcie odpowiednio kolumny, wersji kolumny i rodziny kolumn.

9. Wyjaśnij różnicę między HBase a Hive.

Odpowiedź:
To jest zaawansowane pytanie wywiadu HBase zadane w wywiadzie. Zarówno HBase, jak i Hive to zupełnie różne technologie przetwarzania danych oparte na Hadoop. Hive jest relacyjną strukturą pamięci rozproszonej zgodną z SQL, a HBase to magazyn kluczy i wartości NoSQL. Hive działa jako warstwa abstrakcji na Hadoop z obsługą SQL. Wzorzec dostępu do danych HBase jest bardzo ograniczony dzięki dwóm podstawowym operacjom - get i scan. HBase jest idealny do przetwarzania danych w czasie rzeczywistym, gdzie Hive jest idealnym wyborem do przetwarzania danych wsadowych.

10. Co to są Hlog i HFile?

Odpowiedź:
HLog to plik dziennika z wyprzedzeniem, znany również jako WAL, a HFile to prawdziwy plik do przechowywania danych. Dane są najpierw zapisywane do pliku dziennika z wyprzedzeniem, a także zapisywane w MemStore. Gdy MemStore zostanie zapełnione, zawartość MemStore zostanie wypłukana na dysk do plików HFiles.

Polecany artykuł

Jest to przewodnik po liście pytań do Hbase podczas wywiadu i odpowiedzi, dzięki czemu kandydat może łatwo stłumić pytania Hbase podczas rozmowy kwalifikacyjnej. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

Przydatne pytania podczas wywiadu grupowego
Ważne podstawowe wskazówki dotyczące wywiadu
Niezbędne kroki do przygotowania do rozmowy kwalifikacyjnej
Wywiad Pytania do kandydata na finanse

10 najważniejszych pytań i odpowiedzi na wywiad HBase (Zaktualizowane dla 2019)

Spisie treści:

Wprowadzenie do wywiadu Hbase Pytania i odpowiedzi

Część 1 - Pytania do wywiadu HBase (podstawowe)

1. Kiedy należy stosować HBase?

2. Jaka jest różnica między Cassandrą a HBase?

3. Jakie są główne składniki Hbase?

4. Co to jest filtr Bloom HBase?

5. Co to jest zagęszczanie? Wyjaśnij różne jego rodzaje.

Część 2 - pytania do wywiadu HBase (zaawansowane)

6.Jak dane w wersji HBase?

7. Jaka jest różnica między pobieraniem a skanowaniem?

8. Co dzieje się podczas usuwania wiersza?

9. Wyjaśnij różnicę między HBase a Hive.

10. Co to są Hlog i HFile?

Polecany artykuł

Wiodące zera w programie Excel (przykłady) - Jak dodać wiodące zera?

Leasing vs Kup - 7 najlepszych różnic do nauczenia się (z infografiką)

Poziomy Six Sigma - Poznaj różne poziomy Six Sigma

Pożyczki a pożyczki - 8 najważniejszych różnic do nauczenia (z infografiką)

Lewe PRZYCINANIE w Excelu - Usuń wiodące spacje za pomocą funkcji TRIM

Atrybut stylu HTML - Lista różnych atrybutów stylu HTML

Tagi formatujące tekst HTML - Jak działa formatowanie tekstu w HTML?

Lista nieuporządkowana HTML - Składnia i typy atrybutów z przykładami

10 najlepszych różnic między HTML a HTML5 (infografiki)

HTML a JavaScript - 8 Przydatne porównanie, które musisz wiedzieć

Zwrot z zaangażowanego kapitału - Przykłady - Zalety i ograniczenia

Zwrot ze średniego kapitału zaangażowanego - Zalety i ograniczenia

Renderowanie w 3ds Max - Tworzenie ustawień renderowania dla obiektów 3D

Formuła zwrotu z kapitału zaangażowanego (ROCE) - Kalkulator (szablon Excel)

Zwrot z kapitału własnego (ROE) - Kalkulator (szablon Excel)