Wprowadzenie do harmonogramów Hadoop
Kiedy mówimy o Hadoop, pierwszą rzeczą, która przychodzi nam na myśl, są duże zbiory danych. Ale czy kiedykolwiek zastanawialiśmy się, czy Hadoop sam w sobie nie jest tylko technologią, która zawiera w sobie wiele narzędzi i technik, więc jak dokładnie jesteśmy w stanie automatycznie osiągnąć to, co jest zamierzone. Odpowiedzią na to pytanie jest skorzystanie z harmonogramów Hadoop.
Umożliwia wysoki poziom przetwarzania systemu i jest również znany jako system ogólnego przeznaczenia, który działa na poziomie dystrybucji zestawu danych i informacji. Jest to system wielozadaniowy, który służy do przetwarzania wielu zestawów danych dla wielu użytkowników i zadań jednocześnie. Wcześniej tylko jeden harmonogram był używany do wszystkich zadań, ale teraz harmonogramy Hadoop są tymi, które są używane wraz z logiką JobTracker i są również obsługiwane przez Hadoop.
Top 4 typy harmonogramów Hadoop
Istnieje kilka rodzajów harmonogramów Hadoop, z których często korzystamy:
1. Hadoop First in First out Scheduler
- Jak sama nazwa wskazuje, jest to jeden z najstarszych harmonogramów zadań, który działa na zasadzie „pierwsze weszło i pierwsze wyszło”. Zasadniczo, gdy mówimy o procesie takim jak JobTracker, mówimy o pobieraniu zadań z kolejki, o której często mówi się, że to kolejka robocza.
- Zgodnie z kolejką roboczą zadanie, które jest najstarsze, tj. Pierwsze, będzie również tym pierwszym, które zostanie wykonane.
- Zawsze uważano, że jest to znacznie prostsze podejście niż w przypadku innych technik planowania, dlatego też nie poświęcano wiele uwagi skrobaniu tej techniki tylko w celu znalezienia nowszych podejść z lepszymi możliwościami planowania, ponieważ zawierały one również koncepcje określania wielkości i priorytetu zadania.
2. Hadoop Capacity Scheduler
- Program do planowania wydajności Hadoop jest mniej więcej podobny do podejścia FIFO, z tym wyjątkiem, że wykorzystuje również priorytetyzację zadania. To podejście ma nieco inne podejście, gdy mówimy o poziomie planowania dla wielu użytkowników.
- Ten jest znany z planowania i symulacji osobnego klastra MapReduce dla każdej organizacji lub użytkownika, co odbywa się zgodnie z harmonogramem typu FIFO.
3. Hadoop Fair Type Scheduler
- Gdy pojawia się potrzeba zapewnienia oddzielnej i rozsądnej ilości pojemności klastra wraz z czasem i okresem, korzystamy z uczciwego harmonogramu Hadoop. Jest to pomocne w uzyskiwaniu wszystkich klastrów, nawet jeśli określone zadanie jest w stanie roboczym.
- Co więcej, wszystkie wolne miejsca w klastrze są dostarczane do wszystkich zadań w taki sposób, że każdy użytkownik otrzymuje znormalizowany udział swojej części klastra, gdy więcej zadań staje się użytecznych do przesłania.
- Jeśli istnieje pula, która nie otrzymała jeszcze swojej części sprawiedliwego udziału i znormalizowanego udziału przez stosunkowo dobry czas i okres, wówczas wchodzi w grę zapobieganie, zabijając w ten sposób wszystkie połączone zadania i działając z możliwością zapewnienia tej puli sloty do uruchomienia poniżej pojemności.
- Co więcej, jest to również znane jako moduł contrib, co oznacza, że kopiując katalog kontrolny i oparty na rzetelnym harmonogramie Hadoop do katalogu opartego na lib i umieszczając plik JAR w odpowiednim miejscu, można włączyć tę technikę planowania. Jedyne, co należy zrobić, to ustawienie właściwości harmonogramu zadań na mapred.FairScheduler.
4. Inne podejścia dotyczące harmonogramu
- Hadoop zapewnia oferowanie klastrów wirtualnych, co oznacza, że można zminimalizować potrzebę posiadania fizycznych klastrów, a ta technika jest znana jako HOD (Hadoop na żądanie).
- Korzysta z menedżera zasobów opartego na Torque, aby utrzymywać węzły w gotowości i alokować je zgodnie z wymaganiami wirtualnego klastra.
- Służy do inicjalizacji obciążenia i systemu opartego na poszczególnych węzłach w klastrze wirtualnym, a nie fizycznym, a także wraz z przydzielonymi węzłami, tylko wtedy, gdy pliki konfiguracyjne są przygotowywane automatycznie.
- Klaster HOD można również wykorzystać w stosunkowo niezależny sposób po dokonaniu inicjalizacji. W skrócie, model pigułki, który jest używany do wdrażania tych dużych klastrów Hadoop, znajduje się w infrastrukturze chmurowej i to się nazywa HOD. Porównuje mniejszą liczbę węzłów i dlatego zapewnia większe bezpieczeństwo.
Znaczenie korzystania z harmonogramów Hadoop
- Z rodzajów harmonogramów Hadoop powinno być jasne, gdzie leży znaczenie korzystania z tych harmonogramów Hadoop. Jeśli prowadzisz duży klaster, który ma różne typy zadań, różne priorytety i rozmiary wraz z wieloma klientami, wybierz odpowiedni rodzaj harmonogramu Hadoop, aby stać się ważnym.
- Jest to ważne, ponieważ zapewnia gwarantowany dostęp do nieużywanego poziomu pojemności i optymalne wykorzystanie zasobów poprzez efektywne ustalanie priorytetów zadań w kolejkach. Mimo że ta część harmonogramów Hadoop jest stosunkowo łatwa, ponieważ stosowanie uczciwych harmonogramów jest w większości właściwym wyborem, jeśli występuje różnica między liczbą i typami klastrów działających w ramach jednej organizacji.
- Ten sprawiedliwy harmonogram nadal może być wykorzystywany do zapewniania i nierównomiernego rozdzielania pojemności pul zadań i odbywa się to w znacznie prostszy i konfigurowalny sposób. Na ratunek przychodzi nam także sprawiedliwy harmonogram, gdy mówimy o obecności zróżnicowanych rodzajów zadań, ponieważ można go wykorzystać do zapewnienia wyższych czasów reakcji w przypadku stosunkowo mniejszych zadań, które są pomieszane z większymi rodzajami zadań, a wsparcie dla nich jest zawarte w interaktywne wykorzystanie modeli.
- Harmonogramy wydajności są pomocne, gdy bardziej martwisz się kolejkami zamiast poziomu utworzonych pul, a także konfigurowalnym poziomem mapy i ograniczaniem liczby miejsc zadań, a kolejka może sobie pozwolić na uzyskanie gwarantowanej pojemności klastra.
Wniosek
W tym poście czytamy o harmonogramach Hadoop, ich znaczeniu, wprowadzeniu, typach harmonogramów Hadoop, ich funkcjach, a także dowiedzieliśmy się o znaczeniu tych harmonogramów Hadoop. Jeśli chodzi o ekosystem i środowisko dużych zbiorów danych, harmonogramy Hadoop są czymś, o czym często się nie mówi, ale mają ogromne znaczenie i nie można sobie pozwolić na pozostawienie ich takimi, jakie są. Mam nadzieję, że podoba Ci się nasz artykuł.
Polecane artykuły
To jest przewodnik po Harmonogramach Hadoop. Tutaj omawiamy wprowadzenie i 4 najpopularniejsze typy harmonogramu Hadoop ze znaczeniem ich użycia. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej-
- Swing Components w Javie
- JTabbedPane w Javie
- Chronione słowo kluczowe w Javie
- JTextArea w Javie