Co to jest ul?

Przed zrozumieniem typów danych gałęzi najpierw przestudiujemy ul. Hive to technika hurtowni danych firmy Hadoop. Hadoop to segment przechowywania i przetwarzania danych platformy Big Data. Hive zajmuje pozycję w zakresie technik przetwarzania danych ciągłych. Podobnie jak w innych środowiskach kontynuacji, do gałęzi można dotrzeć poprzez zapytania o kontynuację. Najważniejsze oferty według gałęzi to analiza danych, zapytania ad-hoc i podsumowanie przechowywanych danych z perspektywy czasu oczekiwania, zapytania są większe.

Typy danych gałęzi

Typy danych dzielą się na dwa typy:

  • Prymitywne typy danych
  • Typy danych zbiorowych

1. Prymitywne typy danych

Prymitywne środki były starożytne i stare. wszystkie typy danych wymienione jako prymitywne są starszymi. ważne prymitywne obszary typów danych wymienione poniżej:

Rodzaj Rozmiar (bajt) Przykład
TinyInt 1 20
SmallInt 2) 20
Int 4 20
Bigint 8 20
Boolean Boolean true / False FAŁSZYWY
Podwójnie 8 10, 2222
Pływak 4 10, 2222
Strunowy Sekwencja znaków ABCD
Znak czasu Liczba całkowita / liczba zmiennoprzecinkowa / ciąg 2/3/2012 12: 34: 56: 1234567
Data Liczba całkowita / liczba zmiennoprzecinkowa / ciąg 2/3/2019

Typy danych gałęzi są implementowane przy użyciu JAVA

Przykład: Java Int służy tutaj do implementacji typu danych Int.

  • Tablice znaków nie są obsługiwane w gałęzi HIVE.
  • Hive polega na ogranicznikach do oddzielania pól, hive na koordynowaniu z Hadoop pozwala zwiększyć wydajność zapisu i odczytu.
  • Określanie długości każdej kolumny nie jest oczekiwane w bazie danych gałęzi.
  • Literały łańcuchowe można wypowiadać w ramach pojedynczych cudzysłowów („) pojedynczych cudzysłowów (').
  • W nowszej wersji gałęzi wprowadzane są typy Varchar, które tworzą specyfikator rozpiętości (pośród 1 i 65535), więc dla łańcucha znaków działa to jako największa długość wartości, jaką może pomieścić. Gdy wstawiana jest wartość przekraczająca tę długość, wówczas skrajnie prawe elementy tych wartości są obcinane. Długość znaku jest rozdzielczością z liczbą punktów kodowych kontrolowanych przez ciąg znaków.
  • Wszystkie literały całkowite (TINYINT, SMALLINT, BIGINT) są zasadniczo traktowane jako typy danych INT, a jedynie długość przekracza rzeczywisty poziom int przekształca się w BIGINT lub jakikolwiek inny odpowiedni typ.
  • Literały dziesiętne zapewniają zdefiniowane wartości i lepsze zbieranie wartości zmiennoprzecinkowych w porównaniu z typem DOUBLE. Tutaj wartości liczbowe są przechowywane w ich dokładnej formie, ale w przypadku podwójnej wartości nie są przechowywane dokładnie jako wartości liczbowe.

Proces rzutowania wartości daty

Wykonano casting Wynik
obsada (data jako data) Ta sama wartość daty
obsada (znacznik czasu jako data) Lokalna strefa czasowa służy do oceny wartości roku / miesiąca / daty i jest drukowana na wydruku.
obsada (ciąg jako data) W wyniku tego rzutowania zostanie wyświetlona odpowiednia wartość daty, ale musimy upewnić się, że łańcuch ma format „RRRR-MM-DD” Wartość Null zostanie zwrócona, gdy wartość łańcucha nie będzie zgodna z prawdą.
obsada (data jako znacznik czasu) Zgodnie z bieżącą lokalną strefą czasową dla tego procesu rzutowania zostanie utworzona wartość znacznika czasu
obsada (data jako ciąg) RRRR-MM-DD jest tworzony dla wartości roku / miesiąca / daty, a dane wyjściowe będą miały format ciągów.

2. Typy danych gromadzenia

W ulu znajdują się cztery typy danych kolekcji, które są również określane jako złożone typy danych.

  • SZYK
  • MAPA
  • STRUKTURA
  • UNIONTYPE

1. Tablica : sekwencja elementów wspólnego typu, które mogą być indeksowane, a wartość indeksu zaczyna się od zera.

Kod:

array ('anand', 'balaa', 'praveeen');

2. MAPA: Są to elementy deklarowane i wyszukiwane za pomocą par klucz-wartość.

Kod:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. STRUKTURA: Podobnie jak w C, struktura jest typem danych, który gromadzi zestaw pól oznaczonych etykietami i może być dowolnego typu danych.

Kod:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTYPE: Unia może przechowywać dowolny z określonych typów danych.

Kod:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

Wynik:

Różne ograniczniki używane w złożonych typach danych są wymienione poniżej,

Ogranicznik Kod Opis
\ n \ n Ogranicznik rekordu lub wiersza
A (Ctrl + A) \ 001 Ogranicznik pola
B (Ctrl + B) \ 002 STRUKTURY I MIEJSCA
C (Ctrl + C) \ 003 MAPY

Przykład złożonego typu danych

Poniżej znajdują się przykłady złożonych typów danych:

1. TWORZENIE STOŁU

Kod:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. DANE W PRZYKŁADOWEJ TABELI

Kod:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. ŁADOWANIE DANYCH

Kod:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. PRZEGLĄDANIE DANYCH

Kod:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Wniosek - typy danych gałęzi

Będąc na relacyjnym DB, a jednocześnie Sequel łączy HIVE oferuje wszystkie kluczowe właściwości zwykłych baz danych SQL w bardzo wyrafinowany sposób, co czyni tę jedną z bardziej wydajnych strukturalnych jednostek przetwarzania danych w Hadoop.

Polecane artykuły

Jest to przewodnik po typie danych gałęzi. Tutaj omawiamy dwa typy typów danych gałęzi z odpowiednimi przykładami. Możesz również przejrzeć nasze inne powiązane artykuły, aby dowiedzieć się więcej -

  1. Co to jest ul?
  2. Alternatywy dla ula
  3. Wbudowane funkcje Hive
  4. Hive Pytania podczas wywiadu
  5. Typy danych PL / SQL
  6. Przykłady wbudowanych funkcji Pythona
  7. Różne typy danych SQL z przykładami

Kategoria: