Wprowadzenie do rodzajów wizualizacji danych

Na współczesnej arenie dużych zbiorów danych, mając ponad 2, 5 kwintillionów bajtów (1 kwintillion bajtów = 10 18 bajtów!) Danych tworzonych każdego dnia (według socialmediatoday.com), istnieje ogromna potrzeba przechowywania danych. Nie trzeba dodawać, że dane te są gęste, a zatem nie są tak czytelne dla użytkownika i są stale nieostre. Aby zmienić paradygmat łatwego zrozumienia zakresu danych i czerpać użyteczne korzyści z biznesu, dane muszą być prezentowane w bardziej intuicyjny sposób, a zatem wymagałyby odpowiednich wykresów do ich wizualizacji. Istnieją narzędzia i metodologie zbudowane w celu skutecznego przedstawiania danych, ale skuteczność zależy głównie od rodzaju danych i wymagań, które należy wyodrębnić z danych.

Co to jest wizualizacja danych?

Wizualizacja danych to metodologia, w której dane w formacie surowym są przedstawiane w celu wydobycia znaczenia tego. Wraz z pojawieniem się dużych zbiorów danych konieczne stało się stworzenie sensownego sposobu prezentacji danych, aby ilość danych nie stała się przytłaczająca. Część przedstawiania danych może być wykorzystywana do różnych celów, na przykład do znajdowania trendów / podobieństw / wzorów w danych, budowania modeli do uczenia maszynowego lub może być wykorzystana do prostej operacji, takiej jak agregacja.

Różne typy wizualizacji danych

Wizualizacja danych jest ogólnie podzielona na 6 różnych typów. Chociaż obszar wizualizacji danych stale się powiększa, nie będzie zaskoczeniem, jeśli liczba kategorii wzrośnie.

Czasowy: Dane dla tego rodzaju wizualizacji powinny spełniać oba warunki: reprezentowane dane powinny być liniowe i jednowymiarowe. Te typy wizualizacji są reprezentowane przez linie, które mogą się nakładać, a także mają wspólny punkt danych rozpoczęcia i zakończenia.
Wykresy punktoweWykorzystuje kropki do przedstawienia punktu danych. Najczęstsze w dzisiejszym świecie w uczeniu maszynowym podczas eksploracyjnej analizy danych.
Wykres kołowyTen rodzaj wizualizacji obejmuje grafikę kołową, w której długość łuku oznacza wielkość.
Wykres obszaru polarnegoPodobnie jak wykres kołowy, wykres pola biegunowego jest wykresem kołowym, z wyjątkiem kątów sektorowych, ma jednakową długość, a odległość rozciągania się od środka oznacza wielkość.
Wykresy liniowePodobnie jak wykres rozproszenia, dane są reprezentowane przez punkty, z wyjątkiem linii łączonych w celu zachowania ciągłości.
Osie czasuW ten sposób wyświetlamy listę punktów danych w chronologicznym porządku czasowym.
Sekwencje szeregów czasowychW szeregach czasowych reprezentujemy wielkość danych na wykresie 2D w kolejności chronologicznej znacznika czasu w danych.
Hierarchiczny: Te typy wizualizacji przedstawiają uporządkowane grupy w większej grupie. W prostym języku, główną intuicją stojącą za tymi wizualizacjami jest to, że klastry można wyświetlić, jeśli przepływ klastrów rozpoczyna się od jednego punktu.
Schemat drzewaNa diagramie drzewa przepływ hierarchiczny jest reprezentowany w formie drzewa, jak sugeruje nazwa. Kilka terminologii dla tej reprezentacji to:

- Węzeł główny: punkt początkowy.

- Węzeł potomny: ma nadrzędnego powyżej

- Węzeł liścia: Nigdy więcej węzła potomnego.

Wykresy pierścieniowe / Schemat SunburstReprezentacja drzewa na diagramie drzewa jest przekształcana na podstawie promieniowej. Ten typ pomaga przedstawić drzewo w zwięzłym rozmiarze. Najbardziej wewnętrzny krąg jest węzłem głównym. A obszar węzła potomnego oznacza% danych.
TreeMapDrzewo jest reprezentowane w postaci ściśle upakowanych prostokątów. Obszar oznacza zawartą ilość.
Pakowanie w kręguPodobnie jak mapa, używa prostokątów zamiast prostokątów.
Sieć: Wizualizacja tego typu łączy zestawy danych ze zbiorami danych. Te wizualizacje przedstawiają relacje między tymi zestawami danych w sieci.
Wykresy macierzyTen rodzaj wizualizacji jest szeroko stosowany do znalezienia połączenia między różnymi zmiennymi w ich obrębie. Na przykład wykres korelacji
Diagramy aluwialneJest to rodzaj schematu blokowego, w którym zmiany w przepływie sieci są przedstawiane w przedziałach czasowych zgodnie z życzeniem użytkownika.

Chmura słówJest to zwykle używane do reprezentowania danych tekstowych. Słowa są ciasno upakowane, a rozmiar tekstu oznacza jego częstotliwość.

Diagramy węzłówTutaj węzły są reprezentowane jako kropki, a połączenie między węzłami jest prezentowane.
Wielowymiarowe: W przeciwieństwie do tymczasowej wizualizacji, typy te mogą mieć wiele wymiarów. W tym przypadku możemy użyć 2 lub więcej funkcji do stworzenia wizualizacji 3D za pomocą równoczesnych warstw. Umożliwi to użytkownikowi prezentowanie kluczowych dań na wynos poprzez rozbicie wielu nieprzydatnych danych.
Wykresy rozrzutuW danych wielowymiarowych wybieramy dowolne 2 cechy, a następnie wykreślamy je na wykresie punktowym 2D. W ten sposób otrzymalibyśmy n C 2 = n (n-1) / 2 wykresy.
Ułożone wykresy słupkowePaski segmentu reprezentacji jeden na drugim. Może to być 100% skumulowany wykres słupkowy, na którym segregacja jest reprezentowana w%, lub prosty skumulowany wykres słupkowy, który oznacza rzeczywistą wielkość
Wykres równoległych współrzędnychW tej reprezentacji rysowane jest tło i n rysowanych jest równoległych linii (dla danych n-wymiarowych).
Geospatial: Te wizualizacje odnoszą się do aktualnej fizycznej lokalizacji przez skrzyżowanie jej z mapami (może to być mapa geoprzestrzenna lub przestrzenna). Intuicyjna wizualizacja polega na stworzeniu całościowego obrazu wydajności.
Mapa przepływuPrzenoszenie informacji lub obiektów z jednej lokalizacji do drugiej jest prezentowane tam, gdzie wielkość strzałki oznacza ilość.
Choropleth MapMapa geoprzestrzenna jest kolorowana na podstawie konkretnej zmiennej danych.
KartogramTen typ reprezentacji wykorzystuje zmienną tematyczną do mapowania. Mapy te zniekształcają rzeczywistość w celu przedstawienia informacji. Oznacza to, że w przypadku określonej zmiennej mapy są przesadzone. Na przykład obraz po lewej stronie jest przestrzenną mapą zniekształconą do struktury ula.

Mapa ciepłaSą one bardzo podobne do Choropletha w gatunku geoprzestrzennym, ale można je również stosować na obszarach innych niż geoprzestrzenne.
Różne: Tych wizualizacji nie można uogólniać w szczególnie dużej grupie. Zamiast tworzyć mniejsze grupy dla poszczególnych typów, grupujemy je w różne. Kilka przykładów znajduje się poniżej:
Wykres Open-High-Low-CloseTen typ wykresów jest zwykle używany do przedstawienia ceny akcji. Trend wzrostowy nazywany jest uparty, a malejący - uparty .
Kagi-ChartZwykle podaż popytu na aktywa jest reprezentowana za pomocą tego wykresu.

Wniosek

Z powyższych typów wizualizacji widzimy, że ogólnie istnieje 6 rodzajów grup. Powyższa lista nie jest wyczerpująca, ale kilka z nich jest powszechnie używanych. W nadchodzących czasach, gdy nowe typy zostaną dodane do listy, grupy mogą wzrosnąć. To tyle w przypadku rodzajów wizualizacji. Kontynuowalibyśmy, na jakie parametry patrzeć podczas ustalania rodzaju wizualizacji.

Polecane artykuły

Jest to przewodnik po rodzaju wizualizacji danych. Tutaj omawiamy Wprowadzenie i różne typy wizualizacji danych. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Rodzaje technik analizy danych
  2. Integracja danych Talend
  3. Narzędzia analizy danych
  4. Narzędzia do nauki danych
  5. Narzędzia Talend
  6. Co to jest integracja danych?
  7. Wykresy rozrzutu w Matlabie
  8. Jak używany jest wykres słupkowy w Matlabie (przykłady)

Kategoria: