Co to jest wizualizacja danych?

I dlaczego nie zależy nam już na wykresach kołowych,

Wizualizacja danych to nie tylko zwykłe przełożenie punktów danych na marne wykresy słupkowe i liniowe. To jest jak zanurzenie się w oceanie, w którym kryją się skarby na każdym poziomie. Na samym początku mamy prosty podział danych na podręczniki. wykresy rozrzutu, wykresy liniowe, wykresy kołowe i wykresy słupkowe. Wykresy liniowe są zwykle używane do zobrazowania trendu danych w czasie. W tym temacie, czym jest wizualizacja danych, wyczyściliśmy całą koncepcję za pomocą danego wykresu i wykresów kołowych.

Wykresy kołowe

Jednym z najbardziej powszechnych używanych wykresów jest wykres pizzy lub wykres kołowy.

Proporcja gazów w mieszaninie.

Źródło : fabuła

Ten wykres, choć powszechnie popularny podczas wyborów w celu pokazania, która partia ma lwy do udziału w głosowaniu, ma bardzo rażące wady. Statystycy tacy jak Edward Tufte, Leland Wilkinson i Gerald van Belle wyrazili niechęć do korzystania z wykresów kołowych. Najbardziej rozstrzygające dowody przeciwko wykresom kołowym prawdopodobnie przedstawił Stephen Few, założyciel Perceptual Edge. W swoim artykule „Zachowaj ciasto na deser” opublikowanym w biuletynie Visual Business Intelligence Stephen wyjaśnia, dlaczego ku zaskoczeniu kolegów i studentów uważa, że ​​wykresy kołowe są nieskutecznym sposobem wizualizacji danych.

Spójrz na poniższy wykres kołowy.

Na tym wykresie przedstawiającym odsetek artykułów spożywczych zamówionych po 21:00 można łatwo oszacować odsetek należących do lodów - 25%. Jednak po drobnych modyfikacjach nie jest już możliwe łatwe ustalenie odsetka zamówień na lody.

Chociaż odsetek lodów jest nadal taki sam i wynosi 25%. Trudno to zrozumieć na powyższym schemacie. Na poprzednim schemacie łatwo było odgadnąć wartość procentową, ponieważ odcień lodów zaczął się od pozycji godziny 6 i rozciągał się do pozycji godziny 9. Ponieważ nasze oczy są wytrenowane, aby zobaczyć zegary na 12, 3, 6 i 9 - wykres kołowy jest również łatwiejszy do interpretacji, jeśli jego regiony przylegają do 4 pozycji zegara. Zwolennik zapalonego wykresu kołowego zgłosiłby się i zasugerował, że problemu tego można łatwo uniknąć, stosując etykiety i oznaczając procent dla każdego regionu.

Wykres kołowy z etykietami danych

Ale z drugiej strony, aby zmapować wartość z przedmiotem, nasze oczy muszą nadal przenosić fokus z legendy u dołu wykresu na etykiety na wykresie. Rozwiązaniem tego byłoby załączyć również nazwę elementu wraz z wartościami, aby uzyskać coś podobnego do tego:

Idealnie, powiedziałbyś. Ale potem pytam cię - teraz, gdy dołączyliśmy nazwy przedmiotów wraz z wartościami, czym różni się powyższy wykres kołowy od poniższej tabeli:

Czysta tabela z danymi posortowanymi według Procent zamówienia

Czy te informacje nie wyglądają znacznie lepiej niż etykiety i legendy rozrzucone na wykresie kołowym. Do czego służy wykres kołowy? Wizualizacje mają stanowić wartość dodaną, są agentami wniosków, mają ujawnić tajemnice danych. Ale w tym przypadku wykres kołowy nie spełnia swojej obietnicy.

Wejdź do wykresu słupkowego wizualizacji danych

Węższą i bardziej elegancką alternatywą dla wykresu kołowego jest wykres słupkowy, który jest w stanie wyrazić wszystko, co mówi ciasto i wiele więcej, bez robienia bałaganu z etykietami i legendami.

Wykres słupkowy przedstawiający to samo - łatwe do porównania, kontrastu i zakończenia

Ta sama informacja jest teraz delikatnie prezentowana obserwatorowi. Oprócz pokazania poszczególnych wartości, ten wykres pozwala nam szybko porównać popularność każdego produktu spożywczego, a nawet porównać względną różnicę wartości między kolejnymi produktami. Te same dane byłyby dostępne za pośrednictwem tabeli, ale nasze mózgi lepiej przetwarzają obrazy niż rozszyfrowują tekst. Dlatego użycie wykresu kołowego z czasem uległo zmniejszeniu. Chociaż jest to ulubiona grafika w branży medialnej, została zastąpiona lepszymi i bardziej wyrafinowanymi przedstawieniami. Oprócz wykresów liniowych, ciast i wykresów słupkowych, istnieje mnóstwo innych wykresów, które się przydają. Jednym z interesujących wykresów, ale nie tak popularnym wśród niewtajemniczonych, jest diagram Sankeya. Ten diagram służy do wyrażenia rozkładu i przepływu materii. Chodzi tu o energię, pieniądze, a nawet wodę.

Sankey Schemat przepływu energii i dystrybucji typowego pracownika IT.

Powyżej znajduje się fikcyjny diagram Sankeya, w którym pokazano, w jaki sposób i gdzie dystrybuowana jest większość energii pracownika IT.

Nowsze narzędzia

Wraz z pojawieniem się mediów społecznościowych i różnych platform, na których ludzie mogą zapisywać swoje uczucia, recenzje i opinie, jednym z powszechnych narzędzi do wizualizacji danych jest chmura słów. Chmury słów pomagają nam dowiedzieć się, o czym mówią ludzie.

Bardzo realna, reprezentująca na żywo chmura słów opinii użytkowników PUBG w sklepie Google Play

Jeśli spojrzymy na chmurę słów tutaj, która została zbudowana z 80 najlepszych recenzji gry PUBG w sklepie Google Play, widzimy, że ogólna reakcja na grę jest „dobra”, niektórzy nawet nazywają ją „najlepszą” . Wydaje się jednak, że istnieje problem z niektórymi „aktualizacjami”, które ludzie błagają twórców gry o naprawienie. Rzeczywiście, gdy sprawdzamy recenzje sklepu z zabawkami w tym dniu, widzimy to samo.

Problem z aktualizacjami. Sprawdź także, czy możesz znaleźć tutaj słowo „proszę”

Przyszłość

To tylko drapanie czubka góry lodowej. Biblioteki takie jak plotly i D3 przeniosły wizualizację danych na inny poziom. Stało się tak, ponieważ zmieniło się również zapotrzebowanie. Jak wyobrażasz sobie inteligentne miasto na desce rozdzielczej? Olbrzymi ekran, na którym można wyświetlić parametry witalne całego miasta. Ruch, zużycie energii, warunki zdrowotne różnych obszarów, jakość powietrza i wiele innych parametrów muszą być wyświetlane na jednej stronie. Wymóg ten wymaga innego podejścia do wizualizacji danych. Dowiedzieliśmy się, że czym jest wizualizacja danych za pomocą tej koncepcji. Nie możemy dłużej trzymać się wykresów i wykresów. Potrzebne jest nowatorskie podejście, w którym wykresy spotykają się ze sztuką i wyobraźnią, tworząc wzbogacające wrażenia wizualne. Ta dyskusja wymaga zupełnie innego artykułu. Do następnego razu.

Polecane artykuły

Ten artykuł jest pomocnym przewodnikiem na temat wizualizacji danych. Omówiliśmy podstawowe pojęcia za pomocą wykresów i wykresów, abyś mógł łatwo zrozumieć wizualizację danych. Możesz także spojrzeć na następujący artykuł, aby dowiedzieć się więcej -

  1. Kariera w Oracle Database Administrator
  2. 7 Najbardziej użyteczna różnica między eksploracją danych a eksploracją sieci
  3. Pytania do analityki danych
  4. Przykłady analizy dużych zbiorów danych

Kategoria: