R Etykiety pudełkowe - Jak tworzyć losowe dane? - Analiza wykresu

Wprowadzenie do etykiet Boxplot w R

Etykiety Boxplot pomagają w wizualizacji rozproszonych danych w R. Wykres przedstawia średnią, medianę i wariancję. Wartości podane są jako dane wejściowe do funkcji boxplot (). Funkcja Boxplot () tworzy wykres pola za pomocą danych wejściowych. Wykres można utworzyć dla pojedynczych zmiennych lub grupy.

Rysowanie wykresu pudełkowego

Potrzebujemy pięciu wartościowych danych wejściowych, takich jak średnia, wariancja, mediana, pierwszy i trzeci kwartyl.
Określenie, czy w danych występują wartości odstające.
Zaprojektuj model do wykreślenia danych.

Parametry w funkcji boxplot ()

wzór: ten parametr pozwala rozlać wartości liczbowe na kilka grup.
Dane :: Dane wejściowe, które zawierają ramkę danych lub listę.
Podzbiór: Opcjonalny parametr wektorowy, aby określić podzbiór do wydruku.
xlab: adnotacja na osi x
ylab: adnotacja na osi y.
zakres: zakres określa rozszerzenia wykresu.
akcja: określ, co się stanie, gdy wartość będzie pusta. Zignoruj odpowiedź lub wartość.

Tworzenie losowych danych

Możemy tworzyć losowe dane przykładowe za pomocą funkcji rnorm ().

Użyjmy teraz rnorm (), aby utworzyć losowe próbki danych o 10 wartościach.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Powyższe polecenie generuje 10 losowych wartości ze średnią 3 i odchyleniem standardowym = 2 i zapisuje je w ramce danych.

Kiedy drukujemy dane, otrzymujemy poniższy wynik.

Stat1

1 2, 662022

2 2.184315

3 5, 974787

4 4.536203

5 4, 808296

6 3, 817232

7 1.135339

8 1, 583991

9 3.308994

10 4.649170

Możemy przekonwertować te same dane wejściowe (dane) na funkcję boxplot, która generuje wykres.

Dodajemy więcej wartości do danych i sprawdzamy, jak zmienia się wykres.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2), Stat2=rnorm(10, mean=4, sd=1), Stat3=rnorm(10, mean=6, sd=0.5), Stat4=rnorm(10, mean=3, sd=0.5)) boxplot(data)

Dodając więcej losowych wartości i używając go do przedstawienia wykresu.

Poniżej znajdują się wartości, które są przechowywane w zmiennej danych.

STAT 1	STAT 2	STAT 3	STAT 4
3, 795465	4, 21864	5, 827585	2, 157315
0, 911726	4.09119	6.260811	2, 26594
3, 707828	3, 35987	5, 88945	3, 714557
0, 115772	4.5123	5, 934858	2, 40645
0, 697556	2.15945	6, 81147	2, 571304
5.129231	3, 2698	6, 250068	3, 025175
5, 404101	4, 38939	5, 670061	2, 9901
1, 455066	3.13059	5, 692323	2, 69693
0, 868636	5.42311	5, 415435	2, 674768
2, 14113	3, 90728	6.206059	2, 806656

Poniżej znajduje się wykres pudełkowy z 40 wartościami. Mamy 1-7 liczb na osi y i stat1 do stat4 na osi x.

Możemy zmienić wyrównanie tekstu na osi X za pomocą innego parametru o nazwie las = 2.

Analiza wykresu etykiet R Boxplot

Podaliśmy dane w ramce danych i widzimy powyższy wykres.

Aby zrozumieć dane, spójrzmy na wartości stat1.

Wykres przedstawia wszystkie 5 wartości. Począwszy od minimalnej wartości od dołu, a następnie od trzeciego kwartylu, średniej, pierwszego kwartylu i wartości minimalnej.

Powyższy wykres ma wyrównanie tekstu poziomo na osi x.

Zmiana koloru

We wszystkich powyższych przykładach widzieliśmy fabułę w czerni i bieli. Zobaczmy, jak zmienić kolor na wykresie.

Możemy dodać parametr col = color do funkcji boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2), Stat2=rnorm(10, mean=4, sd=1), Stat3=rnorm(10, mean=6, sd=0.5), Stat4=rnorm(10, mean=3, sd=0.5)) boxplot(data, las=2, col="red") data

Poniżej widzimy wynik wydruku na czerwono.

Korzystając z tego samego powyższego kodu, możemy dodać wiele kolorów do wykresu.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2), Stat2=rnorm(10, mean=4, sd=1), Stat3=rnorm(10, mean=6, sd=0.5), Stat4=rnorm(10, mean=3, sd=0.5)) boxplot(data, las=2, col=c("red", "blue", "green", "yellow") data

Dodawanie etykiet

Możemy dodawać etykiety za pomocą parametrów xlab, ylab w funkcji boxplot ().

Używając parametru głównego, możemy dodać nagłówek do wykresu.

Parametr wycięcia służy do lepszego zrozumienia wykresu. Ponieważ mediany między stat1 a stat4 nie pasują do powyższego wykresu.

Zalety i wady wykresu pudełkowego

Zalety

Podsumowanie dużych ilości danych jest łatwe dzięki etykietom boxplot.
Wyświetla zasięg i rozkład danych na osi.
Wskazuje symetrię i skośność
Pomaga zidentyfikować wartości odstające w danych.

Niedogodności

Można używać tylko do danych liczbowych.
Jeśli w danych występują rozbieżności, wykres pola nie może być dokładny.

Uwagi:

Wykresy muszą być odpowiednio oznakowane.
Skale są ważne; zmiana skali może nadać danym inny widok.
Porównywanie danych z prawidłowymi skalami powinno być spójne

Wniosek - etykiety R Boxplot

Grupowanie danych jest łatwiejsze dzięki pomocy wykresów pudełkowych. Wykres pudełkowy obsługuje wiele zmiennych, a także różne optymalizacje. Możemy również zmieniać skale w zależności od danych.

Wykresy pudełkowe mogą służyć do porównywania różnych zmiennych danych lub zestawów.

Użyteczność boxplot jest łatwa i wygodna. Potrzebujemy spójnych danych i odpowiednich etykiet. Wykresy pudełkowe są często używane w badaniach danych, a nawet przez zespoły sprzedaży do grupowania i porównywania danych. Boxplot daje wgląd w potencjał danych i optymalizacje, które można wykonać w celu zwiększenia sprzedaży.

Boxplot to ciekawy sposób na przetestowanie danych, który daje wgląd w wpływ i potencjał danych.

Polecane artykuły

Jest to przewodnik po etykietach R Boxplot. Tutaj omawiamy funkcję Parameters under boxplot (), jak tworzyć losowe dane, zmieniać analizę kolorów i wykresów oraz zalety i wady. Możesz także spojrzeć na następujący artykuł, aby dowiedzieć się więcej -

Rodzaje wizualizacji danych
Implementacja hurtowni danych
Techniki nauki danych
Co to jest moduł danych?

R Etykiety pudełkowe - Jak tworzyć losowe dane? - Analiza wykresu

Spisie treści:

Wprowadzenie do etykiet Boxplot w R

Tworzenie losowych danych

Analiza wykresu etykiet R Boxplot

Zmiana koloru

Dodawanie etykiet

Zalety i wady wykresu pudełkowego

Zalety

Niedogodności

Wniosek - etykiety R Boxplot

Polecane artykuły

Szkic portretowy do kolorowego - Photoshop Tutorial

Ciepłe złote zachody słońca z mapami gradientu - Photoshop Tutorial

Odblokuj pełną moc podstawowych opcji w Photoshopie

Utwórz własne kształty niestandardowe programu Photoshop

Panel Ukryte ostatnie pliki w Photoshop CC

Formuła zysku księgowego - Kalkulator (przykłady z szablonem Excel)

Formuła naliczonych odsetek - Kalkulator (przykłady z szablonem Excel)

Inwestowanie aktywne a pasywne - 10 najlepszych różnic (z infografiką)

Wzór na stosunek testu kwasowego - Kalkulator (szablon Excel)

Formuła skumulowanej amortyzacji - Kalkulator (z szablonem Excel)

Poznaj 7 przydatnych różnic między SPSS a Stata

Polecenie zmiany SQL - Jak korzystać z polecenia Zmień w przykładach?

Zaktualizuj polecenia SQL - Koncepcje - Podstawowe i zaawansowane polecenia

Ograniczenia SQL - Top 6 różnych rodzajów ograniczeń SQL

Wywiad SQL Pytania i odpowiedzi (Zaktualizowano na 2019 r.)