Wprowadzenie do etykiet Boxplot w R

Etykiety Boxplot pomagają w wizualizacji rozproszonych danych w R. Wykres przedstawia średnią, medianę i wariancję. Wartości podane są jako dane wejściowe do funkcji boxplot (). Funkcja Boxplot () tworzy wykres pola za pomocą danych wejściowych. Wykres można utworzyć dla pojedynczych zmiennych lub grupy.

Rysowanie wykresu pudełkowego

  • Potrzebujemy pięciu wartościowych danych wejściowych, takich jak średnia, wariancja, mediana, pierwszy i trzeci kwartyl.
  • Określenie, czy w danych występują wartości odstające.
  • Zaprojektuj model do wykreślenia danych.

Parametry w funkcji boxplot ()

  1. wzór: ten parametr pozwala rozlać wartości liczbowe na kilka grup.
  2. Dane :: Dane wejściowe, które zawierają ramkę danych lub listę.
  3. Podzbiór: Opcjonalny parametr wektorowy, aby określić podzbiór do wydruku.
  4. xlab: adnotacja na osi x
  5. ylab: adnotacja na osi y.
  6. zakres: zakres określa rozszerzenia wykresu.
  7. akcja: określ, co się stanie, gdy wartość będzie pusta. Zignoruj ​​odpowiedź lub wartość.

Tworzenie losowych danych

Możemy tworzyć losowe dane przykładowe za pomocą funkcji rnorm ().

Użyjmy teraz rnorm (), aby utworzyć losowe próbki danych o 10 wartościach.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Powyższe polecenie generuje 10 losowych wartości ze średnią 3 i odchyleniem standardowym = 2 i zapisuje je w ramce danych.

Kiedy drukujemy dane, otrzymujemy poniższy wynik.

Stat1

1 2, 662022

2 2.184315

3 5, 974787

4 4.536203

5 4, 808296

6 3, 817232

7 1.135339

8 1, 583991

9 3.308994

10 4.649170

Możemy przekonwertować te same dane wejściowe (dane) na funkcję boxplot, która generuje wykres.

Dodajemy więcej wartości do danych i sprawdzamy, jak zmienia się wykres.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Dodając więcej losowych wartości i używając go do przedstawienia wykresu.

Poniżej znajdują się wartości, które są przechowywane w zmiennej danych.

STAT 1STAT 2STAT 3STAT 4
3, 7954654, 218645, 8275852, 157315
0, 9117264.091196.2608112, 26594
3, 7078283, 359875, 889453, 714557
0, 1157724.51235, 9348582, 40645
0, 6975562.159456, 811472, 571304
5.1292313, 26986, 2500683, 025175
5, 4041014, 389395, 6700612, 9901
1, 4550663.130595, 6923232, 69693
0, 8686365.423115, 4154352, 674768
2, 141133, 907286.2060592, 806656

Poniżej znajduje się wykres pudełkowy z 40 wartościami. Mamy 1-7 liczb na osi y i stat1 do stat4 na osi x.

Możemy zmienić wyrównanie tekstu na osi X za pomocą innego parametru o nazwie las = 2.

Analiza wykresu etykiet R Boxplot

Podaliśmy dane w ramce danych i widzimy powyższy wykres.

Aby zrozumieć dane, spójrzmy na wartości stat1.

Wykres przedstawia wszystkie 5 wartości. Począwszy od minimalnej wartości od dołu, a następnie od trzeciego kwartylu, średniej, pierwszego kwartylu i wartości minimalnej.

Powyższy wykres ma wyrównanie tekstu poziomo na osi x.

Zmiana koloru

We wszystkich powyższych przykładach widzieliśmy fabułę w czerni i bieli. Zobaczmy, jak zmienić kolor na wykresie.

Możemy dodać parametr col = color do funkcji boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Poniżej widzimy wynik wydruku na czerwono.

Korzystając z tego samego powyższego kodu, możemy dodać wiele kolorów do wykresu.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Dodawanie etykiet

Możemy dodawać etykiety za pomocą parametrów xlab, ylab w funkcji boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Używając parametru głównego, możemy dodać nagłówek do wykresu.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Parametr wycięcia służy do lepszego zrozumienia wykresu. Ponieważ mediany między stat1 a stat4 nie pasują do powyższego wykresu.

Zalety i wady wykresu pudełkowego

Zalety

  • Podsumowanie dużych ilości danych jest łatwe dzięki etykietom boxplot.
  • Wyświetla zasięg i rozkład danych na osi.
  • Wskazuje symetrię i skośność
  • Pomaga zidentyfikować wartości odstające w danych.

Niedogodności

  • Można używać tylko do danych liczbowych.
  • Jeśli w danych występują rozbieżności, wykres pola nie może być dokładny.

Uwagi:

  1. Wykresy muszą być odpowiednio oznakowane.
  2. Skale są ważne; zmiana skali może nadać danym inny widok.
  3. Porównywanie danych z prawidłowymi skalami powinno być spójne

Wniosek - etykiety R Boxplot

Grupowanie danych jest łatwiejsze dzięki pomocy wykresów pudełkowych. Wykres pudełkowy obsługuje wiele zmiennych, a także różne optymalizacje. Możemy również zmieniać skale w zależności od danych.

Wykresy pudełkowe mogą służyć do porównywania różnych zmiennych danych lub zestawów.

Użyteczność boxplot jest łatwa i wygodna. Potrzebujemy spójnych danych i odpowiednich etykiet. Wykresy pudełkowe są często używane w badaniach danych, a nawet przez zespoły sprzedaży do grupowania i porównywania danych. Boxplot daje wgląd w potencjał danych i optymalizacje, które można wykonać w celu zwiększenia sprzedaży.

Boxplot to ciekawy sposób na przetestowanie danych, który daje wgląd w wpływ i potencjał danych.

Polecane artykuły

Jest to przewodnik po etykietach R Boxplot. Tutaj omawiamy funkcję Parameters under boxplot (), jak tworzyć losowe dane, zmieniać analizę kolorów i wykresów oraz zalety i wady. Możesz także spojrzeć na następujący artykuł, aby dowiedzieć się więcej -

  1. Rodzaje wizualizacji danych
  2. Implementacja hurtowni danych
  3. Techniki nauki danych
  4. Co to jest moduł danych?

Kategoria: