Wprowadzenie do Scatterplot w R.

  • R jest otwartym językiem programowania używanym do statystyki danych i analizy danych. Wraz z rosnącą popularnością nauki o danych, R zyskał również popularność. Jest wykorzystywany głównie przez statystyków danych i eksploratorów danych do wydobywania cennych informacji z danych. R jest językiem interpretowanym i ma interfejs wiersza poleceń, ale dostępnych jest wiele graficznych interfejsów użytkownika ułatwiających pracę programistom. R oferuje szeroki wybór bibliotek do wdrażania statystyk i technik graficznych. R oferuje statyczną grafikę; pozwala użytkownikowi zbudować wykres warstwowy. W ten sposób tworzy wykresy jakości publikacji i zapewnia lepszą reprezentację informacji.
  • R oferuje ogromny zestaw bibliotek do implementacji graficznej, ale najbardziej popularny jest „ggplot2”. GGPlot2 to implementacja „Gramatyki grafiki”, która ułatwia tworzenie złożonych wykresów. Zapewnia programowy interfejs do określania zmiennych, ich położenia, koloru wykresu, rodzajów wykresu i innych właściwości wizualizacji. Pozwala budować wykresy krok po kroku, umożliwiając tworzenie warstw zapewniających dużą elastyczność i jakość publikacji.
  • Jednym z takich wykresów jest Scatterplot w R. Scatterplot w R, zwany również wykresem rozproszenia, który jest rodzajem wykresu pokazującego korelację między dwiema zmiennymi. Pokazuje punkty danych w postaci kropek. Można go rysować między ciągłą zmienną niezależną a inną zmienną zależną od poprzedniej zmiennej lub dwiema ciągłymi zmiennymi niezależnymi. Korelacja może być dodatnia, ujemna lub zerowa. Jeśli nachylenie wykresu jest od dolnego lewego do górnego prawego, korelacja jest dodatnia. Jeśli nachylenie jest od lewej górnej do prawej dolnej, korelacja jest ujemna lub innymi słowy wzrost wartości jednej zmiennej zmniejszy wartość innej zmiennej.

Składnia: Istnieje wiele pakietów w R dla grafów, dlatego istnieje wiele funkcji do tworzenia wykresu rozrzutu w R. Najbardziej podstawową i prostą funkcją jest

wykres (x, y)

gdzie

x oznacza oś poziomą lub niezależną zmienną ciągłą.

y oznacza oś pionową lub zmienną zależną.

Istnieje wiele innych parametrów do wykreślenia funkcji, aby wykres był łatwy do zrozumienia.

Poniżej niektóre z definicjami:

  • main: dodaje tytuł do wykresu
  • xlab: dodaj etykietę do osi x
  • ylab: dodaje etykietę do osi y
  • xlim: określa zakres osi x
  • ylim: określa zakres osi y
  • pch: wskazuje kształt punktów na wykresie punktowym
  • cex: wskazuje rozmiar punktów
  • col: określa kolor punktów

Scatterplot w R można również utworzyć za pomocą pakietu ggplot2. W tym celu musimy najpierw zainstalować i załadować pakiet ggplot2. Po dodaniu pakietu do bieżącej sesji poniżej można użyć polecenia, aby utworzyć Scatterplot w R.

ggplot (zestaw danych, aes (x, y, kolor, kształt)) + geom_poin () + labs (x, y, tytuł)

gdzie

  • zbiór danych jest zbiorem danych, dla którego należy utworzyć wykres rozproszenia.
  • aes () to mapowanie estetyczne na wykresie. Opisuje sposób mapowania zmiennych na wykresie.
  • x jest osią poziomą lub niezależną zmienną ciągłą.
  • y jest osią pionową lub zmienną zależną.
  • kolor polega na dodawaniu koloru do punktów na podstawie zmiennej grupującej.
  • kształt służy do ustawiania kształtu na podstawie zmiennej grupującej.
  • znak + wskazuje, że polecenie jest kontynuowane.
  • geom_point () jest funkcją wykresu punktowego.
  • labs (x, y, tytuł): dodaj etykietę x, etykietę y i tytuł do wykresu.

Utwórz Scatterplot In R

Aby utworzyć wykres rozproszenia w R, najpierw musimy załadować zestaw danych. Tutaj używamy zestawu danych (mtcars) dostarczonego przez R. Najpierw załaduj zestaw danych do bieżącej sesji, używając poniższej komendy

dane (tęczówka)

Po załadowaniu zestawu danych wyświetl dane, aby uzyskać podstawową wiedzę na temat typu danych i kolumn w nim za pomocą poniższego polecenia.

irys

Po zapoznaniu się z podstawowymi danymi, stwórzmy prosty wykres rozrzutu za pomocą funkcji wydruku

wykres (tęczówka $ Sepal.Length, tęczówka $ Sepal.Width, xlim = c (4, 0; 9, 0), ylim = c (2, 0; 5, 0))

Dodanie etykiet, aby wykres był czytelny

wykres (tęczówka $ Sepal.Length, tęczówka $ Sepal.Width, xlim = c (4, 0; 9, 0), ylim = c (2, 0; 4, 0), xlab = „długość odcinka”, ylab = „szerokość odcinka”, main = „szerokość a długość ”)

Dodając jeszcze jeden parametr, aby wykres był bardziej atrakcyjny

wykres (tęczówka $ Sepal.Length, tęczówka $ Sepal.Width, xlim = c (4, 0; 9, 0), ylim = c (2, 0; 4, 0), xlab = „długość odcinka”, ylab = „szerokość odcinka”, main = „szerokość vs długość ”, pch = 8, cex = 1, 5, col = 6)

Oprócz tych wykresów 2-D, wykresy macierzy i wykresy 3-D można również tworzyć w R.

Matryce wykresów rozrzutu

Gdy w zbiorze danych mamy więcej niż dwie zmienne i chcemy znaleźć korelację każdej zmiennej ze wszystkimi innymi zmiennymi, wówczas używana jest macierz wykresu rozrzutu. Najbardziej podstawowym i najprostszym poleceniem dla macierzy scatterplot jest:

pary (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = tęczówka, main = ”Scatterplot Matrix”)

Powyższy wykres pokazuje korelację między wagą, mpg, dsp i cyl.

Scatterplot 3D

Czasami trójwymiarowy wykres zapewnia lepsze zrozumienie danych. Dla tego R zapewnia wiele pakietów, jednym z nich jest „scatterplot3d”. Poniżej znajdują się polecenia instalacji „scatterplot3d” w obszarze roboczym R i załadowania go w bieżącej sesji

install.packages („scatterplot3d”)

biblioteka (scatterplot3d)

Po załadowaniu biblioteki wykonanie poniższych poleceń spowoduje utworzenie trójwymiarowego wykresu rozrzutu.

dołącz (tęczówka)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = „3D Scatterplot”)

Oprócz tego istnieje wiele innych sposobów tworzenia trójwymiarowości. Użytkownicy mogą również dodawać szczegóły, takie jak kolor, tytuły, aby ulepszyć wykres. Użytkownik może również tworzyć interaktywny wykres rozproszenia 3D za pomocą funkcji „plot3D (x, y, z)” dostarczanej przez pakiet „rgl”. Ta funkcja tworzy wirujący wykres rozproszenia 3D, który można obracać za pomocą myszy. W ten sposób daje pełny obraz korelacji między zmiennymi.

Wniosek

R jest jednym z najbardziej znanych języków do wdrażania technik graficznych stosowanych przez naukowców zajmujących się danymi. Zapewnia szeroką gamę pakietów i bibliotek do grafiki oraz lepsze zrozumienie danych. „Gglpot2”, „ggvis”, „rgl”, „plot3d”, „kratownica”, „animacja”, „gganimate”, „cairo” to niektóre z pakietów dostarczanych przez R.

Wykres rozproszenia jest najprostszym sposobem na lepsze zrozumienie danych. Korzystając z tej wizualizacji, użytkownik może dowiedzieć się, w jaki sposób zmienne są ze sobą powiązane, w jaki sposób zmiana wartości jednej zmiennej zmieni wartość innych zmiennych itp. Nachylenie wykresu mówi o dodatniej i ujemnej zależności między zmiennymi.

Polecane artykuły

To jest przewodnik po Scatterplot w R. Tutaj omawiamy wprowadzenie, macierze scatterplot, scatterplot 3D, jak stworzyć scatterplot? wraz z odpowiednimi przykładami. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Co to jest GraphQL
  2. Scrum Framework
  3. R Pytania do wywiadu
  4. Wprowadzenie do rozkładu dwumianowego w R.

Kategoria: