Wprowadzenie do histogramu w R.

W tym artykule zaczniemy od podstawowego histogramu w implementacji R i dostosowaniach. Histogram odgrywa ważną rolę w analizach danych w celu ich wizualizacji. Programowanie R to specjalne środowisko dla obliczeń statystycznych i podstawy nauki o danych. W R programowanie zestawów danych i funkcji jest grupowane w postaci pakietów. Większość programów do analizy wizualnej korzysta z histogramów i domyślnie ustawia szerokość kosza. Pozwalają szybko uchwycić wgląd w dane, co jest podstawową rolą w nauce o danych. Tutaj zbudujemy histogram za pomocą poleceń R.

Co to jest histogram?

Histogram jest obrazową reprezentacją rozkładu zestawu danych, za pomocą którego moglibyśmy łatwo przeanalizować, który czynnik ma większą ilość danych i najmniej danych. Innymi słowy, histogram umożliwia wykonywanie skumulowanych wykresów częstotliwości na osi xi osi y. W rzeczywistości histogramy pobierają zarówno dane zgrupowane, jak i niepogrupowane. W przypadku zgrupowanego histogramu danych konstruuje się biorąc pod uwagę granice klas, natomiast w przypadku danych niepogrupowanych konieczne jest utworzenie zgrupowanego rozkładu częstotliwości. Pomagają skutecznie analizować zasięg i lokalizację danych. Podczas rozpowszechniania danych stosuje się pewną wspólną strukturę histogramów, taką jak normalna, wypaczona, klif.

W przeciwieństwie do słupka, histogram wykresu nie ma przerw między słupkami, a słupki tutaj są nazywane jako przedziały, z którymi dane są reprezentowane w równych odstępach. Histogram Pobiera zmienną ciągłą i dzieli na przedziały, należy wybrać prawidłową szerokość pojemnika. Główną różnicą między wykresem słupkowym a histogramem jest to, że pierwszy wykorzystuje do rysowania wykresy danych nominalnych, podczas gdy histogram wykreśla ciągłe zestawy danych. R używa funkcji hist () do tworzenia histogramów. Ta funkcja hist () używa wektora wartości do wykreślania histogramu. Histogram składa się z zakresu wartości ciągłych na osi x, oś Y przedstawia częste wartości danych na osi X z paskami zmian wysokości.

Składnia:

Składnia do tworzenia histogramu to

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Tworzenie histogramu w R.

Do celów analizy histogram celu wymaga wbudowanego zestawu danych do zaimportowania do R.R, a jego biblioteki mają wiele pakietów graficznych i funkcji. W tym przypadku wykorzystujemy zestaw danych szwajcarskich i pasażerów lotniczych. Aby obliczyć histogram dla danej wartości danych, używana jest funkcja hist () wraz ze znakiem $ w celu wybrania określonej kolumny danych z zestawu danych w celu utworzenia histogramu.

Poniższy przykład oblicza histogram wartości danych w kolumnie Badanie zestawu danych o nazwie Swiss.

Przykład 1: Stwórzmy prosty histogram

Kod:

hist (swiss $Examination)

Wynik:

Hist jest tworzony dla szwajcarskiego zestawu danych z badaniem kolumny. to po prostu kreśli przedział z częstotliwością i osią X.

Przykład 2: Histogram z większą liczbą argumentów

Aby lepiej zrozumieć histogramy, musimy dodać więcej argumentów do funkcji hist, aby zoptymalizować wizualizację wykresu. Zmiana etykiety xiy na zakres wartości argumenty xlim i ylim są dodawane do funkcji.

Przykład:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Wynik:

Powyższy kod przedstawia histogram wartości z zestawu danych Pasażerowie lotniczy, nadaje tytuł jako „Histogram dla większej ilości arg”, etykietę osi X jako „Lista nazw”, z zieloną ramką i żółtym kolorem do pasków, ograniczając wartość od 100 do 600, wartości drukowane na osi y przez 2 i ustawiając szerokość przedziału na 5.

Dodanie dwóch różnych kolorów do paska

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Wynik:

Dodanie kolejnych słupków do histogramu

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Wynik:

Przykład 3: Histogram w R Zwraca wartość

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Wynik:

Przykład 4: Używanie argumentu przerwania do zmiany szerokości pojemnika

Aby mieć więcej punktów przerwania między szerokościami, zaleca się użycie wartości w funkcji c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Wynik:

Powyższy wykres przyjmuje szerokość paska przez wartości sekwencji.

Przykład 5: Implementacja krzywej rozkładu normalnego w histogramie

Wykorzystamy zestaw danych „szwajcarski”, aby wartości danych narysować wykres. Tutaj krzywa funkcji () służy do wyświetlenia linii dystrybucji.

Kod:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Wynik:

Przykład 6: Rysowanie rozkładu prawdopodobieństwa

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Tworzenie wykresów gęstości w histogramie w R.

Rozkład zmiennej jest tworzony za pomocą funkcji gęstość (). Poniżej znajduje się przykład z zestawem danych mtcars. Wykresy gęstości pomagają w rozkładzie kształtu.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Wynik:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Poniższy histogram w R pokazuje wysokość jako badanie na osi x, a gęstość jest wykreślana na osi y.

Wynik:

Wniosek

Chodzi o histogram, a właśnie histogram jest najłatwiejszym sposobem na zrozumienie danych. Jak widzieliśmy z histogramem, mogliśmy rysować pojedyncze, wielokrotne wykresy, używając szerokości pojemnika, korekcji osi, zmieniając kolory itp. Histogram pomaga wizualizować różne kształty danych. Wreszcie widzieliśmy, jak histogram pozwala analizować zestawy danych, a punkty środkowe są używane jako etykiety klasy. Histogram pomaga zmieniać interwały w celu uzyskania lepszego opisu danych i działa, szczególnie w przypadku danych liczbowych. histogramy są bardziej preferowane w analizie ze względu na ich zaletę wyświetlania dużego zestawu danych. Na podstawie danych wyjściowych możemy wizualnie wypaczyć dane i łatwo przyjąć pewne założenia.

Polecane artykuły

To był przewodnik po histogramie w R. Omówiliśmy tutaj koncepcję, składnię i sposób tworzenia histogramu w R z przykładami. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Przykłady histogramów
  2. Kariera w programowaniu R.
  3. Wykres Gantta w Tableau
  4. Kariera w programowaniu komputerowym
  5. Jak utworzyć wykres liniowy w R?

Kategoria: