Wprowadzenie do listy pakietów R.

Pakiet w języku programowania R to jednostka zapewniająca wymagane funkcje, które można wykorzystać, ładując go do środowiska R. Lista pakietów R jest podobna do biblioteki w C, C ++ lub Java. Zasadniczo pakiet może mieć wiele funkcji, takich jak funkcje, stałe itp., Które pozwolą użytkownikowi na ich wykorzystanie w kontekście konkretnego problemu. W R wymagany pakiet można załadować za pomocą funkcji bibliotecznej (). W przypadku, gdy pakiet nie jest obecny, można go zainstalować za pomocą funkcji install.packages (). Pakiety ułatwiają pozornie trudne zadania dzięki gotowym funkcjom.

Co to są pakiety R?

W R jest wiele pakietów, a wybór pakietu zależy od jego zastosowania. Chociaż istnieją pewne pakiety, które są szeroko stosowane ze względu na zapewniane przez nie funkcje, nie jest tak, że inne pakiety są mniej ważne. Różne paczki mają różne cele; niektóre są związane z technikami statystycznymi, niektóre dotyczą wizualizacji itp.

W poniższej sekcji przyjrzymy się niektórym ważnym pakietom w R:

1. Samochód

Ten pakiet jest towarzyszący regresji stosowanej. Jest to duży pakiet, który zapewnia różne funkcje analizy statystycznej. Importowanie tego pakietu do środowiska R importuje inne powiązane pakiety, takie jak MASS, statystyki, grafika itp. Niektóre funkcje pakietu obejmują Anova, avPlots, Boxplot, carPalette, wykresy gęstości, infIndexPlot, hipoteza liniowa, logit, test wartości odstających, qqPlot, wykresy rezydualne, wykres rozrzutu, macierz rozrzutu itp. Rozległe możliwości pakietu można zmierzyć na podstawie liczby funkcji, które zapewnia.

2. Corrplot

Pakiet zapewnia graficzne przedstawienie macierzy korelacji i przedziału ufności. Pakiet zawiera również algorytmy do zmiany kolejności macierzy. Liczne opcje obejmują wybór wymaganych kolorów, etykiet tekstowych, etykiet kolorów, układu itp. Różne metody wizualizacji lub metody parametrów w pakiecie corrplot to „koło”, „kwadrat”, „elipsa”, „liczba”, „cień”, „kolor” i „ciasto”. Funkcja corrplot zawierająca różne opcje daje atrakcyjną wizualnie reprezentację korelacji między różnymi zmiennymi, które w przeciwnym razie w normalnych okolicznościach, takich jak liczby, są trudne do interpretacji. Korelacje dodatnie są wyświetlane na niebiesko, a ujemne na czerwono. Intensywność koloru i rozmiar koła są proporcjonalne do współczynników korelacji.

3. DataExplorer

Ten pakiet dotyczy zautomatyzowanej eksploracji i przetwarzania danych. Zapewnia zautomatyzowany proces eksploracji danych przeznaczony do zadań analitycznych i modelowania predykcyjnego. Ma to kluczowe znaczenie, ponieważ umożliwia użytkownikowi zrozumienie danych i uzyskanie wglądu. Każda zmienna w analizie jest skanowana i analizowana przez pakiet. Ponadto pakiet zapewnia funkcje wizualizacji tych zmiennych przy użyciu typowych technik graficznych. Zapewnia również popularne metody przetwarzania danych do przetwarzania i formatowania danych.

4. Gmodels

Pakiet gmodels udostępnia różne narzędzia w R do drukowania danych. Zawiera różne funkcje, takie jak glh.test, który służy do testowania, drukowania lub podsumowywania ogólnej hipotezy liniowej dla modelu regresji. Funkcja sprawia. kontrasty konwertują kontrasty czytelne dla człowieka do postaci wymaganej przez R do obliczeń. Macierz zwrócona przez make.contrasts może być używana jako argument do argumentu kontrastów funkcji modelu. Funkcja coefFrame dopasowuje model do każdej podgrupy zdefiniowanej przez , a następnie zwraca ramkę danych z jednym wierszem dla każdego dopasowania i jedną kolumną dla każdego parametru. Oszacowana funkcja oblicza i testuje kontrasty oraz inne możliwe do oszacowania funkcje liniowe współczynników modelu dla lm, glm itp. Funkcja fit.contrast oblicza i testuje dowolne kontrasty dla obiektów regresji.

5. Gplots

Ten pakiet zapewnia funkcje wizualizacji za pomocą różnorodnych narzędzi programistycznych. Funkcje pakietu działają na koncepcji obliczeń i kreślenia. Możliwości graficzne pakietu demonstrują różne funkcje, takie jak wykres pasmowy, boxplot2, col2hex, ci2d, hist2d, wykres tekstowy, wykres tonięcia, pilot balonu, wykres CI, środki wykresu itp. Funkcje te umożliwiają pracę z ustawieniami związanymi z kolorem, tekst i inne skomplikowane graficzne aspekty wizualizacji. Zajmują się także złożonymi elementami związanymi z wizualizacją opartą na danych statystycznych, np. Lmplot2, funkcje residplot, które umożliwiają użytkownikowi przeprowadzenie szczegółowej diagnostyki regresji za pomocą wykresów diagnostycznych. Jeśli w tym samym obszarze trzeba wykreślić wiele danych, ale z osobnymi osiami, jest to możliwe przy użyciu funkcji over plot w pakiecie.

6. Ggplot2

Jest to jeden z bardzo znanych pakietów w języku R, który zapewnia szerokie możliwości wizualne i prezentuje wyniki nawet złożonych technik statystycznych i matematycznych. Liczne funkcje zapewniane przez pakiet umożliwiają analitykowi uzyskiwanie wglądu w dane w najbardziej interaktywny sposób. Opis R funkcji jest „systemem deklaratywnego tworzenia grafiki opartym na gramatyce grafiki”. Ta gramatyka grafiki oznacza, że ​​użytkownik musi powiedzieć „ggplot2” o tym, w jaki sposób zmienne muszą być mapowane na estetykę, więc zasadniczo oznacza to, że określając, jakie aspekty graficzne należy zastosować, a ggplot2 będzie działał odpowiednio w oparciu o szczegóły.

7. Smarować

Ten pakiet R ułatwia pracę z datami i godzinami. Pakiet lubridate umożliwia łatwą manipulację danymi daty i godziny. Analizuje liczbę i zapewnia odpowiednie uporządkowanie danych, w rzeczywistości funkcje analizy w pakiecie obsługują wiele różnych formatów i separatorów, które upraszczają proces analizy. Jedną z godnych uwagi cech jest to, że pakiet zapewnia funkcje do obsługi dat w różnych strefach czasowych.

8. Hmisc

Nazwany Harrell Różne, pakiet Hmisc zawiera wiele funkcji, które można wykorzystać do analizy danych, grafiki na wysokim poziomie i operacji narzędziowych. Obejmuje również funkcje obliczania wielkości i mocy próbki, importowania i opisywania zestawów danych, przypisywania brakujących wartości, zapewniania zaawansowanych funkcji tabel, grupowania zmiennych, manipulacji ciągiem znaków, konwersji obiektów R na kod HTML itp.

9. Krata

Pakiet oferuje system wizualizacji danych wysokiego poziomu zainspirowany grafiką Trellis. Podkreśla dane wielowymiarowe. Potężne możliwości wizualizacji pakietu zapewniają niezbędne rozwiązanie graficzne. Niektóre z ważniejszych funkcji w pakiecie to B_07_cloud, która pomaga w tworzeniu wykresu rozproszenia 3d i wykresu powierzchni szkieletowej; D_level. kolory, funkcja do obliczania fałszywych kolorów reprezentujących zmienną liczbową lub kategoryczną; B_06_levelplot, funkcja generująca wykresy poziomów i wykresy konturowe; A_01_Lattice, funkcja zapewniająca możliwości graficzne kratownicy. B_09_tmd to funkcja, która generuje Tukey Mean - Difference Plot; B_11_oneway, funkcja pasująca do modelu jednokierunkowego. Pakiet zapewnia zatem szerokie funkcje wizualizacji za pomocą różnych funkcji.

10. MatrixModels

Ten pakiet umożliwia modelowanie przy użyciu rzadkich i gęstych matryc „Matrix”. Aby to osiągnąć, wykorzystuje modułowe przewidywanie i odpowiedź, klasy modułów. Wszystkie funkcje dostarczone przez pakiet są równie ważne, niektóre z nich to lm.fit.sparse, która jest funkcją instalatora dla rzadkich modeli liniowych, rozwiązujeCoef, który rozwiązuje dla współczynników i przyrostu współczynnika, model. Macierz, która konstruuje prawdopodobnie rzadkie macierze projektowe lub modelowe, glm4, która pasuje do uogólnionych modeli liniowych.

11. Multcomp

Pakiet pozwala na wielokrotne porównania k grup w uogólnionych modelach liniowych. Lista dziewięciu standardowych procedur mianowicie. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott i Tetrade są udostępniane użytkownikowi, a użytkownik wybiera porównania na podstawie wymagań. Oprócz tego zapewniony jest również bezpłatny interfejs wejściowy dla matrycy kontrastu, który pozwala na specjalne porównania. Godną uwagi cechą jest to, że same porównania nie są ograniczone do żadnego konkretnego projektu, takiego jak zrównoważony lub prosty, a raczej programy są zaprojektowane w taki sposób, aby pasowały do ​​wielu porównań w ogólnym modelu liniowym, który pozwala na współzmienne, skorelowane średnie, brakujące wartości itd.

12. OpenMx

Ten pakiet zasadniczo dotyczy rozszerzonego modelowania równań strukturalnych. Zapewnia funkcje tworzenia modeli równań strukturalnych. Modelami tymi można manipulować za pomocą programowania. Modele można określić za pomocą macierzy lub ścieżek, takich jak LISREL lub RAM. Niektóre typy modeli obejmują wiele grup, współczynnik potwierdzający, rozkład mieszaniny, próg jakościowy, różnicowe funkcje dopasowania itp.

13. Plyr

Jest to bardzo ważny pakiet, który zapewnia funkcje do manipulacji danymi. Zapewnia narzędzia do dzielenia, stosowania i łączenia danych. Jest wyposażony w zestaw narzędzi, które pomagają rozwiązać wspólny zestaw problemów. Np. Czasami może być konieczne podzielenie dużego zadania na mniejsze zadania, które są wykonalne, następnie operujemy każdym z elementów, a następnie łączymy je z powrotem.

14. Qcc

Pakiet zyskuje na znaczeniu dzięki różnym funkcjom analizy jakości, które zapewnia. Zapewnia wykresy kontroli jakości Shewhart dla danych ciągłych, atrybutów i zliczeń. Do innych ważnych wykresów należą wykresy Cusum i EWMA oraz krzywe charakterystyki pracy. Oferuje również funkcję analizy zdolności procesu. Wykres Pareto i wykres przyczynowo-skutkowy oraz wielowymiarowe wykresy kontrolne są przydatnymi narzędziami dostarczanymi przez pakiet.

15. RandomForest

Jak sama nazwa wskazuje, ten pakiet służy do budowania algorytmu losowego lasu. Pakiet implementuje algorytm losowego lasu Breimana, który jest oparty na oryginalnym kodzie FORTRAN autorstwa Beimana i Cutlera. Algorytm służy do klasyfikacji i regresji. Pakiet może być również używany w trybie nienadzorowanym do oceny bliskości między punktami danych.

16. Psych

Jest to pakiet przeznaczony do specjalnego celu. Pakiet zawiera procedurę badań psychologicznych, psychometrycznych i osobowości. Funkcje służą przede wszystkim do analizy wielowymiarowej przy użyciu różnych technik statystycznych wielowymiarowych.

Podsumowanie listy pakietów R.

W R jest wiele pakietów, a zastosowanie pakietu zależy od wymagań. Społeczność Lista pakietów R rozwija się bardzo szybko i każdego dnia dodawany jest pakiet. Wiele pakietów może zapewniać podobne funkcje, ale wybór pakietu musi opierać się na jego dokładnych badaniach.

Polecane artykuły

Jest to przewodnik po liście pakietów R. Tutaj omawiamy wprowadzenie do pakietów R i kilka ważnych pakietów R. Możesz również przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Pakiety Java
  2. Co to jest JNDI w Javie?
  3. JColorChooser
  4. Programowanie R a Python

Kategoria: