Wprowadzenie do pakietów R.

Pakiet to zbiór funkcji i zestawów danych. Pakiety pomagają zwiększyć funkcjonalność w języku programowania. Jeśli chcemy przechowywać i przetwarzać bazy danych (tj. Funkcje podobne do SQL przy użyciu ramek danych), możemy użyć pakietu dplyr w R. Pakiety dostarczają również dokumentację, jak używać funkcji i zestawów danych w danym pakiecie.

Gdzie znajdujemy paczki?

Pakiety są dostępne w Internecie z różnych źródeł. Istnieją jednak pewne zaufane repozytoria, z których możemy pobrać pakiety.

Oto dwa ważne repozytoria dostępne online.

  • CRAN (Comprehensive R Archive Network): jest to oficjalna społeczność R z siecią FTP i serwerami WWW, która zawiera najnowszy kod i dokumentację R. Przed wysłaniem paczek online przechodzi serię testów zgodnych z zasadami CRAN .
  • GitHub: GitHub jest innym znanym repozytorium, ale nie jest specyficzne dla R. Społeczność internetowa może udostępniać swoje pakiety innym osobom i jest dobrze używana do kontroli wersji. GitHub jest oprogramowaniem typu open source i nie ma żadnego procesu recenzji.

Lista przydatnych pakietów R.

Istnieje kilka pakietów w R i można je pobrać z CRAN lub GitHub. Poniżej znajdują się pakiety, które można wykorzystać do określonych celów.

1. Ładowanie danych ze źródeł zewnętrznych

  • Przystań: R odczytuje i zapisuje dane z SAS.
  • DBI: Aby nawiązać komunikację między relacyjną bazą danych a R.
  • RSQlite: służy do odczytu danych z relacyjnych baz danych.

2. Manipulacja danymi

  • Dplyr: Służy do manipulacji danymi, takich jak podzbiory, zapewnia skróty do dostępu do danych i generuje zapytania SQL.
  • Tidyr - służy do konwersji danych do małych formatów.
  • stringr - manipuluj wyrażeniami i ciągami znaków.
  • lubridate- Do pracy z danymi i czasem.

3. Wizualizacja danych

  • Rgl: Praca z wizualizacjami 3D.
  • ggvis: Aby stworzyć i zbudować gramatykę grafiki.
  • googlevis: Aby korzystać z narzędzi do wizualizacji Google w R.

4. Pakiety internetowe

  1. XML: do odczytu i zapisu dokumentów XML w języku R.
  2. Httpr: Praca z połączeniami HTTP.
  3. Jsonlite: Aby odczytać tabele danych Json .

Uzyskiwanie pakietów R.

Możemy sprawdzić dostępne pakiety, które są obecne w R, używając poniższego kodu.

  • available.packages (): W sieci CRAN dostępnych jest około 5200 pakietów.

CRAN ma widoki zadań, które grupują pakiety według określonego tematu.

Instalowanie pakietów R.

Możemy instalować pakiety bezpośrednio za pomocą IDE lub poleceń. Aby zainstalować pakiety, korzystamy z poniższej funkcji i określamy nazwę pakietu.

Składnia:

install.packages()

Kod:

install.packages(“ggplot2”)

Powyższy kod instaluje pakiet ggplot2 i jego zależne pakiety, jeśli takie istnieją.

Możemy zainstalować kilka pakietów jednocześnie, podając nazwy pakietów pod wektorem znaków.

Składnia:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Kod:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Instalowanie przy użyciu R Studio

Zaletą korzystania ze studia R jest to, że to GUI (graficzny interfejs użytkownika). Możemy wybrać pakiety do zainstalowania i źródła.

Możemy przejść do narzędzi -> Zainstaluj pakiety.

Ładowanie paczek R.

Po zainstalowaniu pakietu R musimy załadować je do R, aby rozpocząć korzystanie z zainstalowanych pakietów.

Używamy poniższej funkcji do ładowania pakietów.

Składnia:

library(package name)

Uwaga: Nazwa pakietu nie musi być podawana w cudzysłowie.

Kod:

library(ggplot2)

Niektóre pakiety wyświetlają komunikaty po załadowaniu. Niektóre z nich nie. Możemy zobaczyć szczegóły biblioteki zainstalowanej za pomocą poniższego kodu.

Kod:

library(ggplot2)
search()

Wynik:

„Pakiet: krata” „pakiet: ggplot2” „pakiet: robi ślizgi”

„Pakiet: knitr” „pakiet: slidify” „narzędzia: rstudio”

Tworzenie własnego pakietu

Zanim stworzymy własny pakiet. Zanim przystąpimy do tworzenia pakietu, powinniśmy pamiętać o poniższej liście kontrolnej.

  • Porządkowanie kodu jest jedną z najważniejszych rzeczy podczas pisania kodu w pakiecie. Tracimy połowę czasu na szukanie lokalizacji kodu zamiast ulepszania kodu. Umieść wszystkie pliki w łatwo dostępnym folderze.
  • Dokumentowanie kodu pomaga zrozumieć cel kodu. Kiedy często nie odwiedzamy kodu, zapominamy, dlaczego napisaliśmy go w określony sposób. Może także pomóc ludziom lepiej zrozumieć Twój kod, gdy zostanie im udostępniony.
  • Udostępnianie skryptów przez e-mail stało się archaiczne. Najłatwiejszym sposobem jest przesłanie kodu i rozpowszechnienie go na GitHub. Możliwe, że otrzymasz informację zwrotną, która pomoże ci ulepszyć kod.

Aby stworzyć własny pakiet, musimy zainstalować pakiet devtools.

Kod:

install.packages("devtools")

Aby pomóc w dokumentacji, możemy skorzystać z poniższego pakietu.

Kod:

install.packages("roxygen2")

Po zainstalowaniu pakietu devtools. Możesz stworzyć swój własny pakiet.

Kod:

devtools::create ("packagename")

Zamiast „nazwa pakietu” możesz podać nazwę, którą chcesz. Możesz teraz dodać swoje funkcje w ramach tego pakietu.

Możesz utworzyć tę samą nazwę pliku, co nazwa funkcji.

Składnia:

Devtools:create(“firstpackage”)

Pakiet dystrybucyjny

Możesz dystrybuować swój pakiet na github, używając pakietu devtools.

Używamy poniższego kodu do dystrybucji naszego pakietu na github.

Kod:

devtools::install_github("yourusername/firstpackage")

Możesz podać swoją nazwę użytkownika github i nazwę pakietu, którą utworzyłeś powyżej.

Oto wymagane pliki pakietu

  • Funkcje
  • Dokumentacja
  • Dane

Gdy mamy już wszystkie powyższe pliki, możemy opublikować je w repozytorium.

Polecane artykuły

To jest przewodnik po pakietach R. Tutaj omawiamy listę przydatnych pakietów R, instalowanie pakietów za pomocą R studio i tworzenie własnego pakietu itp. Możesz również zapoznać się z następującymi artykułami, aby dowiedzieć się więcej -

  1. Co to jest język programowania R?
  2. Kariera w programowaniu R.
  3. Programowanie R a Python
  4. MySQL vs SQLite
  5. Lista pakietów R.

Kategoria: