Wprowadzenie do języka programowania R.

W dzisiejszym świecie ważne jest, aby firma zrozumiała dużą ilość danych. Korzystanie z arkuszy kalkulacyjnych nie jest obecnie najlepszą opcją dla firm. tutaj omówimy więcej na temat języka programowania R.

R jest językiem programowania typu open source, a także środowiskiem oprogramowania służącym do analizy statystycznej, reprezentacji graficznej i raportowania. Został stworzony przez Rossa Ihakę i Roberta Gentlemana. Jest uważany za dialekt języka S. Jest szeroko stosowany przez naukowców na całym świecie. Ułatwia to skuteczniejszą i wydajniejszą analizę danych.

Język programowania R jest swobodnie rozpowszechniany na podstawie Powszechnej Licencji Publicznej GNU. Działa w kilku systemach operacyjnych, takich jak Unix, Linux, Windows i Mac. Pliki potrzebne do zainstalowania R ze wstępnie skompilowanych wersji binarnych są dystrybuowane ze strony internetowej Comprehensive R Archive Network (CRAN).

Język programowania R ma wiele funkcji do analizy statystycznej i reprezentacji graficznych.

Korzyści z używania języka programowania R

  • R jest bezpłatny i stanowi pierwszą dużą zaletę.
  • Możesz zainstalować R na dowolnej liczbie komputerów
  • R jest łatwy do współpracy i nauki
  • Każdy może napisać pakiet dodatkowy dla R.
  • Zapewnia najbardziej zaawansowaną analizę
  • R ma zdolność do powtarzalnych badań. W wyniku tego projektu można łatwo powtórzyć, gdy dostępne są nowe dane

Jak zainstalować język programowania R

Wykonaj te proste kroki, aby zainstalować R na swoim komputerze.

  1. Pobierz R z sieci i otwórz plik R w folderze pobrań.

  1. Kliknij dwukrotnie plik, aby go otworzyć. Spowoduje to przejście do okna ostrzeżenia bezpieczeństwa.

  1. Kliknij Uruchom. Spowoduje to ponowne przejście do okna z pytaniem, czy chcesz zezwolić następującemu programowi od nieznanego wydawcy na wprowadzenie zmian w oknie tego komputera. Kliknij Tak.
  2. Następne okno pozwoli ci wybrać język. Wybierz język i kliknij OK.
  3. Otworzy się okno Kreatora instalacji.

  1. Kliknij Następny. Następnie otrzymasz GNU General Public Licence. Przeczytaj i kliknij Dalej.

  1. W następnym oknie wybierz lokalizację docelową. Domyślna lokalizacja to Program Files. Wybierz i kliknij Dalej.

  1. Następne okno pozwoli ci wybrać komponenty do zainstalowania. Zawsze zaznacz pole wyboru Podstawowe pliki i wybierz pomiędzy plikami 32-bitowymi lub 64-bitowymi zgodnie z systemem. Kliknij Następny

  1. W następnym oknie pojawi się pytanie, czy chcesz dostosować opcje uruchamiania. Wybierz Nie i kliknij Dalej.

  1. Następne okno pomoże ci wybrać folder menu Start.

  1. Kliknij Następny. Następne okno pozwala wybrać Dodatkowe zadania i umożliwia utworzenie ikony pulpitu lub ikony szybkiego uruchamiania. Zaznacz oba pola wyboru Zarejestruj wpisy. Wybierz Dalej.

  1. R zostanie zainstalowany. Wybierz przycisk Zakończ, aby zakończyć instalację.

Począwszy od R.

Po pomyślnym zainstalowaniu R możesz otworzyć R za pomocą

Menu Start à Wszystkie programy à R

lub

Możesz także kliknąć dwukrotnie ikonę skrótu R na pulpicie

Konsola R wyskoczy, jak pokazano na poniższym obrazku. RGui jest krótką formą graficznego interfejsu użytkownika R. Jest to najprostszy sposób interakcji z językiem R. Możesz skonfigurować niektóre aspekty RGui. Okno dialogowe edytora konfiguracji RGui pokazano na poniższym obrazku

Konsola R to miejsce, w którym można wprowadzać polecenia. Czasami będziesz musiał napisać polecenie w skrypcie, a następnie uruchomić polecenia. Skrypt to osobne okno, w którym możesz wpisywać swoje polecenia. Poniższe zdjęcie pokazuje, jak otworzyć skrypt

Aby uruchomić polecenia w skrypcie, możesz skopiować polecenia i wkleić je w oknie poleceń lub wybrać polecenia, które chcesz uruchomić, i kliknąć przycisk Uruchom linię lub przycisk Wybór.

Podczas wpisywania poleceń w konsoli można również używać wcześniej używanych poleceń za pomocą strzałki w górę lub strzałki w dół.

Jak działa R.

Poniższy obrazek wyjaśni ci obieg pracy R

Ilekroć R uruchamia zmienne, funkcje i inne są przechowywane w pamięci komputera w postaci obiektów o nazwie. Użytkownik może wykonywać różne operacje na tych obiektach za pomocą operatorów i funkcji. Funkcję R można przedstawić w sposób pokazany na poniższym obrazku

Argumentami mogą być obiekty zdefiniowane domyślnie lub określone przez użytkownika. Funkcje są wykonywane za pomocą poleceń wprowadzonych przez użytkownika. Wyniki są następnie wyświetlane na ekranie i zapisywane jako obiekt w pamięci komputera.

Podstawy języka programowania R.

oto podstawy języka programowania R, które musisz znać, aby pracować z R.

  • Polecenia, obiekty i funkcje

Kiedykolwiek chcesz wchodzić w interakcje z R, możesz wpisać polecenie w oknie dialogowym konsoli i nacisnąć enter. Jeśli wprowadzisz nieprawidłowe polecenie, pojawi się komunikat o błędzie. Możesz łatwo wykonać proste obliczenia za pomocą R. Możesz używać wszystkich operatorów arytmetycznych w taki sam sposób, jak w innej aplikacji komputerowej, bez konieczności wpisywania znaku równości. Po prostu naciśnij Enter, a otrzymasz wynik.

Przykład

7 + 3

(1) 10

3 3

(1) 27

10 * (10 + 2)

(1) 120

(2 * (17, 2 + 5)) / 56

(1) 0, 7929

W powyższych przykładach możesz znaleźć (1) przed wszystkimi odpowiedziami. Oznaczało to, że w odpowiedzi jest tylko jedna liczba. Jeśli w odpowiedzi jest więcej niż jeden numer, pomoże ci to znaleźć odpowiedź w grupach. A jeśli dodany zostanie nawias, obliczenia są wykonywane najpierw. Jeśli dodano więcej niż jeden nawias, możesz pogrupować je za pomocą Ad Infinitum.

  • Obiekty

Jeśli chcesz wykonać dalsze obliczenia przy użyciu wyniku obliczenia, musisz nadać mu nazwę i nakazać R zapisanie go jako obiektu. Przykład podano poniżej

odpowiedź <- 4 + 4

W tym przykładzie <- nazywa się symbolem przydziału lub przypisanym symbolem. Ten symbol prosi R, aby obiekt po lewej stronie znalazł się w danych wyjściowych polecenia po prawej stronie. Możesz również zapisać wyniki obliczeń wykonanych z obiektami jako inny obiekt. Możesz usunąć obiekt za pomocą funkcji rm () i potwierdzić go za pomocą funkcji ls ().

  • Funkcje

R ma dużą różnorodność kodu, który pomoże ci wykonać obliczenia matematyczne, narysować wykres i przeprowadzić analizę statystyczną. Te kody nazywane są funkcjami. Każda nazwa funkcji kończy się nawiasami klamrowymi. Możesz również od razu wpisać nazwę funkcji i nazwę obiektu, aby wykonać potrzebną operację.

Przykłady

sqrt (100)

(1) 10

Możesz także dodać nazwę obiektu, aby wykonać obliczenia

grzech (ponad 15 odpowiedzi)

Wartość obiektu „odpowiedź” jest tutaj brana do obliczeń

Wektory, macierze i ramki danych

R jest najlepszym rozwiązaniem do obsługi obiektów, które są grupą liczb lub grupami znaków. Grupy liczb zorganizowane jako sekwencje nazywane są wektorami. Grupy zorganizowane jako dwuwymiarowe tabele nazywane są Matrycami. Tabele zawierające liczbę w niektórych kolumnach i niektóre inne dane w innych kolumnach nazywane są ramkami danych.

  • Wektory

Spójrzmy na przykład, aby zrozumieć, co to jest wektor i jak jest on używany w R.

Przykład

A <- seq (10, 20)

W tym przykładzie utworzyłeś nowy obiekt o nazwie A i zawiera on sekwencję liczb od 10 do 20. Możesz to sprawdzić, po prostu wpisując A i uzyskując wynik. Wyjaśniono to poniżej

ZA

(1) 10 11 12 13 14 15 16 17 18 19 20

Jedną z najważniejszych funkcji w Vector jest c (). Oznacza „konkatenat”. Przykład podano poniżej

B <- c (2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22)

B (naciśnij Enter)

(1) 2 4 6 8 10 12 14 16 18 20 22

Możesz także wykonywać operacje arytmetyczne na wektorze.

A + B

(1) 12 15 18 21 24 27 30 33 36 39 42

  • Matryce

Jeśli masz dane, które można ułożyć w dwóch wymiarach, nazywa się to Matrix. Matryca jest oznaczona przez funkcję macierzy ().

Przykład

mat2 <- macierz (dane = sekw. (1, 12), nrows = 3, ncols = 4, dimnames = lista (c („Wiersz 1”, „Wiersz 2”, „Wiersz 3”), c („Kolumna 1”, „Col 2”, „Col 3”, „Col 4”)

Powyższy przykład wyjaśniono szczegółowo poniżej

mat2 <- ustawia obiekt o nazwie mat2

macierz (data = seq (1, 12) tutaj obiekt jest macierzą, a dane w macierzy to ciąg liczb od 1 do 12

nrows = 3, ncols = 4 oznacza, że ​​liczba wierszy wynosi 3, a liczba kolumn wynosi 4

dimnames = lista (c („Wiersz 1”, „Wiersz 2”, „Wiersz 3”), c („Kol. 1”, „Kol. 2”, „Kol. 3”, „Kol. 4”) podaje nazwy wierszy i kolumny.

Dane wyjściowe są następujące

mat1Kol.1Col2Kol. 3Col4
Rząd 114710
Rząd 22)5811
Rząd 33)6912

Typy danych i ramki danych

Dane są zawsze rejestrowane jako liczby lub dane ilościowe. Obiekty numeryczne można dalej podzielić na liczby rzeczywiste, liczby zespolone lub liczby całkowite i tak dalej. Jeśli chcesz dowiedzieć się, czy wektor, którego używasz, ma postać liczbową, możesz użyć trybu funkcji () i znać typ liczbowy, możesz użyć klasy funkcji ().

Istnieje szczególny typ danych w R, który nazywa się czynnikiem. Ten typ danych służy do dzielenia rzeczy na klasy.

  • Indeksy dolne

Możesz znaleźć indywidualny numer lub grupy w strukturze danych za pomocą indeksów dolnych. Będzie to bardzo przydatne.

Przykład

X <- rnorm (10, 2, 0, 1)

W tym przykładzie powstaje wektor o nazwie X, który składa się z 10 liczb losowych pochodzących z rozkładu normalnego ze średnią wartością wynoszącą 2 i odchyleniem standardowym 0, 1.

Indeksy dolne niekoniecznie muszą być pojedynczymi liczbami. Może to być obiekt, a nawet funkcja. Wyrażenia logiczne mogą być również zawarte w indeksie dolnym.

  • Podzbiory

Podzbiór to funkcja służąca do uzyskiwania części macierzy lub ramki danych. Ma trzy główne sekcje - po pierwsze nazwę podzbioru, po drugie wyrażenie logiczne, trzecia, która informuje R o tym, które kolumny wybrać.

Przykład

Liczy <- read.csv („Counts.csv”, nagłówek = T)

Z poniższej tabeli możesz utworzyć podzbiór

SeksTempWagaWaga
M.Gorąco75292
faGorąco65180
M.Zimno69, 03161
faZimno73, 25323

Liczy 2 = 70)

To da ci wydajność, której waga jest mniejsza niż 70.

Pakiety języka programowania R.

Instalacja R zawiera wszystkie podstawowe zestawy pakietów. Istnieje wiele innych pakietów, które pomogą Ci załadować nowe funkcje i obiekty. Możesz również utworzyć nowy pakiet w R. Niektóre podstawowe pakiety zawarte w R podczas instalacji są wymienione poniżej

  • krata
  • MASA
  • nlme
  • grupa
  • przetrwanie

Możesz użyć zainstalowanego. Funkcja pakietów (), aby dowiedzieć się więcej o zainstalowanych pakietach.

Metody statystyczne

R ma wbudowane różne metody statystyczne. Oni są

  • Oznaczać
  • Mediana
  • Tryb
  • Dystrybucje
  • Kowariancja
  • Regresja
  • Nieliniowe efekty mieszane
  • GLM
  • GAM i wiele metod

R ma również różne procedury statystyczne, takie jak następujące

  • Klasyczne testy parametryczne
  • Testy nieparametryczne
  • Modelowanie liniowe
  • Modelowanie regresji nieliniowej
  • Grupowanie
  • Wygładzanie

Wniosek

Najważniejsze jest to, że język programowania R pomaga naukowcom, a także przedsiębiorcom, w przeprowadzeniu skutecznej analizy danych. Pakiety R ułatwiają firmom przeprowadzenie analizy. Nie wymagają od programistów ani obszernego programowania do korzystania z R. Język programowania R pomaga tworzyć grafiki w bardziej atrakcyjny sposób.

Polecane artykuły

Oto Twój przewodnik dotyczący zrozumienia instalacji, rozpoczęcia pracy, korzyści, podstawowych poleceń i funkcji języka programowania R.

  1. Czy Python jest językiem skryptowym?
  2. Jak zainstalować Angular 2?
  3. Jak zainstalować Swift?
  4. Czy język programowania MySQL?