Ramki danych w R - Jak wyodrębnić dane z ramek danych w R?

Spisie treści:

Anonim

Wprowadzenie do ramek danych w R

Ramka danych jest dwuwymiarową strukturą przypominającą tablicę, w której akceptowane są różne typy danych, takie jak znaki, cyfry itp. Ramka danych jest podzbiorem listy, która ma każdy komponent równej długości. Zasadniczo ramka danych jest tabelą, w której każda kolumna zawiera wartości jednej zmiennej, a każdy wiersz zawiera jeden zestaw wartości z każdej kolumny.

Istnieją pewne cechy ramki danych.

  • Nazwa kolumny jest wymagana
  • Nazwy wierszy powinny być unikalne
  • Liczba elementów w każdej kolumnie powinna być taka sama

Kroki tworzenia ramek danych w R.

Zacznijmy od stworzenia ramki danych, która jest wyjaśniona poniżej,

Krok 1: Utwórz ramkę danych klasy w szkole.

Kod:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Kiedy uruchomimy ten kod, otrzymamy ramkę danych taką jak ta.

Wynik:

W naszym przykładzie ramka danych jest bardzo mała, ale w prawdziwym życiu mamy do czynienia z dużą ilością danych. Aby zrozumieć strukturę danych, przekazujemy funkcję Str ().

Krok 2: Dodajemy poniższy wiersz w naszym kodzie.

Kod:

Str(tenthclass)

Kiedy uruchomimy cały kod, otrzymamy wynik.

Wynik:

Powyższy wynik oznacza, że ​​mamy 5 obserwacji 3 zmiennych. Następnie wyjaśnia typ danych każdej zmiennej. Podobnie jak w naszym przykładzie, numer rzutu jest liczbą całkowitą, nazwa to znak, a znaki są ponumerowane.

Kiedy zrozumiemy strukturę danych, przekażemy poniższy kod, aby lepiej zrozumieć dane.

Krok 3: Teraz użyjemy funkcji podsumowania ()

Kod:

summary(tenthclass)

Wynik:

Podsumowanie zapewnia lepsze zrozumienie naszych danych. Powie nam, że mamy na myśli, medianę, kwartyl, Max i Min. Te rzeczy pomogą nam podjąć lepszą decyzję.

Jak wyodrębnić dane z ramek danych w R?

Tutaj będziemy kontynuować powyższą sprawę. Załóżmy, że chcemy poznać nazwisko ucznia w dziesiątej klasie, po prostu imię. Jak więc wyodrębnimy?

Nasza ramka danych wygląda następująco.

roll_number Znaki nazwy

1 1 Jana 77

2 2 Sam 87

3 3 Casey 45

4 4 Ronald 68

5 5 Mateusz 95

Aby uzyskać nazwę jako wynik, przekażemy następujący kod.

Kod:

onlyname = tenthclass$Name
print(onlyname)

Wynik:

Jeśli złamiemy kod, po prostu wstawimy znak dolara między nazwą naszej ramki danych a nazwą zmiennej, którą chcemy jako wynik.

Rozważmy teraz sytuację, nauczyciel chce wiedzieć wszystko o rzucie nr 2, jak ma na imię i ile zdobył.

Tutaj potrzebujemy wszystkiego o rzucie nr 2, więc przekażemy poniższy kod.

Kod:

result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)

Wynik:

Rozwiń w ramkach danych

Ramkę danych można zwiększać i zmniejszać, dodając lub usuwając kolumny i wiersze.

1. Dodaj wiersz

Mamy dwie ramki danych. Jedna ramka danych należy do dziesiątej sekcji klasy A, a druga ramka danych należy do dziesiątej sekcji klasy B. Teraz te różne sekcje łączą się w jedną klasę.

Przykład 1: Klasa 10 A.

Kod:

tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)

Wynik:

Przykład 2: Klasa 10 B.

Kod:

tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)

Wynik:

Przykład 3: funkcja rbind ()

Teraz musimy połączyć obie klasy w jedną klasę. Użyjemy tutaj funkcji rbind (). Jedynym ograniczeniem w dodawaniu nowego wiersza jest to, że musimy wprowadzić nowe wiersze w tej samej strukturze co istniejąca ramka danych.

Kod:

new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)

Wynik:

2. Dodaj kolumnę

Rozważmy teraz przypadek, w którym musimy dodać szczegóły grupy krwi każdego ucznia w klasie 10. Dodamy do tego nową kolumnę i nadamy jej nazwę „Grupa Krwi”.

Nasza ramka danych wygląda następująco.

Kod:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Wynik:

Kod:

tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)

Wynik:

Usuń wiersz i kolumnę z ramki danych

Aby usunąć wiersz i kolumnę z ramki danych, używamy następującej implementacji kodu.

1. Usuń kolumnę

Kod:

print(tenthclass)

Wynik:

W tej ramce danych, jeśli musimy usunąć zmienną grupy krwi (kolumna z prawej strony), przekażemy poniższy kod.

Kod:

tenthclass$Blood_group = NULL
print(tenthclass)

Wynik:

Pomijając polecenie NULL, możemy bezpośrednio usunąć zmienną z naszej ramki danych.

2. Usuń wiersz

Kod:

print(tenthclass)

Wynik:

Rozważmy teraz sytuację, w której nie potrzebujemy znaków Jana, więc musimy usunąć najwyższy rząd.

Kod:

tenthclass = tenthclass(-1, ) print(tenthclass)

Wynik:

Zaktualizuj dane w ramce danych

Kod:

print(tenthclass)

Wynik:

Załóżmy, że Sam uzyskał 98 znaków, ale zgodnie z naszymi znakami ramki danych wynoszą 87. Możemy więc przekazać poniższy kod, aby go naprawić.

Kod:

tenthclass$Marks(2) = 98
print(tenthclass)

Wynik:

Wniosek

Ramki danych są bardzo popularną formą opisu problemu. Jest to lista zmiennej o tej samej liczbie wierszy z unikalnymi identyfikatorami wierszy. Ten artykuł pomaga nam dowiedzieć się, jak możemy dodać wiersz, dodać kolumnę, usunąć wiersz, usunąć kolumnę ramki danych, a także wyjaśnia, w jaki sposób możemy zaktualizować dane w ramce danych.

Polecane artykuły

To jest przewodnik po ramkach danych w R. Tutaj omawiamy różne etapy tworzenia ramek danych i jak wyodrębnić dane z ramek danych w R. Możesz również zapoznać się z następującymi artykułami, aby dowiedzieć się więcej-

  1. Top 5 typów danych w R
  2. Lista przydatnych pakietów R.
  3. R Pliki CSV
  4. Funkcje programu R - Znaczenie
  5. Współczynnik R z zaletami