Wprowadzenie do ramek danych w R
Ramka danych jest dwuwymiarową strukturą przypominającą tablicę, w której akceptowane są różne typy danych, takie jak znaki, cyfry itp. Ramka danych jest podzbiorem listy, która ma każdy komponent równej długości. Zasadniczo ramka danych jest tabelą, w której każda kolumna zawiera wartości jednej zmiennej, a każdy wiersz zawiera jeden zestaw wartości z każdej kolumny.
Istnieją pewne cechy ramki danych.
- Nazwa kolumny jest wymagana
- Nazwy wierszy powinny być unikalne
- Liczba elementów w każdej kolumnie powinna być taka sama
Kroki tworzenia ramek danych w R.
Zacznijmy od stworzenia ramki danych, która jest wyjaśniona poniżej,
Krok 1: Utwórz ramkę danych klasy w szkole.
Kod:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Kiedy uruchomimy ten kod, otrzymamy ramkę danych taką jak ta.
Wynik:
W naszym przykładzie ramka danych jest bardzo mała, ale w prawdziwym życiu mamy do czynienia z dużą ilością danych. Aby zrozumieć strukturę danych, przekazujemy funkcję Str ().
Krok 2: Dodajemy poniższy wiersz w naszym kodzie.
Kod:
Str(tenthclass)
Kiedy uruchomimy cały kod, otrzymamy wynik.
Wynik:
Powyższy wynik oznacza, że mamy 5 obserwacji 3 zmiennych. Następnie wyjaśnia typ danych każdej zmiennej. Podobnie jak w naszym przykładzie, numer rzutu jest liczbą całkowitą, nazwa to znak, a znaki są ponumerowane.
Kiedy zrozumiemy strukturę danych, przekażemy poniższy kod, aby lepiej zrozumieć dane.
Krok 3: Teraz użyjemy funkcji podsumowania ()
Kod:
summary(tenthclass)
Wynik:
Podsumowanie zapewnia lepsze zrozumienie naszych danych. Powie nam, że mamy na myśli, medianę, kwartyl, Max i Min. Te rzeczy pomogą nam podjąć lepszą decyzję.
Jak wyodrębnić dane z ramek danych w R?
Tutaj będziemy kontynuować powyższą sprawę. Załóżmy, że chcemy poznać nazwisko ucznia w dziesiątej klasie, po prostu imię. Jak więc wyodrębnimy?
Nasza ramka danych wygląda następująco.
roll_number Znaki nazwy
1 1 Jana 77
2 2 Sam 87
3 3 Casey 45
4 4 Ronald 68
5 5 Mateusz 95
Aby uzyskać nazwę jako wynik, przekażemy następujący kod.
Kod:
onlyname = tenthclass$Name
print(onlyname)
Wynik:
Jeśli złamiemy kod, po prostu wstawimy znak dolara między nazwą naszej ramki danych a nazwą zmiennej, którą chcemy jako wynik.
Rozważmy teraz sytuację, nauczyciel chce wiedzieć wszystko o rzucie nr 2, jak ma na imię i ile zdobył.
Tutaj potrzebujemy wszystkiego o rzucie nr 2, więc przekażemy poniższy kod.
Kod:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
Wynik:
Rozwiń w ramkach danych
Ramkę danych można zwiększać i zmniejszać, dodając lub usuwając kolumny i wiersze.
1. Dodaj wiersz
Mamy dwie ramki danych. Jedna ramka danych należy do dziesiątej sekcji klasy A, a druga ramka danych należy do dziesiątej sekcji klasy B. Teraz te różne sekcje łączą się w jedną klasę.
Przykład 1: Klasa 10 A.
Kod:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
Wynik:
Przykład 2: Klasa 10 B.
Kod:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
Wynik:
Przykład 3: funkcja rbind ()
Teraz musimy połączyć obie klasy w jedną klasę. Użyjemy tutaj funkcji rbind (). Jedynym ograniczeniem w dodawaniu nowego wiersza jest to, że musimy wprowadzić nowe wiersze w tej samej strukturze co istniejąca ramka danych.
Kod:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
Wynik:
2. Dodaj kolumnę
Rozważmy teraz przypadek, w którym musimy dodać szczegóły grupy krwi każdego ucznia w klasie 10. Dodamy do tego nową kolumnę i nadamy jej nazwę „Grupa Krwi”.
Nasza ramka danych wygląda następująco.
Kod:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Wynik:
Kod:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
Wynik:
Usuń wiersz i kolumnę z ramki danych
Aby usunąć wiersz i kolumnę z ramki danych, używamy następującej implementacji kodu.
1. Usuń kolumnę
Kod:
print(tenthclass)
Wynik:
W tej ramce danych, jeśli musimy usunąć zmienną grupy krwi (kolumna z prawej strony), przekażemy poniższy kod.
Kod:
tenthclass$Blood_group = NULL
print(tenthclass)
Wynik:
Pomijając polecenie NULL, możemy bezpośrednio usunąć zmienną z naszej ramki danych.
2. Usuń wiersz
Kod:
print(tenthclass)
Wynik:
Rozważmy teraz sytuację, w której nie potrzebujemy znaków Jana, więc musimy usunąć najwyższy rząd.
Kod:
tenthclass = tenthclass(-1, ) print(tenthclass)
Wynik:
Zaktualizuj dane w ramce danych
Kod:
print(tenthclass)
Wynik:
Załóżmy, że Sam uzyskał 98 znaków, ale zgodnie z naszymi znakami ramki danych wynoszą 87. Możemy więc przekazać poniższy kod, aby go naprawić.
Kod:
tenthclass$Marks(2) = 98
print(tenthclass)
Wynik:
Wniosek
Ramki danych są bardzo popularną formą opisu problemu. Jest to lista zmiennej o tej samej liczbie wierszy z unikalnymi identyfikatorami wierszy. Ten artykuł pomaga nam dowiedzieć się, jak możemy dodać wiersz, dodać kolumnę, usunąć wiersz, usunąć kolumnę ramki danych, a także wyjaśnia, w jaki sposób możemy zaktualizować dane w ramce danych.
Polecane artykuły
To jest przewodnik po ramkach danych w R. Tutaj omawiamy różne etapy tworzenia ramek danych i jak wyodrębnić dane z ramek danych w R. Możesz również zapoznać się z następującymi artykułami, aby dowiedzieć się więcej-
- Top 5 typów danych w R
- Lista przydatnych pakietów R.
- R Pliki CSV
- Funkcje programu R - Znaczenie
- Współczynnik R z zaletami