Przegląd ramki danych R.
Ramki danych to lista wektorów o równej długości. Różnica między matrycą a ramkami danych polega jednak na tym, że ramki danych akceptują różne typy danych. (Znak, cyfra itp.). W tym temacie poznamy ramkę danych R.
Zalety korzystania z ramek danych
- Rozproszony zbiór danych i zorganizowany.
- Ma lepsze optymalizacje w porównaniu do relacyjnej bazy danych.
- Przechowuje różnorodne dane, które są niejednorodne.
Tworzenie ramki danych w R.
Tworzymy ramkę danych. Poniżej znajduje się przykład deklaracji ramki danych.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
W powyższym przykładzie nie zdefiniowaliśmy zmiennych. Zobaczmy teraz, jak przypisujemy wartości do zmiennych i przechowujemy je w ramce danych.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Wynik:
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
Struktura ramki danych
Kiedy chcemy poznać strukturę konkretnej ramki danych. Możemy użyć poniższej funkcji.
Gwiazdka ()
str(Data_frame)
Wynik:
Liczba: num 2 3 4
alfa: współczynnik w / 3 poziomy „x”, „y”, „z”: 1 2 3
Logiczne: logi TRUE TRUE FALSE
Wydobywanie określonych danych z ramki danych
1. Używanie nazwy kolumny
Możemy wyodrębnić określony zestaw danych z ramki danych.
Z powyższego przykładu wyodrębnijmy tylko pierwszą kolumnę z ramki danych, która jest liczbą.
Data_ frame <- data. Frame(Number)
Wynik:
Numer
1 2
2 3
3 4
2. Używając rzędów
Możemy wyodrębnić dane z wierszy, tak jak w poniższym przykładzie.
Załóżmy, że chcemy wydrukować tylko dwa wiersze kolumny Liczba.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Wynik:
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
------------
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
Możemy zaobserwować różnicę w pierwszym i drugim wyjściu.
3. Drukowanie określonych wierszy i kolumn
Możemy również wydrukować określone wiersze i kolumny.
W poniższym przykładzie drukujemy pierwszy i drugi wiersz, kolumny
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Wynik:
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
-------------
Liczba alfa
1 2 x
2 3 lata
4. Dodanie kolejnej kolumny do ramki danych
Możemy dodać kolejną kolumnę wraz z wartościami do ramki danych.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Wynik:
Liczbowa klasa booleanów alfa
1 2 x PRAWDA A
2 3 lata PRAWDA B
3 4 z FALSE C
5. Dodanie wiersza do ramki danych
Używamy funkcji rbind, aby dodać nowy wiersz do istniejącej ramki danych.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Wynik:
Liczbowa klasa booleanów alfa
1 2 x PRAWDA A
2 3 lata PRAWDA B
3 4 z FALSE C
4 5 x FAŁSZ D
6. Łączenie obu ramek danych
Możemy również połączyć dwie ramki danych, aby uzyskać jedno wyjście.
Aby połączyć dwie ramki danych, musimy mieć tę samą kolumnę dla ramek danych.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Wynik:
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
-------------–
Liczba booleanów alfa
1 4 x PRAWDA
2 5 lat PRAWDA
3 6 z FALSE
-------------–
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
4 4 x PRAWDA
5 5 lat PRAWDA
6 6 z FALSE
Sprawdzanie ramek danych
Poniżej znajdują się różne sposoby sprawdzania ramki danych i dostarcza informacji o ramce danych, podobnie jak powyższa funkcja gwiazdy.
1. Nazwy - Podaje nazwy zmiennych w ramce danych
Składnia : names(data frame name)
Przykład
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
wyjście : (1) „Liczba” „alfa” „Liczba logiczna”
2. Podsumowanie - zapewnia statystyki ramki danych.
Składnia: summary(data frame name)
Przykład
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Wynik:
Liczba booleanów alfa
Min. : 2, 0 x: 1 Tryb: logiczny
1. kw .: 2, 5 roku: 1 FAŁSZ: 1
Mediana: 3, 0 z: 1 PRAWDA: 2
Oznacza: 3, 0 NA: 0
3 kw .: 3, 5
Max. : 4.0
3. Head- Dostarcza dane dla pierwszych kilku wierszy.
Składnia: Head( name of the data frame)
Przykład
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Wynik:
Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
4 5 a PRAWDA
5 6 b FAŁSZ
6 7 c FAŁSZ
4. Tail- Drukuje kilka ostatnich wierszy w ramce danych.
Składnia: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Wynik:
Liczba booleanów alfa
5 6 b FAŁSZ
6 7 c FAŁSZ
7 8 d FAŁSZ
8 9 f FAŁSZ
9 10 g FAŁSZ
10 11 j FALSE
Wniosek
Ramki danych są ważną koncepcją w programowaniu R. Jest to łatwe, ale potężne narzędzie do tworzenia zestawów danych, które można łatwo modyfikować i do których można uzyskać dostęp. Podobnie jak macierz, do zbiorów danych można uzyskać dostęp poprzez nazwy wierszy i kolumn, dzięki łatwemu dodawaniu i usuwaniu danych.
Polecane artykuły
Jest to przewodnik po ramce danych R. Tutaj omawiamy tworzenie ramki danych w R ze strukturą i wyodrębnianie określonych danych z ramki danych. Możesz także zapoznać się z następującymi artykułami, aby dowiedzieć się więcej -
- Typy danych w C
- Kariera w dziedzinie nauki danych
- Technologie Big Data
- Platforma nauki danych
- Java Booleans