Przegląd ramki danych R.

Ramki danych to lista wektorów o równej długości. Różnica między matrycą a ramkami danych polega jednak na tym, że ramki danych akceptują różne typy danych. (Znak, cyfra itp.). W tym temacie poznamy ramkę danych R.

Zalety korzystania z ramek danych

  • Rozproszony zbiór danych i zorganizowany.
  • Ma lepsze optymalizacje w porównaniu do relacyjnej bazy danych.
  • Przechowuje różnorodne dane, które są niejednorodne.

Tworzenie ramki danych w R.

Tworzymy ramkę danych. Poniżej znajduje się przykład deklaracji ramki danych.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

W powyższym przykładzie nie zdefiniowaliśmy zmiennych. Zobaczmy teraz, jak przypisujemy wartości do zmiennych i przechowujemy je w ramce danych.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Wynik:

Liczba booleanów alfa

1 2 x PRAWDA

2 3 lata PRAWDA

3 4 z FALSE

Struktura ramki danych

Kiedy chcemy poznać strukturę konkretnej ramki danych. Możemy użyć poniższej funkcji.

Gwiazdka ()

str(Data_frame)

Wynik:

Liczba: num 2 3 4

alfa: współczynnik w / 3 poziomy „x”, „y”, „z”: 1 2 3

Logiczne: logi TRUE TRUE FALSE

Wydobywanie określonych danych z ramki danych

1. Używanie nazwy kolumny

Możemy wyodrębnić określony zestaw danych z ramki danych.

Z powyższego przykładu wyodrębnijmy tylko pierwszą kolumnę z ramki danych, która jest liczbą.

Data_ frame <- data. Frame(Number)

Wynik:

Numer

1 2

2 3

3 4

2. Używając rzędów

Możemy wyodrębnić dane z wierszy, tak jak w poniższym przykładzie.

Załóżmy, że chcemy wydrukować tylko dwa wiersze kolumny Liczba.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Wynik:

Liczba booleanów alfa

1 2 x PRAWDA

2 3 lata PRAWDA

3 4 z FALSE

------------

Liczba booleanów alfa

1 2 x PRAWDA

2 3 lata PRAWDA

Możemy zaobserwować różnicę w pierwszym i drugim wyjściu.

3. Drukowanie określonych wierszy i kolumn

Możemy również wydrukować określone wiersze i kolumny.

W poniższym przykładzie drukujemy pierwszy i drugi wiersz, kolumny

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Wynik:

Liczba booleanów alfa

1 2 x PRAWDA

2 3 lata PRAWDA

3 4 z FALSE

-------------

Liczba alfa

1 2 x

2 3 lata

4. Dodanie kolejnej kolumny do ramki danych

Możemy dodać kolejną kolumnę wraz z wartościami do ramki danych.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Wynik:

Liczbowa klasa booleanów alfa

1 2 x PRAWDA A

2 3 lata PRAWDA B

3 4 z FALSE C

5. Dodanie wiersza do ramki danych

Używamy funkcji rbind, aby dodać nowy wiersz do istniejącej ramki danych.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Wynik:

Liczbowa klasa booleanów alfa

1 2 x PRAWDA A

2 3 lata PRAWDA B

3 4 z FALSE C

4 5 x FAŁSZ D

6. Łączenie obu ramek danych

Możemy również połączyć dwie ramki danych, aby uzyskać jedno wyjście.

Aby połączyć dwie ramki danych, musimy mieć tę samą kolumnę dla ramek danych.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Wynik:

Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
-------------–
Liczba booleanów alfa
1 4 x PRAWDA
2 5 lat PRAWDA
3 6 z FALSE

-------------–

Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
4 4 x PRAWDA
5 5 lat PRAWDA
6 6 z FALSE

Sprawdzanie ramek danych

Poniżej znajdują się różne sposoby sprawdzania ramki danych i dostarcza informacji o ramce danych, podobnie jak powyższa funkcja gwiazdy.

1. Nazwy - Podaje nazwy zmiennych w ramce danych

Składnia : names(data frame name)

Przykład

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

wyjście : (1) „Liczba” „alfa” „Liczba logiczna”

2. Podsumowanie - zapewnia statystyki ramki danych.

Składnia: summary(data frame name)

Przykład

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Wynik:

Liczba booleanów alfa
Min. : 2, 0 x: 1 Tryb: logiczny
1. kw .: 2, 5 roku: 1 FAŁSZ: 1
Mediana: 3, 0 z: 1 PRAWDA: 2
Oznacza: 3, 0 NA: 0
3 kw .: 3, 5
Max. : 4.0

3. Head- Dostarcza dane dla pierwszych kilku wierszy.

Składnia: Head( name of the data frame)

Przykład

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Wynik:

Liczba booleanów alfa
1 2 x PRAWDA
2 3 lata PRAWDA
3 4 z FALSE
4 5 a PRAWDA
5 6 b FAŁSZ
6 7 c FAŁSZ

4. Tail- Drukuje kilka ostatnich wierszy w ramce danych.

Składnia: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Wynik:

Liczba booleanów alfa
5 6 b FAŁSZ
6 7 c FAŁSZ
7 8 d FAŁSZ
8 9 f FAŁSZ
9 10 g FAŁSZ
10 11 j FALSE

Wniosek

Ramki danych są ważną koncepcją w programowaniu R. Jest to łatwe, ale potężne narzędzie do tworzenia zestawów danych, które można łatwo modyfikować i do których można uzyskać dostęp. Podobnie jak macierz, do zbiorów danych można uzyskać dostęp poprzez nazwy wierszy i kolumn, dzięki łatwemu dodawaniu i usuwaniu danych.

Polecane artykuły

Jest to przewodnik po ramce danych R. Tutaj omawiamy tworzenie ramki danych w R ze strukturą i wyodrębnianie określonych danych z ramki danych. Możesz także zapoznać się z następującymi artykułami, aby dowiedzieć się więcej -

  1. Typy danych w C
  2. Kariera w dziedzinie nauki danych
  3. Technologie Big Data
  4. Platforma nauki danych
  5. Java Booleans

Kategoria: