Panduan Pemula untuk Data Frames di R
Hai sana, para programer R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia Data Frames di R. Jangan khawatir jika Anda belum pernah programming sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan bergerak langkah demi langkah. Pada akhir panduan ini, Anda akan dapat memanipulasi data frames seperti seorang profesional!
Apa Itu Data Frames?
Sebelum kita mendalam, mari pahami apa itu data frames. Bayangkan Anda memiliki spreadsheet dengan baris dan kolom - itu sebenarnya apa yang data frame di R. Itu adalah tabel dua dimensi di mana setiap kolom dapat mengandung jenis data yang berbeda (seperti angka, teks, atau tanggal), dan setiap baris mewakili rekord individual.
Sekarang, mari kita roll up lengan dan mulai dengan beberapa kode R nyata!
Membuat Data Frame
Membuat data frame mirip dengan membuat basis data pribadi Anda. Mari kita mulai dengan contoh sederhana:
# Membuat data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)
# mari kita lihat seperti apa data frame kita
print(students)
Ketika Anda menjalankan kode ini, Anda akan melihat:
name age grade
1 Alice 22 A
2 Bob 25 B
3 Charlie 23 A-
Apa yang kita lakukan disini? Kita membuat data frame bernama students
dengan tiga kolom: name, age, dan grade. Setiap kolom adalah vektor, dan semua vektor harus memiliki panjang yang sama (dalam hal ini, 3).
Mendapatkan Struktur Data Frame
Sekarang kita memiliki data frame, mari kita memeriksa strukturnya. Itu seperti melihat di bawah kap mesin mobil:
# Mendapatkan struktur data frame
str(students)
Ini akan mengeluarkan:
'data.frame': 3 obs. of 3 variables:
$ name : chr "Alice" "Bob" "Charlie"
$ age : num 22 25 23
$ grade: chr "A" "B" "A-"
Ini memberitahu kita bahwa students
adalah data frame dengan 3 observasi (baris) dan 3 variabel (kolom). Itu juga menunjukkan jenis data setiap kolom: chr
untuk karakter (teks) dan num
untuk numerik.
Ringkasan Data di Data Frame
Ingin memiliki gambaran cepat tentang data Anda? Fungsi summary()
adalah teman terbaik Anda:
# Mendapatkan ringkasan data frame
summary(students)
Anda akan melihat sesuatu seperti:
name age grade
Length:3 Min. :22.00 Length:3
Class :character 1st Qu.:22.50 Class :character
Mode :character Median :23.00 Mode :character
Mean :23.33
3rd Qu.:24.00
Max. :25.00
Ini memberikan kita ringkasan statistik dari data kita. Untuk kolom numerik seperti 'age', itu menyediakan nilai minimum, maksimum, rata-rata, dan kuartil. Untuk kolom karakter, itu memberitahu kita panjang dan jenis.
Mengambil Data dari Data Frame
Sekarang, mari kita belajar bagaimana mengambil data spesifik dari data frame kita. Itu seperti menjadi detektif data!
# Mengambil kolom spesifik
print(students$name)
# Mengambil baris spesifik
print(students[2,])
# Mengambil sel spesifik
print(students[1, "grade"])
# Mengambil beberapa kolom
print(students[, c("name", "age")])
Perintah ini akan mengeluarkan:
[1] "Alice" "Bob" "Charlie"
name age grade
2 Bob 25 B
[1] "A"
name age
1 Alice 22
2 Bob 25
3 Charlie 23
Operator $
memungkinkan Anda mengakses kolom dengan nama. Tanda kurung kotak []
memungkinkan Anda menentukan baris dan kolom: [baris, kolom]
. Jika Anda meninggalkan baris atau kolom kosong, itu memilih semua baris atau kolom.
Mengembangkan Data Frame
Bila data Anda tumbuh, Anda mungkin perlu menambahkan informasi lebih banyak ke data frame Anda. Mari kita lihat bagaimana:
# Menambahkan kolom baru
students$height <- c(165, 180, 175)
# Menambahkan baris baru
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)
# mari kita lihat data frame yang diperbarui
print(students)
Ini akan memberikan kita:
name age grade height
1 Alice 22 A 165
2 Bob 25 B 180
3 Charlie 23 A- 175
4 David 24 B+ 178
Kami menambahkan kolom baru 'height' menggunakan operator $
, dan baris baru menggunakan fungsi rbind()
(yang berarti "bind baris").
Metode Data Frame Berguna
Berikut adalah tabel metode yang berguna untuk bekerja dengan data frames:
Metode | Deskripsi |
---|---|
head(df) |
Menampilkan 6 baris pertama dari data frame |
tail(df) |
Menampilkan 6 baris terakhir dari data frame |
nrow(df) |
Mendapatkan jumlah baris |
ncol(df) |
Mendapatkan jumlah kolom |
names(df) |
Mendapatkan nama kolom |
colnames(df) |
Cara lain untuk mendapatkan atau mengatur nama kolom |
rownames(df) |
Mendapatkan atau mengatur nama baris |
dim(df) |
Mendapatkan dimensi (baris dan kolom) |
Coba ini pada data frame students
kita!
Dan begitu saja, teman-teman! Anda baru saja mengambil langkah pertama ke dunia data frames di R. Ingat, latihan membuat perfect, jadi jangan takut untuk mencoba perintah ini. Buat data frame Anda sendiri, cobalah operasi yang berbeda, dan lihat apa yang terjadi.
Sebelum Anda tahu, Anda akan dapat memanipulasi data seperti seorang ilmuwan data yang berpengalaman. Dan siapa tahu? Mungkin suatu hari Anda akan menggunakan keterampilan ini untuk menganalisis data dari koloni Mars atau kota bawah laut. Kemungkinan adalah tak terbatas!
Terus coding, tetap curiga, dan terutama, bersenang-senang! Sampai jumpa lagi, selamat programming R!
Credits: Image by storyset