Panduan Pemula untuk Data Frames di R

Hai sana, para programer R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia Data Frames di R. Jangan khawatir jika Anda belum pernah programming sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan bergerak langkah demi langkah. Pada akhir panduan ini, Anda akan dapat memanipulasi data frames seperti seorang profesional!

R - Data Frames

Apa Itu Data Frames?

Sebelum kita mendalam, mari pahami apa itu data frames. Bayangkan Anda memiliki spreadsheet dengan baris dan kolom - itu sebenarnya apa yang data frame di R. Itu adalah tabel dua dimensi di mana setiap kolom dapat mengandung jenis data yang berbeda (seperti angka, teks, atau tanggal), dan setiap baris mewakili rekord individual.

Sekarang, mari kita roll up lengan dan mulai dengan beberapa kode R nyata!

Membuat Data Frame

Membuat data frame mirip dengan membuat basis data pribadi Anda. Mari kita mulai dengan contoh sederhana:

# Membuat data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)

# mari kita lihat seperti apa data frame kita
print(students)

Ketika Anda menjalankan kode ini, Anda akan melihat:

name age grade
1  Alice  22     A
2    Bob  25     B
3 Charlie 23    A-

Apa yang kita lakukan disini? Kita membuat data frame bernama students dengan tiga kolom: name, age, dan grade. Setiap kolom adalah vektor, dan semua vektor harus memiliki panjang yang sama (dalam hal ini, 3).

Mendapatkan Struktur Data Frame

Sekarang kita memiliki data frame, mari kita memeriksa strukturnya. Itu seperti melihat di bawah kap mesin mobil:

# Mendapatkan struktur data frame
str(students)

Ini akan mengeluarkan:

'data.frame':   3 obs. of  3 variables:
$ name : chr  "Alice" "Bob" "Charlie"
$ age  : num  22 25 23
$ grade: chr  "A" "B" "A-"

Ini memberitahu kita bahwa students adalah data frame dengan 3 observasi (baris) dan 3 variabel (kolom). Itu juga menunjukkan jenis data setiap kolom: chr untuk karakter (teks) dan num untuk numerik.

Ringkasan Data di Data Frame

Ingin memiliki gambaran cepat tentang data Anda? Fungsi summary() adalah teman terbaik Anda:

# Mendapatkan ringkasan data frame
summary(students)

Anda akan melihat sesuatu seperti:

name                age           grade
Length:3           Min.   :22.00   Length:3
Class :character   1st Qu.:22.50   Class :character
Mode  :character   Median :23.00   Mode  :character
Mean   :23.33
3rd Qu.:24.00
Max.   :25.00

Ini memberikan kita ringkasan statistik dari data kita. Untuk kolom numerik seperti 'age', itu menyediakan nilai minimum, maksimum, rata-rata, dan kuartil. Untuk kolom karakter, itu memberitahu kita panjang dan jenis.

Mengambil Data dari Data Frame

Sekarang, mari kita belajar bagaimana mengambil data spesifik dari data frame kita. Itu seperti menjadi detektif data!

# Mengambil kolom spesifik
print(students$name)

# Mengambil baris spesifik
print(students[2,])

# Mengambil sel spesifik
print(students[1, "grade"])

# Mengambil beberapa kolom
print(students[, c("name", "age")])

Perintah ini akan mengeluarkan:

[1] "Alice"   "Bob"     "Charlie"

name age grade
2  Bob  25     B

[1] "A"

name age
1  Alice  22
2    Bob  25
3 Charlie 23

Operator $ memungkinkan Anda mengakses kolom dengan nama. Tanda kurung kotak [] memungkinkan Anda menentukan baris dan kolom: [baris, kolom]. Jika Anda meninggalkan baris atau kolom kosong, itu memilih semua baris atau kolom.

Mengembangkan Data Frame

Bila data Anda tumbuh, Anda mungkin perlu menambahkan informasi lebih banyak ke data frame Anda. Mari kita lihat bagaimana:

# Menambahkan kolom baru
students$height <- c(165, 180, 175)

# Menambahkan baris baru
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)

# mari kita lihat data frame yang diperbarui
print(students)

Ini akan memberikan kita:

name age grade height
1  Alice  22     A    165
2    Bob  25     B    180
3 Charlie 23    A-    175
4  David  24    B+    178

Kami menambahkan kolom baru 'height' menggunakan operator $, dan baris baru menggunakan fungsi rbind() (yang berarti "bind baris").

Metode Data Frame Berguna

Berikut adalah tabel metode yang berguna untuk bekerja dengan data frames:

Metode Deskripsi
head(df) Menampilkan 6 baris pertama dari data frame
tail(df) Menampilkan 6 baris terakhir dari data frame
nrow(df) Mendapatkan jumlah baris
ncol(df) Mendapatkan jumlah kolom
names(df) Mendapatkan nama kolom
colnames(df) Cara lain untuk mendapatkan atau mengatur nama kolom
rownames(df) Mendapatkan atau mengatur nama baris
dim(df) Mendapatkan dimensi (baris dan kolom)

Coba ini pada data frame students kita!

Dan begitu saja, teman-teman! Anda baru saja mengambil langkah pertama ke dunia data frames di R. Ingat, latihan membuat perfect, jadi jangan takut untuk mencoba perintah ini. Buat data frame Anda sendiri, cobalah operasi yang berbeda, dan lihat apa yang terjadi.

Sebelum Anda tahu, Anda akan dapat memanipulasi data seperti seorang ilmuwan data yang berpengalaman. Dan siapa tahu? Mungkin suatu hari Anda akan menggunakan keterampilan ini untuk menganalisis data dari koloni Mars atau kota bawah laut. Kemungkinan adalah tak terbatas!

Terus coding, tetap curiga, dan terutama, bersenang-senang! Sampai jumpa lagi, selamat programming R!

Credits: Image by storyset