R - Data Frames: Panduan untuk Pemula

Hai teman-teman, para pemrogram R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia Data Frames dalam R. Jangan khawatir jika Anda belum pernah memesan sebelumnya – saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini secara bertahap. Pada akhir panduan ini, Anda akan dapat mengoper data frames seperti seorang ahli!

R - Data Frames

Apa Itu Data Frames?

Sebelum kita masuk ke dalam, mari kita mengerti apa itu data frames. Bayangkan Anda memiliki spreadsheet dengan baris dan kolom – itu secara esensial adalah apa yang data frame dalam R. Itu adalah tabel dua dimensi di mana setiap kolom dapat berisi jenis data yang berbeda (seperti angka, teks, atau tanggal), dan setiap baris mewakili rekord individual.

Sekarang, mari kita roll up lengan dan mulai kerjakan beberapa kode R nyata!

Membuat Data Frame

Membuat data frame adalah seperti mengatur database pribadi Anda. Mari kita mulai dengan contoh sederhana:

# Membuat data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)

# Mari kita lihat seperti apa data frame kita
print(students)

Ketika Anda menjalankan kode ini, Anda akan melihat:

name age grade
1  Alice  22     A
2    Bob  25     B
3 Charlie 23    A-

Apa yang kita lakukan disini? Kita membuat data frame bernama students dengan tiga kolom: name, age, dan grade. Setiap kolom adalah vektor, dan semua vektor harus memiliki panjang yang sama (dalam kasus ini, 3).

Mendapatkan Struktur Data Frame

Sekarang kita memiliki data frame, mari kita eksplorasi strukturnya. Itu seperti melihat di bawah kap mesin mobil:

# Mendapatkan struktur data frame
str(students)

Ini akan mengeluarkan:

'data.frame':   3 obs. of  3 variables:
$ name : chr  "Alice" "Bob" "Charlie"
$ age  : num  22 25 23
$ grade: chr  "A" "B" "A-"

Ini memberitahu kita bahwa students adalah data frame dengan 3 observasi (baris) dan 3 variabel (kolom). Itu juga menunjukkan jenis data setiap kolom: chr untuk karakter (teks) dan num untuk numerik.

Ringkasan Data dalam Data Frame

Ingin memiliki gambaran cepat tentang data Anda? Fungsi summary() adalah teman terbaik Anda:

# Mendapatkan ringkasan data frame
summary(students)

Anda akan melihat sesuatu seperti:

name                age           grade
Length:3           Min.   :22.00   Length:3
Class :character   1st Qu.:22.50   Class :character
Mode  :character   Median :23.00   Mode  :character
Mean   :23.33
3rd Qu.:24.00
Max.   :25.00

Ini memberikan kepada kita ringkasan statistik dari data kita. Untuk kolom numerik seperti 'age', itu memberikan nilai minimum, maksimum, rata-rata, dan kuartil. Untuk kolom karakter, itu memberikan panjang dan jenis.

Mengambil Data dari Data Frame

Sekarang, mari kita belajar bagaimana mengambil data spesifik dari data frame kita. Itu seperti menjadi detektif data!

# Mendapatkan kolom spesifik
print(students$name)

# Mendapatkan baris spesifik
print(students[2,])

# Mendapatkan sel spesifik
print(students[1, "grade"])

# Mendapatkan beberapa kolom
print(students[, c("name", "age")])

Perintah ini akan mengeluarkan:

[1] "Alice"   "Bob"     "Charlie"

name age grade
2  Bob  25     B

[1] "A"

name age
1  Alice  22
2    Bob  25
3 Charlie 23

Operator $ memungkinkan Anda mengakses kolom dengan nama. Tanda kurung [] memungkinkan Anda menentukan baris dan kolom: [baris, kolom]. Jika Anda meninggalkan baris atau kolom kosong, itu memilih semua baris atau kolom.

Memperluas Data Frame

Bila data Anda tumbuh, Anda mungkin perlu menambahkan informasi lebih banyak ke data frame Anda. Mari kita lihat bagaimana:

# Menambahkan kolom baru
students$height <- c(165, 180, 175)

# Menambahkan baris baru
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)

# Mari kita lihat data frame yang diperbarui
print(students)

Ini akan memberikan kita:

name age grade height
1  Alice  22     A    165
2    Bob  25     B    180
3 Charlie 23    A-    175
4  David  24    B+    178

Kita menambahkan kolom baru 'height' menggunakan operator $, dan baris baru menggunakan fungsi rbind() (yang berarti "bind baris").

Metode Data Frame yang Berguna

Berikut adalah tabel metode yang berguna untuk bekerja dengan data frames:

Metode Deskripsi
head(df) Menampilkan 6 baris pertama dari data frame
tail(df) Menampilkan 6 baris terakhir dari data frame
nrow(df) Mendapatkan jumlah baris
ncol(df) Mendapatkan jumlah kolom
names(df) Mendapatkan nama kolom
colnames(df) Cara lain untuk mendapatkan atau mengatur nama kolom
rownames(df) Mendapatkan atau mengatur nama baris
dim(df) Mendapatkan dimensi (baris dan kolom)

Coba ini pada data frame students kita!

Dan itu saja, teman-teman! Anda telah mengambil langkah pertama ke dunia data frames dalam R. Ingat, latihan membuat sempurna, jadi jangan khawatir untuk mencoba perintah ini. Buat data frame Anda sendiri, cobalah operasi yang berbeda, dan lihat apa yang terjadi.

Sebelum Anda tahu, Anda akan dapat mengoper data seperti seorang ilmuwan data berpengalaman. Dan siapa tahu? Mungkin suatu hari Anda akan menggunakan keterampilan ini untuk menganalisis data dari koloni Mars atau kota bawah laut. Kemungkinan adalah tak terbatas!

Terus mengode, tetap curiga, dan terutama, bersenang-senang! Sampai jumpa lagi, selamat pemrograman R!

Credits: Image by storyset