Panduan untuk Pemula: Berkas JSON di R
Halo sana, para ahli R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia berkas JSON dan bagaimana bekerja dengannya di R. Jangan khawatir jika Anda belum pernah memrogram sebelumnya – saya akan menjadi panduan ramah Anda dalam perjalanan ini, sama seperti yang saya lakukan untuk ribuan murid selama tahun-tahun mengajar saya. mari kita masuk ke dalamnya!
Apa Itu JSON?
Sebelum kita mulai, mari kita mengerti apa itu JSON. JSON adalah singkatan dari JavaScript Object Notation. Itu adalah format data ringan yang mudah dibaca dan ditulis oleh manusia, dan mudah diparse dan dihasilkan oleh mesin. Bayangkan itu sebagai cara untuk menyimpan informasi dalam cara yang terstruktur dan terorganisir – seperti lemari filing digital yang sangat rapi!
Instal Paket rjson
Untuk bekerja dengan berkas JSON di R, kita butuh alat khusus. Dalam dunia R, kita menyebut alat ini "paket". Paket yang kita akan gunakan adalah "rjson". Mari instalnya!
install.packages("rjson")
library(rjson)
Ketika Anda menjalankan baris ini, R akan pergi ke internet, mengunduh paket rjson, dan mempersiapkannya untuk kita gunakan. Itu seperti pergi ke kotak alat digital dan mengambil alat yang sempurna untuk pekerjaan kita!
Data Masuk
Sekarang kita memiliki alat kita, mari lihat beberapa data. Bayangkan kita memiliki berkas JSON bernama "students.json" dengan informasi tentang beberapa murid. Itu mungkin terlihat seperti ini:
{
"students": [
{
"name": "Alice",
"age": 20,
"major": "Computer Science"
},
{
"name": "Bob",
"age": 22,
"major": "Mathematics"
},
{
"name": "Charlie",
"age": 21,
"major": "Physics"
}
]
}
Berkas JSON ini berisi array murid, di mana setiap murid memiliki nama, umur, dan jurusan. Itu seperti mini-database kelas kita!
Baca Berkas JSON
Sekarang, mari kita baca berkas JSON ini ke R. Kita akan menggunakan fungsi fromJSON()
dari paket rjson:
json_data <- fromJSON(file = "students.json")
Baris ini mengatakan ke R untuk membaca berkas "students.json" dan menyimpan isiannya dalam variabel json_data
. Itu seperti kita membuang isi berkas JSON kita ke dalam wadah di R.
Mari kita lihat apa yang kita miliki:
print(json_data)
Anda seharusnya melihat sesuatu seperti ini:
$students
$students[[1]]
$students[[1]]$name
[1] "Alice"
$students[[1]]$age
[1] 20
$students[[1]]$major
[1] "Computer Science"
$students[[2]]
$students[[2]]$name
[1] "Bob"
$students[[2]]$age
[1] 22
$students[[2]]$major
[1] "Mathematics"
$students[[3]]
$students[[3]]$name
[1] "Charlie"
$students[[3]]$age
[1] 21
$students[[3]]$major
[1] "Physics"
Selamat! Anda baru saja membaca berkas JSON pertama Anda ke R!
Konversi JSON ke Data Frame
Meskipun data JSON sekarang ada di R, itu tidak dalam format yang paling nyaman untuk analisis. Dalam R, kita sering memilih untuk bekerja dengan sesuatu yang disebut "data frame". Itu seperti tabel atau spreadsheet. Mari kita konversi data JSON kita ke data frame:
students_df <- do.call(rbind, lapply(json_data$students, as.data.frame))
Wah! Itu agak panjang, kan? Mari kitauraikan ini:
-
json_data$students
mengakses bagian "students" dari data JSON kita. -
lapply()
menerapkan fungsias.data.frame()
ke setiap murid dalam daftar. -
do.call(rbind, ...)
mengambil semua data frame individual ini dan menggabungkannya menjadi satu data frame besar.
Sekarang, mari kita lihat data frame baru kita:
print(students_df)
Anda seharusnya melihat sesuatu seperti ini:
name age major
1 Alice 20 Computer Science
2 Bob 22 Mathematics
3 Charlie 21 Physics
Lebih baik! Sekarang kita memiliki tabel rapih dari data murid kita.
Bekerja dengan Data Frame
Sekarang kita memiliki data dalam data frame, kita dapat mudah melakukan berbagai operasi pada itu. Berikut adalah beberapa contoh:
- Dapatkan umur rata-rata murid:
mean_age <- mean(students_df$age)
print(paste("Rata-rata umur murid adalah:", mean_age))
- Temukan semua murid yang menjurus di bidang studi tertentu:
cs_students <- students_df[students_df$major == "Computer Science", ]
print("Murid yang menjurus di Computer Science:")
print(cs_students)
- Tambahkan kolom baru:
students_df$graduation_year <- 2023 + (22 - students_df$age)
print(students_df)
Kesimpulan
Dan itu dia! Kita telah berpergian dari menginstal paket, melalui membaca berkas JSON, sampai mengkonversi itu menjadi data frame dan melakukan beberapa operasi dasar. Anda telah mengambil langkah pertama ke dunia manipulasi data di R!
Ingat, seperti keterampilan lainnya, bekerja dengan JSON di R menjadi mudah dengan latihan. Jangan khawatir untuk mencoba dan mencoba hal baru. Siapa tahu? Penemuan data besar berikutnya mungkin berada di ujung jari Anda!
Berikut adalah tabel yang menggabungkan fungsi utama yang kita gunakan:
Fungsi | Paket | Deskripsi |
---|---|---|
install.packages() |
base R | Menginstal paket |
library() |
base R | Memuat paket |
fromJSON() |
rjson | Membaca berkas JSON |
do.call() |
base R | Membangun dan menjalankan panggilan fungsi |
rbind() |
base R | Menggabungkan objek R secara vertikal |
lapply() |
base R | Menggunakan fungsi ke list atau vektor |
as.data.frame() |
base R | Mengubah ke data frame |
mean() |
base R | Menghitung rerata aritmetik |
Happy coding, dan may your data always be tidy!
Credits: Image by storyset