Panduan Awal Mengenai Berkas JSON dalam R
Hai sana, para ahli R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia berkas JSON dan bagaimana bekerja dengannya dalam R. Jangan khawatir jika Anda belum pernah memprogram sebelumnya - saya akan menjadi panduan ramah bagi Anda dalam petualangan ini, sama seperti yang saya lakukan bagi ribuan murid selama tahun-tahun mengajar saya. mari kita masuk ke dalam!
Apa Itu JSON?
Sebelum kita mulai, mari kita mengerti singkat apa itu JSON. JSON adalah singkatan dari JavaScript Object Notation. Itu adalah format data ringan yang mudah dibaca dan ditulis oleh manusia, dan mudah diparse dan dihasilkan oleh mesin. Bayangkan itu sebagai cara untuk menyimpan informasi dalam bentuk terstruktur dan terorganisir - seperti lemari berkas digital yang rapi!
Instal Paket rjson
Untuk bekerja dengan berkas JSON dalam R, kita butuh alat khusus. Dalam dunia R, kita menyebut alat ini "paket". Paket yang kita akan gunakan adalah "rjson". Mari instalnya!
install.packages("rjson")
library(rjson)
Ketika Anda menjalankan baris ini, R akan pergi ke internet, mengunduh paket rjson, dan mempersiapkannya untuk kita gunakan. Itu seperti pergi ke kotak alat digital dan mengambil alat yang sempurna untuk pekerjaan kita!
Data Masuk
Sekarang kita memiliki alat kita, mari kita lihat beberapa data. Bayangkan kita memiliki berkas JSON bernama "students.json" dengan informasi tentang beberapa murid. Itu mungkin terlihat seperti ini:
{
"students": [
{
"name": "Alice",
"age": 20,
"major": "Computer Science"
},
{
"name": "Bob",
"age": 22,
"major": "Mathematics"
},
{
"name": "Charlie",
"age": 21,
"major": "Physics"
}
]
}
Berkas JSON ini berisi array murid, di mana setiap murid memiliki nama, umur, dan jurusan. Itu seperti database kecil kelas kita!
Baca Berkas JSON
Sekarang, mari kita baca berkas JSON ini ke dalam R. Kita akan menggunakan fungsi fromJSON()
dari paket rjson:
json_data <- fromJSON(file = "students.json")
Baris ini mengatakan kepada R untuk membaca berkas "students.json" dan menyimpan kontennya dalam variabel json_data
. Itu seperti kita membuang isi berkas JSON kita ke dalam wadah di R.
Mari kita lihat apa yang kita miliki:
print(json_data)
Anda seharusnya melihat sesuatu seperti ini:
$students
$students[[1]]
$students[[1]]$name
[1] "Alice"
$students[[1]]$age
[1] 20
$students[[1]]$major
[1] "Computer Science"
$students[[2]]
$students[[2]]$name
[1] "Bob"
$students[[2]]$age
[1] 22
$students[[2]]$major
[1] "Mathematics"
$students[[3]]
$students[[3]]$name
[1] "Charlie"
$students[[3]]$age
[1] 21
$students[[3]]$major
[1] "Physics"
Selamat! Anda baru saja membaca berkas JSON pertama Anda ke dalam R!
Konversi JSON ke Data Frame
Meskipun data JSON sekarang ada di R, itu tidak dalam format yang paling nyaman untuk analisis. Dalam R, kita sering memilih untuk bekerja dengan sesuatu yang disebut "data frame". Itu seperti tabel atau spreadsheet. Mari kita konversi data JSON kita ke data frame:
students_df <- do.call(rbind, lapply(json_data$students, as.data.frame))
Wah! Itu agak panjang, kan? Mari kita rinci itu:
-
json_data$students
mengakses bagian "students" dari data JSON kita. -
lapply()
menerapkan fungsias.data.frame()
ke setiap murid dalam daftar. -
do.call(rbind, ...)
mengambil semua data frame individual ini dan menggabungkannya menjadi satu data frame besar.
Sekarang, mari kita lihat data frame baru kita:
print(students_df)
Anda seharusnya melihat sesuatu seperti ini:
name age major
1 Alice 20 Computer Science
2 Bob 22 Mathematics
3 Charlie 21 Physics
Jauh lebih baik! Sekarang kita memiliki tabel rapi data murid kita.
Bekerja dengan Data Frame
Sekarang kita memiliki data dalam data frame, kita dapat mudah melakukan berbagai operasi padanya. Berikut adalah beberapa contoh:
- Dapatkan rata-rata umur murid:
mean_age <- mean(students_df$age)
print(paste("Rata-rata umur murid adalah:", mean_age))
- Temukan semua murid yang mengambil jurusan tertentu:
cs_students <- students_df[students_df$major == "Computer Science", ]
print("Murid yang mengambil jurusan Computer Science:")
print(cs_students)
- Tambahkan kolom baru:
students_df$graduation_year <- 2023 + (22 - students_df$age)
print(students_df)
Kesimpulan
Dan begitu kita mencapai titik ini! Kita telah melakukan perjalanan dari menginstal paket, membaca berkas JSON, mengkonversi itu ke data frame, dan melakukan beberapa operasi dasar. Anda telah mengambil langkah pertama ke dunia manipulasi data dalam R!
Ingat, seperti semua keterampilan, bekerja dengan JSON dalam R menjadi mudah dengan latihan. Jangan khawatir untuk mencoba dan mencoba hal baru. Siapa tahu? Penemuan data besar berikutnya mungkin ada di jari Anda!
Berikut adalah tabel yang menggabungkan fungsi utama yang kita gunakan:
Fungsi | Paket | Deskripsi |
---|---|---|
install.packages() |
base R | Menginstal paket |
library() |
base R | Memuat paket |
fromJSON() |
rjson | Membaca berkas JSON |
do.call() |
base R | Membangun dan menjalankan panggilan fungsi |
rbind() |
base R | Menggabungkan objek R secara vertikal |
lapply() |
base R | Mengaplikasikan fungsi ke list atau vektor |
as.data.frame() |
base R | Mengubah ke data frame |
mean() |
base R | Menghitung rata-rata |
Hari baik coding, dan semoga data Anda selalu rapi!
Credits: Image by storyset