Panduan untuk Pemula: Berkas JSON di R

Halo sana, para ahli R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia berkas JSON dan bagaimana bekerja dengannya di R. Jangan khawatir jika Anda belum pernah memrogram sebelumnya – saya akan menjadi panduan ramah Anda dalam perjalanan ini, sama seperti yang saya lakukan untuk ribuan murid selama tahun-tahun mengajar saya. mari kita masuk ke dalamnya!

R - JSON Files

Apa Itu JSON?

Sebelum kita mulai, mari kita mengerti apa itu JSON. JSON adalah singkatan dari JavaScript Object Notation. Itu adalah format data ringan yang mudah dibaca dan ditulis oleh manusia, dan mudah diparse dan dihasilkan oleh mesin. Bayangkan itu sebagai cara untuk menyimpan informasi dalam cara yang terstruktur dan terorganisir – seperti lemari filing digital yang sangat rapi!

Instal Paket rjson

Untuk bekerja dengan berkas JSON di R, kita butuh alat khusus. Dalam dunia R, kita menyebut alat ini "paket". Paket yang kita akan gunakan adalah "rjson". Mari instalnya!

install.packages("rjson")
library(rjson)

Ketika Anda menjalankan baris ini, R akan pergi ke internet, mengunduh paket rjson, dan mempersiapkannya untuk kita gunakan. Itu seperti pergi ke kotak alat digital dan mengambil alat yang sempurna untuk pekerjaan kita!

Data Masuk

Sekarang kita memiliki alat kita, mari lihat beberapa data. Bayangkan kita memiliki berkas JSON bernama "students.json" dengan informasi tentang beberapa murid. Itu mungkin terlihat seperti ini:

{
"students": [
{
"name": "Alice",
"age": 20,
"major": "Computer Science"
},
{
"name": "Bob",
"age": 22,
"major": "Mathematics"
},
{
"name": "Charlie",
"age": 21,
"major": "Physics"
}
]
}

Berkas JSON ini berisi array murid, di mana setiap murid memiliki nama, umur, dan jurusan. Itu seperti mini-database kelas kita!

Baca Berkas JSON

Sekarang, mari kita baca berkas JSON ini ke R. Kita akan menggunakan fungsi fromJSON() dari paket rjson:

json_data <- fromJSON(file = "students.json")

Baris ini mengatakan ke R untuk membaca berkas "students.json" dan menyimpan isiannya dalam variabel json_data. Itu seperti kita membuang isi berkas JSON kita ke dalam wadah di R.

Mari kita lihat apa yang kita miliki:

print(json_data)

Anda seharusnya melihat sesuatu seperti ini:

$students
$students[[1]]
$students[[1]]$name
[1] "Alice"

$students[[1]]$age
[1] 20

$students[[1]]$major
[1] "Computer Science"

$students[[2]]
$students[[2]]$name
[1] "Bob"

$students[[2]]$age
[1] 22

$students[[2]]$major
[1] "Mathematics"

$students[[3]]
$students[[3]]$name
[1] "Charlie"

$students[[3]]$age
[1] 21

$students[[3]]$major
[1] "Physics"

Selamat! Anda baru saja membaca berkas JSON pertama Anda ke R!

Konversi JSON ke Data Frame

Meskipun data JSON sekarang ada di R, itu tidak dalam format yang paling nyaman untuk analisis. Dalam R, kita sering memilih untuk bekerja dengan sesuatu yang disebut "data frame". Itu seperti tabel atau spreadsheet. Mari kita konversi data JSON kita ke data frame:

students_df <- do.call(rbind, lapply(json_data$students, as.data.frame))

Wah! Itu agak panjang, kan? Mari kitauraikan ini:

  1. json_data$students mengakses bagian "students" dari data JSON kita.
  2. lapply() menerapkan fungsi as.data.frame() ke setiap murid dalam daftar.
  3. do.call(rbind, ...) mengambil semua data frame individual ini dan menggabungkannya menjadi satu data frame besar.

Sekarang, mari kita lihat data frame baru kita:

print(students_df)

Anda seharusnya melihat sesuatu seperti ini:

name age           major
1   Alice  20 Computer Science
2     Bob  22     Mathematics
3 Charlie  21         Physics

Lebih baik! Sekarang kita memiliki tabel rapih dari data murid kita.

Bekerja dengan Data Frame

Sekarang kita memiliki data dalam data frame, kita dapat mudah melakukan berbagai operasi pada itu. Berikut adalah beberapa contoh:

  1. Dapatkan umur rata-rata murid:
mean_age <- mean(students_df$age)
print(paste("Rata-rata umur murid adalah:", mean_age))
  1. Temukan semua murid yang menjurus di bidang studi tertentu:
cs_students <- students_df[students_df$major == "Computer Science", ]
print("Murid yang menjurus di Computer Science:")
print(cs_students)
  1. Tambahkan kolom baru:
students_df$graduation_year <- 2023 + (22 - students_df$age)
print(students_df)

Kesimpulan

Dan itu dia! Kita telah berpergian dari menginstal paket, melalui membaca berkas JSON, sampai mengkonversi itu menjadi data frame dan melakukan beberapa operasi dasar. Anda telah mengambil langkah pertama ke dunia manipulasi data di R!

Ingat, seperti keterampilan lainnya, bekerja dengan JSON di R menjadi mudah dengan latihan. Jangan khawatir untuk mencoba dan mencoba hal baru. Siapa tahu? Penemuan data besar berikutnya mungkin berada di ujung jari Anda!

Berikut adalah tabel yang menggabungkan fungsi utama yang kita gunakan:

Fungsi Paket Deskripsi
install.packages() base R Menginstal paket
library() base R Memuat paket
fromJSON() rjson Membaca berkas JSON
do.call() base R Membangun dan menjalankan panggilan fungsi
rbind() base R Menggabungkan objek R secara vertikal
lapply() base R Menggunakan fungsi ke list atau vektor
as.data.frame() base R Mengubah ke data frame
mean() base R Menghitung rerata aritmetik

Happy coding, dan may your data always be tidy!

Credits: Image by storyset