Panduan Awal Mengenai Berkas JSON dalam R

Hai sana, para ahli R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia berkas JSON dan bagaimana bekerja dengannya dalam R. Jangan khawatir jika Anda belum pernah memprogram sebelumnya - saya akan menjadi panduan ramah bagi Anda dalam petualangan ini, sama seperti yang saya lakukan bagi ribuan murid selama tahun-tahun mengajar saya. mari kita masuk ke dalam!

R - JSON Files

Apa Itu JSON?

Sebelum kita mulai, mari kita mengerti singkat apa itu JSON. JSON adalah singkatan dari JavaScript Object Notation. Itu adalah format data ringan yang mudah dibaca dan ditulis oleh manusia, dan mudah diparse dan dihasilkan oleh mesin. Bayangkan itu sebagai cara untuk menyimpan informasi dalam bentuk terstruktur dan terorganisir - seperti lemari berkas digital yang rapi!

Instal Paket rjson

Untuk bekerja dengan berkas JSON dalam R, kita butuh alat khusus. Dalam dunia R, kita menyebut alat ini "paket". Paket yang kita akan gunakan adalah "rjson". Mari instalnya!

install.packages("rjson")
library(rjson)

Ketika Anda menjalankan baris ini, R akan pergi ke internet, mengunduh paket rjson, dan mempersiapkannya untuk kita gunakan. Itu seperti pergi ke kotak alat digital dan mengambil alat yang sempurna untuk pekerjaan kita!

Data Masuk

Sekarang kita memiliki alat kita, mari kita lihat beberapa data. Bayangkan kita memiliki berkas JSON bernama "students.json" dengan informasi tentang beberapa murid. Itu mungkin terlihat seperti ini:

{
"students": [
{
"name": "Alice",
"age": 20,
"major": "Computer Science"
},
{
"name": "Bob",
"age": 22,
"major": "Mathematics"
},
{
"name": "Charlie",
"age": 21,
"major": "Physics"
}
]
}

Berkas JSON ini berisi array murid, di mana setiap murid memiliki nama, umur, dan jurusan. Itu seperti database kecil kelas kita!

Baca Berkas JSON

Sekarang, mari kita baca berkas JSON ini ke dalam R. Kita akan menggunakan fungsi fromJSON() dari paket rjson:

json_data <- fromJSON(file = "students.json")

Baris ini mengatakan kepada R untuk membaca berkas "students.json" dan menyimpan kontennya dalam variabel json_data. Itu seperti kita membuang isi berkas JSON kita ke dalam wadah di R.

Mari kita lihat apa yang kita miliki:

print(json_data)

Anda seharusnya melihat sesuatu seperti ini:

$students
$students[[1]]
$students[[1]]$name
[1] "Alice"

$students[[1]]$age
[1] 20

$students[[1]]$major
[1] "Computer Science"

$students[[2]]
$students[[2]]$name
[1] "Bob"

$students[[2]]$age
[1] 22

$students[[2]]$major
[1] "Mathematics"

$students[[3]]
$students[[3]]$name
[1] "Charlie"

$students[[3]]$age
[1] 21

$students[[3]]$major
[1] "Physics"

Selamat! Anda baru saja membaca berkas JSON pertama Anda ke dalam R!

Konversi JSON ke Data Frame

Meskipun data JSON sekarang ada di R, itu tidak dalam format yang paling nyaman untuk analisis. Dalam R, kita sering memilih untuk bekerja dengan sesuatu yang disebut "data frame". Itu seperti tabel atau spreadsheet. Mari kita konversi data JSON kita ke data frame:

students_df <- do.call(rbind, lapply(json_data$students, as.data.frame))

Wah! Itu agak panjang, kan? Mari kita rinci itu:

  1. json_data$students mengakses bagian "students" dari data JSON kita.
  2. lapply() menerapkan fungsi as.data.frame() ke setiap murid dalam daftar.
  3. do.call(rbind, ...) mengambil semua data frame individual ini dan menggabungkannya menjadi satu data frame besar.

Sekarang, mari kita lihat data frame baru kita:

print(students_df)

Anda seharusnya melihat sesuatu seperti ini:

name age           major
1   Alice  20 Computer Science
2     Bob  22     Mathematics
3 Charlie  21         Physics

Jauh lebih baik! Sekarang kita memiliki tabel rapi data murid kita.

Bekerja dengan Data Frame

Sekarang kita memiliki data dalam data frame, kita dapat mudah melakukan berbagai operasi padanya. Berikut adalah beberapa contoh:

  1. Dapatkan rata-rata umur murid:
mean_age <- mean(students_df$age)
print(paste("Rata-rata umur murid adalah:", mean_age))
  1. Temukan semua murid yang mengambil jurusan tertentu:
cs_students <- students_df[students_df$major == "Computer Science", ]
print("Murid yang mengambil jurusan Computer Science:")
print(cs_students)
  1. Tambahkan kolom baru:
students_df$graduation_year <- 2023 + (22 - students_df$age)
print(students_df)

Kesimpulan

Dan begitu kita mencapai titik ini! Kita telah melakukan perjalanan dari menginstal paket, membaca berkas JSON, mengkonversi itu ke data frame, dan melakukan beberapa operasi dasar. Anda telah mengambil langkah pertama ke dunia manipulasi data dalam R!

Ingat, seperti semua keterampilan, bekerja dengan JSON dalam R menjadi mudah dengan latihan. Jangan khawatir untuk mencoba dan mencoba hal baru. Siapa tahu? Penemuan data besar berikutnya mungkin ada di jari Anda!

Berikut adalah tabel yang menggabungkan fungsi utama yang kita gunakan:

Fungsi Paket Deskripsi
install.packages() base R Menginstal paket
library() base R Memuat paket
fromJSON() rjson Membaca berkas JSON
do.call() base R Membangun dan menjalankan panggilan fungsi
rbind() base R Menggabungkan objek R secara vertikal
lapply() base R Mengaplikasikan fungsi ke list atau vektor
as.data.frame() base R Mengubah ke data frame
mean() base R Menghitung rata-rata

Hari baik coding, dan semoga data Anda selalu rapi!

Credits: Image by storyset