R - Berkas CSV: Panduan untuk Pemula
Halo sana, para programer R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia berkas CSV dalam R. Jangan khawatir jika Anda belum pernah menulis baris kode sebelumnya - saya akan menjadi panduan ramah Anda di setiap langkah. Pada akhir panduan ini, Anda akan dapat mengelola berkas CSV seperti seorang ahli!
Apa Itu Berkas CSV?
Sebelum kita mendalam, mari mulai dari dasar. CSV singkatan dari "Comma-Separated Values". Itu adalah format berkas sederhana yang digunakan untuk menyimpan data tabular, seperti spreadsheet atau database. Setiap baris dalam berkas CSV mewakili satu baris data, dan setiap bidang dipisahkan oleh koma. Mudah, kan?
Mendapatkan dan Mengatur Direktori Kerja
Ketika bekerja dengan berkas di R, sangat penting untuk mengerti dimana R mencari berkas-berkas ini. Lokasi ini disebut "direktori kerja".
Memeriksa Direktori Kerja Saat Ini
Untuk mengetahui direktori kerja Anda saat ini, gunakan perintah ini:
getwd()
Ketika Anda menjalankan ini, R akan memberitahu Anda path saat ini yang digunakan. Misalnya, itu mungkin mengembalikan sesuatu seperti:
[1] "C:/Users/YourName/Documents"
Mengatur Direktori Kerja Baru
Jika Anda ingin mengubah direktori kerja Anda, gunakan fungsi setwd()
:
setwd("C:/Path/To/Your/Desired/Directory")
Ingat untuk menggunakan garis miring (/) atau garis miring ganda (\) dalam path Anda, bahkan di Windows!
Input dari Berkas CSV
Sekarang kita tahu dimana R mencari berkas, mari bicarakan tentang mendapatkan data ke R dari berkas CSV.
Membaca Berkas CSV
R membuatnya sangat mudah untuk membaca berkas CSV dengan fungsi read.csv()
. Berikut cara penggunaannya:
data <- read.csv("your_file.csv")
Perintah ini membaca berkas CSV bernama "your_file.csv" dan menyimpannya dalam variabel data
.
Misal kita memiliki berkas CSV bernama "students.csv" dengan informasi tentang siswa. Berikut cara kita membacanya:
students <- read.csv("students.csv")
Setelah menjalankan perintah ini, students
akan menjadi data frame yang berisi semua informasi dari berkas CSV.
Menampilkan Data
Untuk melihat data yang baru diimpor, Anda dapat menggunakan fungsi ini:
head(students) # Menampilkan 6 baris pertama
str(students) # Menampilkan struktur data
summary(students) # Memberikan ringkasan dari setiap kolom
Menganalisis Berkas CSV
Sekarang kita memiliki data di R, mari kita lakukan analisis dasar!
Mengakses Kolom
Anda dapat mengakses kolom individual menggunakan simbol $
:
students$age # Mengembalikan semua nilai dalam kolom 'age'
Statistik Dasar
R memiliki banyak fungsi bawaan untuk analisis statistik:
mean(students$age) # Menghitung rata-rata umur
median(students$age) # Menemukan median umur
max(students$age) # Menemukan umur maksimum
min(students$age) # Menemukan umur minimum
Menyaring Data
Anda juga dapat menyaring data berdasarkan kondisi:
honor_students <- students[students$gpa > 3.5, ]
Ini menciptakan data frame baru honor_students
yang berisi hanya siswa dengan GPA lebih tinggi dari 3.5.
Menulis ke Berkas CSV
Seperti halnya kita dapat membaca dari berkas CSV, kita juga dapat menulis kepadanya. Hal ini berguna saat Anda telah memanipulasi data dan ingin menyimpan hasilnya.
Untuk menulis data frame ke berkas CSV, gunakan fungsi write.csv()
:
write.csv(honor_students, "honor_students.csv")
Perintah ini akan menciptakan berkas baru bernama "honor_students.csv" di direktori kerja Anda, berisi data dari data frame honor_students
.
Opsi Penting untuk write.csv()
Berikut adalah beberapa opsi yang berguna Anda gunakan dengan write.csv()
:
Opsi | Deskripsi |
---|---|
row.names = FALSE |
Menghapus nama baris dari output |
quote = FALSE |
Mencegah pen报价an string |
na = "NA" |
Menentukan bagaimana nilai hilang ditunjukkan |
Misalnya:
write.csv(honor_students, "honor_students.csv", row.names = FALSE)
Ini akan menulis berkas CSV tanpa mencakup nama baris.
Kesimpulan
Selamat! Anda baru saja belajar dasar-dasar bekerja dengan berkas CSV dalam R. Dari membaca berkas hingga menganalisis data dan menulis berkas baru, Anda sekarang memiliki keterampilan dasar untuk memulai perjalanan analisis data Anda.
Ingat, latihan membuat sempurna. Cobalah bekerja dengan berkas CSV yang berbeda, eksperimen dengan berbagai fungsi, dan jangan takut membuat kesalahan - itu adalah bagaimana kita belajar!
Selamat coding, dan mayat data Anda selalu bersih dan analisis Anda menarik!
Credits: Image by storyset