Panduan Pemula Mengenai Fail CSV di R
Hai sana, para pemrogram R masa depan! Hari ini, kita akan melangkah ke dunia yang menarik fail CSV dalam R. Jangan khawatir jika anda belum pernah menulis satu baris kod sebelum ini - saya akan menjadi panduan yang ramah bagi anda di setiap langkah. Pada akhir panduan ini, anda akan dapat mengendalikan fail CSV seperti seorang professional!
Apa Itu Fail CSV?
Sebelum kita mendalam, mari kita mulakan dengan dasar. CSV adalah singkatan bagi "Comma-Separated Values". Ia adalah format fail yang mudah untuk menyimpan data tabular, seperti spreadsheet atau database. Setiap baris dalam fail CSV mewakili satu baris data, dan setiap medan dipisahkan oleh koma. Mudah, kan?
Mendapatkan dan Menetapkan Direktori Kerja
Bila bekerja dengan fail di R, ia penting untuk memahami di mana R mencari fail ini. Lokasi ini dipanggil "direktori kerja".
Memeriksa Direktori Kerja Semasa
Untuk mengetahui direktori kerja semasa anda, gunakan perintah ini:
getwd()
Bila anda menjalankan ini, R akan memberitahu anda path yang sedang digunakan. Sebagai contoh, ia mungkin mengembalikan sesuatu seperti:
[1] "C:/Users/NamaAnda/Documents"
Menetapkan Direktori Kerja Baru
Jika anda mahu mengubah direktori kerja anda, gunakan fungsi setwd()
:
setwd("C:/Path/Ke/Direktori/Dihendaki")
Ingat untuk menggunakan garisan miring (/) atau garisan miring ganda (\) dalam path anda, walaupun di Windows!
Input sebagai Fail CSV
Sekarang kita tahu di mana R mencari fail, mari kita bicarakan tentang mendapatkan data ke R dari fail CSV.
Membaca Fail CSV
R membuatnya sangat mudah untuk membaca fail CSV dengan fungsi read.csv()
. Ini adalah bagaimana anda menggunakannya:
data <- read.csv("fail_anda.csv")
Perintah ini membaca fail CSV bernama "fail_anda.csv" dan menyimpannya dalam variabel yang dipanggil data
.
katakanlah kita ada fail CSV yang dipanggil "students.csv" dengan maklumat tentang pelajar. Bagaimana kita membacanya:
students <- read.csv("students.csv")
Setelah menjalankan perintah ini, students
akan menjadi data frame yang mengandungi semua maklumat dari fail CSV.
Melihat Data
Untuk memandang data yang baru diimport, anda boleh menggunakan fungsi ini:
head(students) # Menunjukkan 6 baris pertama
str(students) # Menampilkan struktur data
summary(students) # Memberikan ringkasan setiap kolom
Menganalisis Fail CSV
Sekarang kita ada data dalam R, mari kita lakukan analisis asas!
Mengakses Kolom
Anda boleh mengakses kolom individu menggunakan simbol $
:
students$age # Mengembalikan semua nilai dalam kolom 'age'
Statistik Asas
R mempunyai banyak fungsi binaan untuk analisis statistik:
mean(students$age) # Mengira purata umur
median(students$age) # Mencari umur median
max(students$age) # Mencari umur maksimum
min(students$age) # Mencari umur minimum
Penyaringan Data
Anda juga boleh menyaring data anda berdasarkan syarat:
honor_students <- students[students$gpa > 3.5, ]
Ini mencipta data frame baru honor_students
yang hanya mengandungi pelajar dengan GPA lebih tinggi daripada 3.5.
Menulis ke Fail CSV
Seperti yang kita boleh membaca dari fail CSV, kita juga boleh menulis kepadanya. Ini berguna ketika anda telah mengubah data anda dan mahu menyimpan hasilnya.
Untuk menulis data frame ke fail CSV, gunakan fungsi write.csv()
:
write.csv(honor_students, "honor_students.csv")
Perintah ini akan mencipta fail baru dipanggil "honor_students.csv" di direktori kerja anda, mengandungi data daripada data frame honor_students
.
Pilihan Penting untuk write.csv()
Berikut adalah beberapa pilihan yang berguna anda boleh gunakan dengan write.csv()
:
Pilihan | Keterangan |
---|---|
row.names = FALSE |
Mengelakkan nama baris daripada dimasukkan ke output |
quote = FALSE |
Mengelakkan penggunaan petikan bagi string |
na = "NA" |
Menentukan bagaimana nilai hilang ditunjukkan |
Sebagai contoh:
write.csv(honor_students, "honor_students.csv", row.names = FALSE)
Ini akan menulis fail CSV tanpa termasuk nama baris.
Kesimpulan
Tahniah! Anda telah belajar dasar bekerja dengan fail CSV di R. Dari membaca fail hingga menganalisis data dan menulis fail baru, anda kini mempunyai kemahiran asas untuk mula pengembaraan analisis data anda.
Ingat, latihan membuat sempurna. Cobalah bekerja dengan fail CSV yang berbeza, cuba gunakan fungsi yang berbeza, dan jangan takut membuat kesalahan - itu adalah bagaimana kita belajar!
Selamat mengoding, dan mayat data anda sentiasa bersih dan analisis anda sentiasa berkesan!
Credits: Image by storyset