Panduan Pemula Mengenai Fail CSV di R

Hai sana, para pemrogram R masa depan! Hari ini, kita akan melangkah ke dunia yang menarik fail CSV dalam R. Jangan khawatir jika anda belum pernah menulis satu baris kod sebelum ini - saya akan menjadi panduan yang ramah bagi anda di setiap langkah. Pada akhir panduan ini, anda akan dapat mengendalikan fail CSV seperti seorang professional!

R - CSV Files

Apa Itu Fail CSV?

Sebelum kita mendalam, mari kita mulakan dengan dasar. CSV adalah singkatan bagi "Comma-Separated Values". Ia adalah format fail yang mudah untuk menyimpan data tabular, seperti spreadsheet atau database. Setiap baris dalam fail CSV mewakili satu baris data, dan setiap medan dipisahkan oleh koma. Mudah, kan?

Mendapatkan dan Menetapkan Direktori Kerja

Bila bekerja dengan fail di R, ia penting untuk memahami di mana R mencari fail ini. Lokasi ini dipanggil "direktori kerja".

Memeriksa Direktori Kerja Semasa

Untuk mengetahui direktori kerja semasa anda, gunakan perintah ini:

getwd()

Bila anda menjalankan ini, R akan memberitahu anda path yang sedang digunakan. Sebagai contoh, ia mungkin mengembalikan sesuatu seperti:

[1] "C:/Users/NamaAnda/Documents"

Menetapkan Direktori Kerja Baru

Jika anda mahu mengubah direktori kerja anda, gunakan fungsi setwd():

setwd("C:/Path/Ke/Direktori/Dihendaki")

Ingat untuk menggunakan garisan miring (/) atau garisan miring ganda (\) dalam path anda, walaupun di Windows!

Input sebagai Fail CSV

Sekarang kita tahu di mana R mencari fail, mari kita bicarakan tentang mendapatkan data ke R dari fail CSV.

Membaca Fail CSV

R membuatnya sangat mudah untuk membaca fail CSV dengan fungsi read.csv(). Ini adalah bagaimana anda menggunakannya:

data <- read.csv("fail_anda.csv")

Perintah ini membaca fail CSV bernama "fail_anda.csv" dan menyimpannya dalam variabel yang dipanggil data.

katakanlah kita ada fail CSV yang dipanggil "students.csv" dengan maklumat tentang pelajar. Bagaimana kita membacanya:

students <- read.csv("students.csv")

Setelah menjalankan perintah ini, students akan menjadi data frame yang mengandungi semua maklumat dari fail CSV.

Melihat Data

Untuk memandang data yang baru diimport, anda boleh menggunakan fungsi ini:

head(students)  # Menunjukkan 6 baris pertama
str(students)   # Menampilkan struktur data
summary(students)  # Memberikan ringkasan setiap kolom

Menganalisis Fail CSV

Sekarang kita ada data dalam R, mari kita lakukan analisis asas!

Mengakses Kolom

Anda boleh mengakses kolom individu menggunakan simbol $:

students$age  # Mengembalikan semua nilai dalam kolom 'age'

Statistik Asas

R mempunyai banyak fungsi binaan untuk analisis statistik:

mean(students$age)    # Mengira purata umur
median(students$age)  # Mencari umur median
max(students$age)     # Mencari umur maksimum
min(students$age)     # Mencari umur minimum

Penyaringan Data

Anda juga boleh menyaring data anda berdasarkan syarat:

honor_students <- students[students$gpa > 3.5, ]

Ini mencipta data frame baru honor_students yang hanya mengandungi pelajar dengan GPA lebih tinggi daripada 3.5.

Menulis ke Fail CSV

Seperti yang kita boleh membaca dari fail CSV, kita juga boleh menulis kepadanya. Ini berguna ketika anda telah mengubah data anda dan mahu menyimpan hasilnya.

Untuk menulis data frame ke fail CSV, gunakan fungsi write.csv():

write.csv(honor_students, "honor_students.csv")

Perintah ini akan mencipta fail baru dipanggil "honor_students.csv" di direktori kerja anda, mengandungi data daripada data frame honor_students.

Pilihan Penting untuk write.csv()

Berikut adalah beberapa pilihan yang berguna anda boleh gunakan dengan write.csv():

Pilihan Keterangan
row.names = FALSE Mengelakkan nama baris daripada dimasukkan ke output
quote = FALSE Mengelakkan penggunaan petikan bagi string
na = "NA" Menentukan bagaimana nilai hilang ditunjukkan

Sebagai contoh:

write.csv(honor_students, "honor_students.csv", row.names = FALSE)

Ini akan menulis fail CSV tanpa termasuk nama baris.

Kesimpulan

Tahniah! Anda telah belajar dasar bekerja dengan fail CSV di R. Dari membaca fail hingga menganalisis data dan menulis fail baru, anda kini mempunyai kemahiran asas untuk mula pengembaraan analisis data anda.

Ingat, latihan membuat sempurna. Cobalah bekerja dengan fail CSV yang berbeza, cuba gunakan fungsi yang berbeza, dan jangan takut membuat kesalahan - itu adalah bagaimana kita belajar!

Selamat mengoding, dan mayat data anda sentiasa bersih dan analisis anda sentiasa berkesan!

Credits: Image by storyset