Guida per Principianti sui File CSV in R
Ciao a tutti, futuri programmatori R! Oggi ci imbarcheremo in un viaggio emozionante nel mondo dei file CSV in R. Non preoccupatevi se non avete mai scritto una riga di codice prima - sarò il vostro guida amichevole in ogni passo. Alla fine di questo tutorial, gestirete i file CSV come un professionista!
Cos'è un File CSV?
Prima di immergerci, iniziiamo con le basi. CSV significa "Valori Separati da Virgola". È un formato di file semplice utilizzato per memorizzare dati tabellari, come fogli di calcolo o database. Ogni riga in un file CSV rappresenta una riga di dati, e ogni campo è separato da una virgola. Semplice, vero?
Ottenere e Impostare la Directory di Lavoro
Quando si lavora con file in R, è fondamentale capire dove R sta cercando questi file. Questo luogo è chiamato "directory di lavoro".
Controllare la Directory di Lavoro Attuale
Per scoprire la tua directory di lavoro attuale, usa questo comando:
getwd()
Quando esegui questo comando, R ti dirà il percorso attuale che sta utilizzando. Ad esempio, potrebbe restituire qualcosa come:
[1] "C:/Users/YourName/Documents"
Impostare una Nuova Directory di Lavoro
Se vuoi cambiare la tua directory di lavoro, usa la funzione setwd()
:
setwd("C:/Path/To/Your/Desired/Directory")
Ricorda di usare barre oblique (/) o doppi backslash (\) nel tuo percorso, anche su Windows!
Input come File CSV
Ora che sappiamo dove R sta cercando i file, parliamo di ottenere dati in R da un file CSV.
Leggere un File CSV
R rende facilissimo leggere file CSV con la funzione read.csv()
. Ecco come usarla:
data <- read.csv("your_file.csv")
Questo comando legge il file CSV chiamato "your_file.csv" e lo memorizza in una variabile chiamata data
.
Supponiamo di avere un file CSV chiamato "students.csv" con informazioni sugli studenti. Ecco come lo leggeremmo:
students <- read.csv("students.csv")
Dopo aver eseguito questo comando, students
sarà un data frame contenente tutte le informazioni dal file CSV.
Visualizzare i Dati
Per dare un'occhiata ai tuoi dati appena importati, puoi usare queste utili funzioni:
head(students) # Mostra le prime 6 righe
str(students) # Mostra la struttura dei dati
summary(students) # Fornisce una sintesi di ogni colonna
Analizzare il File CSV
Ora che abbiamo i nostri dati in R, facciamo un po' di analisi di base!
Accedere alle Colonne
Puoi accedere a singole colonne usando il simbolo $
:
students$age # Restituisce tutti i valori nella colonna 'age'
Statistiche di Base
R ha molte funzioni incorporate per l'analisi statistica:
mean(students$age) # Calcola l'età media
median(students$age) # Trova l'età mediana
max(students$age) # Trova l'età massima
min(students$age) # Trova l'età minima
Filtrare i Dati
Puoi anche filtrare i tuoi dati in base a condizioni:
honor_students <- students[students$gpa > 3.5, ]
Questo crea un nuovo data frame honor_students
contenente solo gli studenti con un GPA superiore a 3.5.
Scrivere in un File CSV
Come possiamo leggere da file CSV, possiamo anche scrivere in essi. Questo è utile quando hai manipolato i tuoi dati e vuoi salvare i risultati.
Per scrivere un data frame in un file CSV, usa la funzione write.csv()
:
write.csv(honor_students, "honor_students.csv")
Questo comando creerà un nuovo file chiamato "honor_students.csv" nella tua directory di lavoro, contenente i dati del data frame honor_students
.
Opzioni Importanti per write.csv()
Ecco alcune opzioni utili che puoi usare con write.csv()
:
Opzione | Descrizione |
---|---|
row.names = FALSE |
Esclude i nomi delle righe dall'output |
quote = FALSE |
Impedisce la quotazione delle stringhe |
na = "NA" |
Specifica come rappresentare i valori mancanti |
Ad esempio:
write.csv(honor_students, "honor_students.csv", row.names = FALSE)
Questo scriverà il file CSV senza includere i nomi delle righe.
Conclusione
Congratulations! Hai appena imparato le basi del lavoro con i file CSV in R. Dalla lettura dei file all'analisi dei dati e alla scrittura di nuovi file, ora hai le competenze di base per iniziare il tuo viaggio di analisi dei dati.
Ricorda, la pratica fa perfezione. Prova a lavorare con diversi file CSV, esperimenta con diverse funzioni e non abbiate paura di fare errori - è così che impariamo!
Buon coding, e possa i tuoi dati essere sempre puliti e le tue analisi ispirate!
Credits: Image by storyset