Guida per Principianti sui Data Frames in R
Ciao a tutti, futuri programmatori R! Oggi ci imbarcheremo in un viaggio emozionante nel mondo dei Data Frames in R. Non preoccupatevi se non avete mai programmato prima - sarò il vostro guida amichevole, e faremo tutto passo per passo. Alla fine di questo tutorial, manipolerete i data frames come un professionista!
Cos'è un Data Frame?
Prima di immergerci, capiamo cos'è un data frame. Immagina di avere un foglio di calcolo con righe e colonne - è essenzialmente ciò che è un data frame in R. È una tabella bidimensionale dove ogni colonna può contenere diversi tipi di dati (come numeri, testo o date), e ogni riga rappresenta un record individuale.
Ora, mettiamo le mani sporche con del codice R vero e proprio!
Creare un Data Frame
Creare un data frame è come impostare il proprio database personale. Iniziamo con un esempio semplice:
# Creare un data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)
# Vediamo come appare il nostro data frame
print(students)
Quando eseguite questo codice, vedrete:
name age grade
1 Alice 22 A
2 Bob 25 B
3 Charlie 23 A-
Cosa abbiamo fatto qui? Abbiamo creato un data frame chiamato students
con tre colonne: nome, età e voto. Ogni colonna è un vettore, e tutti i vettori devono avere la stessa lunghezza (in questo caso, 3).
Ottenere la Struttura del Data Frame
Ora che abbiamo il nostro data frame, esaminiamo la sua struttura. È come guardare sotto il cofano di un'auto:
# Ottenere la struttura del data frame
str(students)
Questo restituirà:
'data.frame': 3 obs. of 3 variables:
$ name : chr "Alice" "Bob" "Charlie"
$ age : num 22 25 23
$ grade: chr "A" "B" "A-"
Ciò ci dice che students
è un data frame con 3 osservazioni (righe) e 3 variabili (colonne). Mostra anche il tipo di dati di ogni colonna: chr
per character (testo) e num
per numeric.
Sintesi dei Dati nel Data Frame
Vuoi una panoramica rapida dei tuoi dati? La funzione summary()
è il tuo migliore amico:
# Ottenere una sintesi del data frame
summary(students)
Vedrete qualcosa come:
name age grade
Length:3 Min. :22.00 Length:3
Class :character 1st Qu.:22.50 Class :character
Mode :character Median :23.00 Mode :character
Mean :23.33
3rd Qu.:24.00
Max. :25.00
Ciò ci dà una sintesi statistica dei nostri dati. Per colonne numeriche come 'età', fornisce il minimo, il massimo, la media e i quartili. Per le colonne character, ci dice la lunghezza e il tipo.
Estrarre Dati dal Data Frame
Ora, impariamo come estrarre dati specifici dal nostro data frame. È come essere un detective dei dati!
# Ottenere una colonna specifica
print(students$name)
# Ottenere una riga specifica
print(students[2,])
# Ottenere una cella specifica
print(students[1, "grade"])
# Ottenere più colonne
print(students[, c("name", "age")])
Questi comandi stamperanno:
[1] "Alice" "Bob" "Charlie"
name age grade
2 Bob 25 B
[1] "A"
name age
1 Alice 22
2 Bob 25
3 Charlie 23
L'operatore $
permette di accedere a una colonna per nome. Le parentesi quadre []
consentono di specificare righe e colonne: [riga, colonna]
. Se si lascia vuota la riga o la colonna, seleziona tutte le righe o colonne.
Espandere il Data Frame
Man mano che i dati crescono, potresti aver bisogno di aggiungere più informazioni al tuo data frame. Vediamo come:
# Aggiungere una nuova colonna
students$height <- c(165, 180, 175)
# Aggiungere una nuova riga
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)
# Vediamo il nostro data frame aggiornato
print(students)
Questo ci darà:
name age grade height
1 Alice 22 A 165
2 Bob 25 B 180
3 Charlie 23 A- 175
4 David 24 B+ 178
Abbiamo aggiunto una nuova colonna 'height' utilizzando l'operatore $
, e una nuova riga utilizzando la funzione rbind()
(che sta per "row bind").
Metodi Utili per i Data Frame
Ecco una tabella di alcuni metodi utili per lavorare con i data frames:
Metodo | Descrizione |
---|---|
head(df) |
Mostra le prime 6 righe del data frame |
tail(df) |
Mostra le ultime 6 righe del data frame |
nrow(df) |
Ottiene il numero di righe |
ncol(df) |
Ottiene il numero di colonne |
names(df) |
Ottiene i nomi delle colonne |
colnames(df) |
Un altro modo per ottenere o impostare i nomi delle colonne |
rownames(df) |
Ottiene o imposta i nomi delle righe |
dim(df) |
Ottiene le dimensioni (righe e colonne) |
Prova questi metodi sul nostro data frame students
!
Ecco fatto, ragazzi! Avete appena fatto i vostri primi passi nel mondo dei data frames in R. Ricordate, la pratica rende perfetti, quindi non abbiate paura di sperimentare con questi comandi. Create i vostri data frames, provate diverse operazioni e vedete cosa succede.
Prima di sapere, manipolerete i dati come un esperto di dati. E chi lo sa? Forse un giorno userai queste competenze per analizzare i dati delle colonie marziane o delle città sottomarine. Le possibilità sono infinite!
Continuate a programmare, rimanete curiosi, e, soprattutto, divertitevi! Arrivederci e Grazie per Tutti i Pesci!
Credits: Image by storyset