Guida per Principianti sui Data Frames in R

Ciao a tutti, futuri programmatori R! Oggi ci imbarcheremo in un viaggio emozionante nel mondo dei Data Frames in R. Non preoccupatevi se non avete mai programmato prima - sarò il vostro guida amichevole, e faremo tutto passo per passo. Alla fine di questo tutorial, manipolerete i data frames come un professionista!

R - Data Frames

Cos'è un Data Frame?

Prima di immergerci, capiamo cos'è un data frame. Immagina di avere un foglio di calcolo con righe e colonne - è essenzialmente ciò che è un data frame in R. È una tabella bidimensionale dove ogni colonna può contenere diversi tipi di dati (come numeri, testo o date), e ogni riga rappresenta un record individuale.

Ora, mettiamo le mani sporche con del codice R vero e proprio!

Creare un Data Frame

Creare un data frame è come impostare il proprio database personale. Iniziamo con un esempio semplice:

# Creare un data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)

# Vediamo come appare il nostro data frame
print(students)

Quando eseguite questo codice, vedrete:

name age grade
1  Alice  22     A
2    Bob  25     B
3 Charlie 23    A-

Cosa abbiamo fatto qui? Abbiamo creato un data frame chiamato students con tre colonne: nome, età e voto. Ogni colonna è un vettore, e tutti i vettori devono avere la stessa lunghezza (in questo caso, 3).

Ottenere la Struttura del Data Frame

Ora che abbiamo il nostro data frame, esaminiamo la sua struttura. È come guardare sotto il cofano di un'auto:

# Ottenere la struttura del data frame
str(students)

Questo restituirà:

'data.frame':   3 obs. of  3 variables:
$ name : chr  "Alice" "Bob" "Charlie"
$ age  : num  22 25 23
$ grade: chr  "A" "B" "A-"

Ciò ci dice che students è un data frame con 3 osservazioni (righe) e 3 variabili (colonne). Mostra anche il tipo di dati di ogni colonna: chr per character (testo) e num per numeric.

Sintesi dei Dati nel Data Frame

Vuoi una panoramica rapida dei tuoi dati? La funzione summary() è il tuo migliore amico:

# Ottenere una sintesi del data frame
summary(students)

Vedrete qualcosa come:

name                age           grade
Length:3           Min.   :22.00   Length:3
Class :character   1st Qu.:22.50   Class :character
Mode  :character   Median :23.00   Mode  :character
Mean   :23.33
3rd Qu.:24.00
Max.   :25.00

Ciò ci dà una sintesi statistica dei nostri dati. Per colonne numeriche come 'età', fornisce il minimo, il massimo, la media e i quartili. Per le colonne character, ci dice la lunghezza e il tipo.

Estrarre Dati dal Data Frame

Ora, impariamo come estrarre dati specifici dal nostro data frame. È come essere un detective dei dati!

# Ottenere una colonna specifica
print(students$name)

# Ottenere una riga specifica
print(students[2,])

# Ottenere una cella specifica
print(students[1, "grade"])

# Ottenere più colonne
print(students[, c("name", "age")])

Questi comandi stamperanno:

[1] "Alice"   "Bob"     "Charlie"

name age grade
2  Bob  25     B

[1] "A"

name age
1  Alice  22
2    Bob  25
3 Charlie 23

L'operatore $ permette di accedere a una colonna per nome. Le parentesi quadre [] consentono di specificare righe e colonne: [riga, colonna]. Se si lascia vuota la riga o la colonna, seleziona tutte le righe o colonne.

Espandere il Data Frame

Man mano che i dati crescono, potresti aver bisogno di aggiungere più informazioni al tuo data frame. Vediamo come:

# Aggiungere una nuova colonna
students$height <- c(165, 180, 175)

# Aggiungere una nuova riga
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)

# Vediamo il nostro data frame aggiornato
print(students)

Questo ci darà:

name age grade height
1  Alice  22     A    165
2    Bob  25     B    180
3 Charlie 23    A-    175
4  David  24    B+    178

Abbiamo aggiunto una nuova colonna 'height' utilizzando l'operatore $, e una nuova riga utilizzando la funzione rbind() (che sta per "row bind").

Metodi Utili per i Data Frame

Ecco una tabella di alcuni metodi utili per lavorare con i data frames:

Metodo Descrizione
head(df) Mostra le prime 6 righe del data frame
tail(df) Mostra le ultime 6 righe del data frame
nrow(df) Ottiene il numero di righe
ncol(df) Ottiene il numero di colonne
names(df) Ottiene i nomi delle colonne
colnames(df) Un altro modo per ottenere o impostare i nomi delle colonne
rownames(df) Ottiene o imposta i nomi delle righe
dim(df) Ottiene le dimensioni (righe e colonne)

Prova questi metodi sul nostro data frame students!

Ecco fatto, ragazzi! Avete appena fatto i vostri primi passi nel mondo dei data frames in R. Ricordate, la pratica rende perfetti, quindi non abbiate paura di sperimentare con questi comandi. Create i vostri data frames, provate diverse operazioni e vedete cosa succede.

Prima di sapere, manipolerete i dati come un esperto di dati. E chi lo sa? Forse un giorno userai queste competenze per analizzare i dati delle colonie marziane o delle città sottomarine. Le possibilità sono infinite!

Continuate a programmare, rimanete curiosi, e, soprattutto, divertitevi! Arrivederci e Grazie per Tutti i Pesci!

Credits: Image by storyset