Guide de redressement des données en R : Un guide pour les débutants

Bonjour à vous, futurs programmeurs R ! Aujourd'hui, nous allons entreprendre un voyage passionnant à travers le monde du redressement des données en R. Ne vous inquiétez pas si vous n'avez jamais programmé auparavant - je serai votre guide amical, et nous avancerons pas à pas. À la fin de ce tutoriel, vous serez capable de redresser des données comme un pro !

R - Data Reshaping

Qu'est-ce que le redressement des données ?

Avant de plonger dedans, parlons de ce que signifie vraiment le redressement des données. Imaginez que vous avez un tas de briques Lego. Le redressement des données, c'est comme réorganiser ces briques pour construire différentes structures. En R, nous faisons la même chose avec nos données - nous les réorganisons pour les rendre plus utiles pour l'analyse.

Maintenant, passons à quelques exemples pratiques !

Fusionner des colonnes et des lignes dans un cadre de données

Ajouter des colonnes

Commençons par quelque chose de simple. Imaginez que vous avez un cadre de données avec des informations sur les fruits :

fruits <- data.frame(
name = c("Apple", "Banana", "Cherry"),
color = c("Red", "Yellow", "Red")
)
print(fruits)

Cela affichera :

name  color
1  Apple    Red
2 Banana Yellow
3 Cherry    Red

Maintenant, disons que nous voulons ajouter une nouvelle colonne pour le prix de chaque fruit :

fruits$price <- c(0.5, 0.3, 0.7)
print(fruits)

Et voilà ! Nous avons ajouté une nouvelle colonne :

name  color price
1  Apple    Red   0.5
2 Banana Yellow   0.3
3 Cherry    Red   0.7

Ajouter des lignes

Que se passe-t-il si nous voulons ajouter un nouveau fruit à notre liste ? Nous pouvons aussi faire cela !

new_fruit <- data.frame(name = "Date", color = "Brown", price = 0.6)
fruits <- rbind(fruits, new_fruit)
print(fruits)

Cela nous donne :

name  color price
1  Apple    Red   0.5
2 Banana Yellow   0.3
3 Cherry    Red   0.7
4   Date  Brown   0.6

Fusionner des cadres de données

Maintenant, disons que nous avons un autre cadre de données avec des informations nutritionnelles :

nutrition <- data.frame(
name = c("Apple", "Banana", "Cherry", "Date"),
calories = c(52, 89, 50, 282)
)

# Fusionner les deux cadres de données
fruit_info <- merge(fruits, nutrition, by = "name")
print(fruit_info)

Cela nous donne :

name  color price calories
1  Apple    Red   0.5       52
2 Banana Yellow   0.3       89
3 Cherry    Red   0.7       50
4   Date  Brown   0.6      282

C'est génial, non ? Nous avons combiné des informations provenant de deux sources différentes en un cadre de données complet !

Fondre et couler

Maintenant, penchons-nous sur des techniques de redressement plus avancées. Nous allons utiliser le package reshape2, donc assurez-vous de l'installer et de le charger :

install.packages("reshape2")
library(reshape2)

Fondre les données

Fondre les données, c'est comme fondre un bloc de glace - tout devient fluide et peut être redressé. Fondons notre données fruit_info :

melted_fruits <- melt(fruit_info, id.vars = "name")
print(melted_fruits)

Cela nous donne :

name variable  value
1   Apple    color    Red
2  Banana    color Yellow
3  Cherry    color    Red
4    Date    color  Brown
5   Apple    price   0.50
6  Banana    price   0.30
7  Cherry    price   0.70
8    Date    price   0.60
9   Apple calories  52.00
10 Banana calories  89.00
11 Cherry calories  50.00
12   Date calories 282.00

Voyez comme chaque attribut (couleur, prix, calories) est devenu une ligne distincte ? Cela est extrêmement utile pour certains types d'analyse et de visualisation.

Couler les données fondues

Maintenant que nous avons fondu nos données, nous pouvons les recouler dans une nouvelle forme. Disons que nous voulons avoir les fruits en colonnes et les attributs en lignes :

casted_fruits <- dcast(melted_fruits, variable ~ name)
print(casted_fruits)

Cela nous donne :

variable Apple Banana Cherry  Date
1    color   Red Yellow    Red Brown
2    price  0.50   0.30   0.70  0.60
3 calories 52.00  89.00  50.00 282.00

Impressionnant, non ? Nous avons complètement transformé notre structure de données !

Conclusion

Félicitations ! Vous avez appena fait vos premiers pas dans le monde du redressement des données en R. Souvenez-vous, comme pour construire avec des Lego, la clé est d'expérimenter et de trouver la structure qui fonctionne le mieux pour vos besoins. N'ayez pas peur de jouer avec ces fonctions - c'est ainsi que vous apprendrez vraiment !

Voici un tableau de référence rapide des méthodes que nous avons couvertes :

Méthode Fonction Objectif
Ajouter des Colonnes $ ou cbind() Ajouter de nouvelles variables à un cadre de données
Ajouter des Lignes rbind() Ajouter de nouvelles observations à un cadre de données
Fusionner merge() Combiner des données provenant de différents cadres de données
Fondre melt() Redresser les données larges en format long
Couler dcast() Redresser les données longues en format large

Continuez à pratiquer, et bientôt vous serez capable de redresser des données comme un maître sculpteur ! Bonne programmation !

Credits: Image by storyset