Guide de redressement des données en R : Un guide pour les débutants
Bonjour à vous, futurs programmeurs R ! Aujourd'hui, nous allons entreprendre un voyage passionnant à travers le monde du redressement des données en R. Ne vous inquiétez pas si vous n'avez jamais programmé auparavant - je serai votre guide amical, et nous avancerons pas à pas. À la fin de ce tutoriel, vous serez capable de redresser des données comme un pro !
Qu'est-ce que le redressement des données ?
Avant de plonger dedans, parlons de ce que signifie vraiment le redressement des données. Imaginez que vous avez un tas de briques Lego. Le redressement des données, c'est comme réorganiser ces briques pour construire différentes structures. En R, nous faisons la même chose avec nos données - nous les réorganisons pour les rendre plus utiles pour l'analyse.
Maintenant, passons à quelques exemples pratiques !
Fusionner des colonnes et des lignes dans un cadre de données
Ajouter des colonnes
Commençons par quelque chose de simple. Imaginez que vous avez un cadre de données avec des informations sur les fruits :
fruits <- data.frame(
name = c("Apple", "Banana", "Cherry"),
color = c("Red", "Yellow", "Red")
)
print(fruits)
Cela affichera :
name color
1 Apple Red
2 Banana Yellow
3 Cherry Red
Maintenant, disons que nous voulons ajouter une nouvelle colonne pour le prix de chaque fruit :
fruits$price <- c(0.5, 0.3, 0.7)
print(fruits)
Et voilà ! Nous avons ajouté une nouvelle colonne :
name color price
1 Apple Red 0.5
2 Banana Yellow 0.3
3 Cherry Red 0.7
Ajouter des lignes
Que se passe-t-il si nous voulons ajouter un nouveau fruit à notre liste ? Nous pouvons aussi faire cela !
new_fruit <- data.frame(name = "Date", color = "Brown", price = 0.6)
fruits <- rbind(fruits, new_fruit)
print(fruits)
Cela nous donne :
name color price
1 Apple Red 0.5
2 Banana Yellow 0.3
3 Cherry Red 0.7
4 Date Brown 0.6
Fusionner des cadres de données
Maintenant, disons que nous avons un autre cadre de données avec des informations nutritionnelles :
nutrition <- data.frame(
name = c("Apple", "Banana", "Cherry", "Date"),
calories = c(52, 89, 50, 282)
)
# Fusionner les deux cadres de données
fruit_info <- merge(fruits, nutrition, by = "name")
print(fruit_info)
Cela nous donne :
name color price calories
1 Apple Red 0.5 52
2 Banana Yellow 0.3 89
3 Cherry Red 0.7 50
4 Date Brown 0.6 282
C'est génial, non ? Nous avons combiné des informations provenant de deux sources différentes en un cadre de données complet !
Fondre et couler
Maintenant, penchons-nous sur des techniques de redressement plus avancées. Nous allons utiliser le package reshape2
, donc assurez-vous de l'installer et de le charger :
install.packages("reshape2")
library(reshape2)
Fondre les données
Fondre les données, c'est comme fondre un bloc de glace - tout devient fluide et peut être redressé. Fondons notre données fruit_info
:
melted_fruits <- melt(fruit_info, id.vars = "name")
print(melted_fruits)
Cela nous donne :
name variable value
1 Apple color Red
2 Banana color Yellow
3 Cherry color Red
4 Date color Brown
5 Apple price 0.50
6 Banana price 0.30
7 Cherry price 0.70
8 Date price 0.60
9 Apple calories 52.00
10 Banana calories 89.00
11 Cherry calories 50.00
12 Date calories 282.00
Voyez comme chaque attribut (couleur, prix, calories) est devenu une ligne distincte ? Cela est extrêmement utile pour certains types d'analyse et de visualisation.
Couler les données fondues
Maintenant que nous avons fondu nos données, nous pouvons les recouler dans une nouvelle forme. Disons que nous voulons avoir les fruits en colonnes et les attributs en lignes :
casted_fruits <- dcast(melted_fruits, variable ~ name)
print(casted_fruits)
Cela nous donne :
variable Apple Banana Cherry Date
1 color Red Yellow Red Brown
2 price 0.50 0.30 0.70 0.60
3 calories 52.00 89.00 50.00 282.00
Impressionnant, non ? Nous avons complètement transformé notre structure de données !
Conclusion
Félicitations ! Vous avez appena fait vos premiers pas dans le monde du redressement des données en R. Souvenez-vous, comme pour construire avec des Lego, la clé est d'expérimenter et de trouver la structure qui fonctionne le mieux pour vos besoins. N'ayez pas peur de jouer avec ces fonctions - c'est ainsi que vous apprendrez vraiment !
Voici un tableau de référence rapide des méthodes que nous avons couvertes :
Méthode | Fonction | Objectif |
---|---|---|
Ajouter des Colonnes |
$ ou cbind()
|
Ajouter de nouvelles variables à un cadre de données |
Ajouter des Lignes | rbind() |
Ajouter de nouvelles observations à un cadre de données |
Fusionner | merge() |
Combiner des données provenant de différents cadres de données |
Fondre | melt() |
Redresser les données larges en format long |
Couler | dcast() |
Redresser les données longues en format large |
Continuez à pratiquer, et bientôt vous serez capable de redresser des données comme un maître sculpteur ! Bonne programmation !
Credits: Image by storyset