Guide de base pour les diagrammes circulaires en R : une introduction savoureuse à la visualisation des données

Bonjour, assoiffés de données ! Aujourd'hui, nous allons plonger dans le monde des diagrammes circulaires en utilisant R. Ne vous inquiétez pas si vous n'avez jamais écrit une ligne de code auparavant - je vais vous guider pas à pas, comme si nous cuisinons un délicieux gâteau ensemble. À la fin de ce tutoriel, vous servirez des visualisations de données succulentes dont même votre grand-mère serait fière !

R - Pie Charts

Qu'est-ce qu'un diagramme circulaire ?

Avant de commencer à cuisiner avec du code, comprenons ce qu'est un diagramme circulaire. Imaginez que vous avez un gâteau rond (mmm, gâteau...) et que vous voulez montrer comment il est partagé entre vos amis. Chaque part代表 une portion du tout. C'est essentiellement ce que fait un diagramme circulaire avec des données - il montre comment un total est divisé en parties.

Préparer notre cuisine (environnement R)

Premierement, nous devons nous assurer que notre cuisine (environnement R) est prête. Si ce n'est pas déjà fait, installez R et RStudio. Pensez à R comme à votre four et RStudio comme à votre espace de cuisine élégant.

Une fois que vous êtes prêt, ouvrez RStudio et créez un nouveau script R. C'est ici que nous écrirons notre recette (code) pour nos diagrammes circulaires.

Recette de base pour un diagramme circulaire

Commençons par un diagramme circulaire simple. Nous allons utiliser la fonction intégrée pie() de R. Voici notre premier exemple de code :

# Créer des données
slices <- c(40, 20, 40)
labels <- c("Pommes", "Bananes", "Cerises")

# Créer le diagramme circulaire
pie(slices, labels = labels)

Exécutez ce code, et voilà ! Vous venez de cuire votre premier diagramme circulaire. Decomposons ce que fait chaque ligne :

  1. Nous créons un vecteur slices avec les valeurs pour chaque part de notre diagramme.
  2. Nous créons un vecteur labels avec les noms pour chaque part.
  3. La fonction pie() prend ces ingrédients et les cuit en un graphique.

Ajouter un titre et des couleurs au diagramme circulaire

Maintenant, rendons notre diagramme circulaire plus attrayant en ajoutant un titre et des couleurs. Nous utiliserons le paramètre main pour le titre et le paramètre col pour les couleurs.

# Créer des données
slices <- c(40, 20, 40)
labels <- c("Pommes", "Bananes", "Cerises")
colors <- c("rouge", "jaune", "violet")

# Créer un diagramme circulaire plus coloré avec un titre
pie(slices, labels = labels, col = colors, main = "Diagramme circulaire des fruits")

Dans cet exemple :

  • Nous avons ajouté un vecteur colors pour spécifier la couleur de chaque part.
  • Nous avons utilisé le paramètre main pour ajouter un titre à notre graphique.
  • Le paramètre col applique nos couleurs aux parts.

Ajouter des pourcentages et une légende au diagramme

Pour rendre notre diagramme circulaire encore plus informatif, ajoutons des pourcentages à nos étiquettes et incluons une légende. Nous utiliserons la fonction paste() pour combiner nos étiquettes avec les pourcentages, et la fonction legend() pour ajouter une légende.

# Créer des données
slices <- c(40, 20, 40)
labels <- c("Pommes", "Bananes", "Cerises")
colors <- c("rouge", "jaune", "violet")

# Calculer les pourcentages
pct <- round(slices/sum(slices)*100)
labels <- paste(labels, pct, "%", sep = " ")

# Créer un diagramme circulaire avec des pourcentages
pie(slices, labels = labels, col = colors, main = "Diagramme circulaire des fruits")

# Ajouter une légende
legend("topright", labels, fill = colors)

Decomposons cela :

  1. Nous calculons les pourcentages en utilisant slices/sum(slices)*100 et les arrondissons.
  2. Nous utilisons paste() pour combiner nos étiquettes originales avec les pourcentages.
  3. Nous créons le diagramme circulaire comme avant, mais maintenant avec des étiquettes de pourcentage.
  4. Nous ajoutons une légende en utilisant la fonction legend(), placée dans le coin supérieur droit.

Diagramme circulaire en 3D

Pour un peu de flair supplémentaire, créons un diagramme circulaire en 3D. Nous devons installer et charger le package plotrix pour cela.

# Installer et charger le package plotrix
install.packages("plotrix")
library(plotrix)

# Créer des données
slices <- c(40, 20, 40)
labels <- c("Pommes", "Bananes", "Cerises")
colors <- c("rouge", "jaune", "violet")

# Créer un diagramme circulaire en 3D
pie3D(slices, labels = labels, explode = 0.1, col = colors, main = "Diagramme circulaire des fruits en 3D")

Voici ce qui est nouveau :

  1. Nous installons et chargeons le package plotrix, qui nous donne la fonction pie3D().
  2. Nous utilisons pie3D() au lieu de pie() pour créer un effet 3D.
  3. Le paramètre explode écarte légèrement les parts pour un effet sympa.

Mettre tout ensemble : une comparaison des méthodes de diagramme circulaire

Créons un tableau résumant les différentes méthodes de diagramme circulaire que nous avons apprises :

Méthode Fonction Fonctionnalités clés Utilisation recommandée
Diagramme circulaire de base pie() Simple, facile à créer Visualisations rapides
Diagramme circulaire coloré pie() avec col Ajoute un attrait visuel Distinction des catégories
Diagramme circulaire étiqueté pie() avec étiquettes personnalisées Montre les pourcentages Décompositions détaillées
Diagramme circulaire avec légende pie() avec legend() Fournit une clé d'interprétation Ensembles de données complexes
Diagramme circulaire en 3D pie3D() de plotrix Ajoute de la profondeur et de la séparation Soulignement et esthétique

Conclusion : Servir votre gâteau

Félicitations ! Vous venez d'apprendre à créer différents types de diagrammes circulaires en R. Du cercle de base aux œuvres d'art en 3D, vous avez maintenant les outils pour visualiser vos données en délicieuses parts.

Souvenez-vous, comme pour tout bon pâtissier, la pratique fait la maîtresse. N'ayez pas peur d'expérimenter avec différents ensembles de données, couleurs et mises en page. Et surtout, toujours considérez si un diagramme circulaire est le meilleur moyen de représenter vos données - parfois, un diagramme à barres ou une courbe de tendance pourrait être une meilleure option.

Bonne programmation, et que vos données soient toujours aussi douces que le gâteau !

Credits: Image by storyset