R - Pie Charts: A Beginner's Guide to Delicious Data Visualization

Здравствуйте, начинающие маги данных! Сегодня мы окунемся в мир круговых диаграмм с использованием R. Не волнуйтесь, если вы никогда не писали ни строчки кода — я проведу вас через каждый шаг, словно мы вместе готовим вкусный пирог. К концу этого руководства вы будете подавать аппетитные визуализации данных, которыми бы гордилась даже ваша бабушка!

R - Pie Charts

Что такое круговая диаграмма?

Прежде чем мы начнем готовить с кодом, давайте поймем, что такое круговая диаграмма. Представьте себе circular cake (ммм,蛋糕...) и представьте, что вы хотите показать, как он разделен между вашими друзьями. Каждая часть represents a portion of the whole. Вот что делает круговая диаграмма с данными — она показывает, как totality divided into parts.

Подготовка нашей кухни (окружение R)

Во-первых,我们必须 убедиться, что наша кухня (окружение R) готова. Если вы еще не установили R и RStudio, сделайте это. Представьте R как духовку, а RStudio как ваш модный кухонный рабочий стол.

Как только вы настроите, откройте RStudio и создайте новый скрипт R. Это место, где мы напишем наш рецепт (код) для круговых диаграмм.

Основной рецепт круговой диаграммы

Давайте начнем с простого кругового графика. Мы будем использовать встроенную функцию R pie(). Вот наш первый пример кода:

# Создаем данные
slices <- c(40, 20, 40)
labels <- c("Apples", "Bananas", "Cherries")

# Создаем круговую диаграмму
pie(slices, labels = labels)

Запустите этот код, и voila! Вы только что испекли свою первую круговую диаграмму. Давайте разберем, что делает каждая строка:

  1. Мы создаем вектор slices с значениями для каждой части нашего кругового графика.
  2. Мы создаем вектор labels с именами для каждой части.
  3. Функция pie() принимает эти ингредиенты и запекает их в диаграмму.

Заголовок круговой диаграммы и цвета

Теперь давайте сделаем нашу круговую диаграмму привлекательнее, добавив заголовок и цвета. Мы будем использовать параметр main для заголовка и параметр col для цветов.

# Создаем данные
slices <- c(40, 20, 40)
labels <- c("Apples", "Bananas", "Cherries")
colors <- c("red", "yellow", "purple")

# Создаем более красочную круговую диаграмму с заголовком
pie(slices, labels = labels, col = colors, main = "Fruit Pie Chart")

В этом примере:

  • Мы добавили вектор colors для указания цвета каждой части.
  • Мы использовали параметр main для добавления заголовка к нашей диаграмме.
  • Параметр col применяет наши цвета к частям.

Проценты частей и легенда диаграммы

Чтобы сделать нашу круговую диаграмму еще более информативной, добавим проценты к нашим меткам и включим легенду. Мы будем использовать функцию paste() для комбинирования наших меток с процентами и функцию legend() для добавления легенды.

# Создаем данные
slices <- c(40, 20, 40)
labels <- c("Apples", "Bananas", "Cherries")
colors <- c("red", "yellow", "purple")

# Вычисляем проценты
pct <- round(slices/sum(slices)*100)
labels <- paste(labels, pct, "%", sep = " ")

# Создаем круговую диаграмму с процентами
pie(slices, labels = labels, col = colors, main = "Fruit Pie Chart")

# Добавляем легенду
legend("topright", labels, fill = colors)

Давайте разберем это:

  1. Мы вычисляем проценты с использованием slices/sum(slices)*100 и округляем их.
  2. Мы используем функцию paste() для комбинирования наших оригинальных меток с процентами.
  3. Мы создаем круговую диаграмму, как и раньше, но теперь с процентными метками.
  4. Мы добавляем легенду с помощью функции legend(), размещая ее в правом верхнем углу.

3D круговая диаграмма

Для дополнительного шика давайте создадим 3D круговую диаграмму. Нам нужно установить и загрузить пакет plotrix для этого.

# Устанавливаем и загружаем пакет plotrix
install.packages("plotrix")
library(plotrix)

# Создаем данные
slices <- c(40, 20, 40)
labels <- c("Apples", "Bananas", "Cherries")
colors <- c("red", "yellow", "purple")

# Создаем 3D круговую диаграмму
pie3D(slices, labels = labels, explode = 0.1, col = colors, main = "3D Fruit Pie Chart")

Вот что нового:

  1. Мы устанавливаем и загружаем пакет plotrix, который предоставляет нам функцию pie3D().
  2. Мы используем pie3D() вместо pie() для создания 3D эффекта.
  3. Параметр explode слегка отодвигает части друг от друга для интересного эффекта.

Объединение всего: Сравнение методов круговых диаграмм

Давайте создадим таблицу, резюмирующую различные методы круговых диаграмм, которые мы изучили:

Метод Функция Основные особенности Лучше всего используется для
Основная круговая диаграмма pie() Простая, легко создается Быстрые визуализации
Красивая круговая диаграмма pie() с col Добавляет визуальную привлекательность Отличие категорий
Маркированная круговая диаграмма pie() с пользовательскими метками Показывает проценты Подробные разложения
Круговая диаграмма с легендой pie() с legend() Предоставляет ключ для толкования Сложные наборы данных
3D круговая диаграмма pie3D() из plotrix Добавляет глубину и разделение Подчеркнуть и эстетика

Заключение: Подача вашего пира

Поздравляю! Вы только что научились создавать различные типы круговых диаграмм в R. От простых кругов до 3D шедевров, теперь у вас есть инструменты для визуализации ваших данных в аппетитных ломтиках.

Remember, like any good baker, practice makes perfect. Don't be afraid to experiment with different data sets, colors, and layouts. And most importantly, always consider whether a pie chart is the best way to represent your data — sometimes, a bar chart or line graph might be a better fit.

Happy coding, and may your data always be as sweet as pie!

Credits: Image by storyset