Hướng dẫn cơ bản về biểu đồ đường trong R

Chào mừng các bạn yêu thích trực quan hóa dữ liệu! Hôm nay, chúng ta sẽ bắt đầu một hành trình thú vị vào thế giới của R và biểu đồ đường. Đừng lo lắng nếu bạn chưa bao giờ viết một dòng mã trước đây - chúng ta sẽ bắt đầu từ những điều cơ bản và cùng nhau tiến hóa. Cuối cùng của hướng dẫn này, bạn sẽ có thể tạo ra những biểu đồ đường đẹp mắt để dữ liệu của bạn nói lên điều mình muốn!

R - Line Graphs

Biểu đồ đường là gì?

Trước khi chúng ta nhảy vào R, hãy nhanh chóng thảo luận về biểu đồ đường là gì. Hãy tưởng tượng bạn đang theo dõi lượng cà phê tiêu thụ hàng ngày trong một tháng. Biểu đồ đường sẽ hiển thị dữ liệu này dưới dạng một loạt các điểm nối với nhau bằng đường, với ngày trên trục x và số lượng cà phê trên trục y. Nó rất phù hợp để hiển thị xu hướng theo thời gian!

Bắt đầu với R

Trước hết, hãy chắc chắn rằng bạn đã cài đặt R và RStudio trên máy tính của mình. Nếu bạn chưa cài đặt R và RStudio, hãy truy cập trang web dự án R và trang web RStudio để tải xuống và cài đặt chúng.

Khi bạn đã sẵn sàng với R và RStudio, hãy mở RStudio và bắt đầu cuộc phiêu lưu biểu đồ đường của chúng ta!

Tạo biểu đồ đường đầu tiên

Bước 1: Chuẩn bị dữ liệu

Hãy bắt đầu với một ví dụ đơn giản. Chúng ta sẽ tạo một biểu đồ đường hiển thị nhiệt độ trung bình trong một tuần.

# Tạo các vector cho ngày và nhiệt độ
days <- c("Mon", "Tue", "Wed", "Thu", "Fri", "Sat", "Sun")
temps <- c(20, 22, 25, 23, 21, 19, 22)

# Kết hợp thành một data frame
weather_data <- data.frame(Day = days, Temperature = temps)

# Xem dữ liệu
print(weather_data)

Mã này tạo một bộ dữ liệu đơn giản với các ngày trong tuần và nhiệt độ tương ứng. Hàm data.frame() kết hợp các ngày và nhiệt độ của chúng ta thành một cấu trúc bảng rõ ràng.

Bước 2: Tạo biểu đồ đường cơ bản

Bây giờ, hãy tạo biểu đồ đường đầu tiên của chúng ta sử dụng hàm plot():

plot(weather_data$Temperature, type = "l", col = "blue",
xlab = "Ngày trong tuần", ylab = "Nhiệt độ (°C)",
main = "Nhiệt độ hàng tuần")

Hãy phân tích này:

  • weather_data$Temperature: Đây chọn cột Nhiệt độ từ dữ liệu của chúng ta.
  • type = "l": Điều này cho R biết tạo một biểu đồ đường ("l" đứng cho line).
  • col = "blue": Điều này đặt màu của đường của chúng ta thành xanh lam.
  • xlabylab: Những này đặt nhãn cho trục x và y của chúng ta.
  • main: Điều này đặt tiêu đề của biểu đồ của chúng ta.

Cải thiện biểu đồ đường

Thêm điểm vào biểu đồ đường

Để làm cho biểu đồ của chúng ta thông tin hơn, hãy thêm điểm vào mỗi điểm dữ liệu:

plot(weather_data$Temperature, type = "b", col = "blue", pch = 16,
xlab = "Ngày trong tuần", ylab = "Nhiệt độ (°C)",
main = "Nhiệt độ hàng tuần")

Tham số type = "b" cho biết R bao gồm cả đường và điểm ("b" đứng cho both). Tham số pch = 16 đặt hình dạng điểm thành một vòng tròn đầy.

Tùy chỉnh trục x

Trục x của chúng ta hiện tại hiển thị số thay vì ngày. Hãy sửa điều này:

plot(weather_data$Temperature, type = "b", col = "blue", pch = 16,
xlab = "Ngày trong tuần", ylab = "Nhiệt độ (°C)",
main = "Nhiệt độ hàng tuần", xaxt = "n")
axis(1, at = 1:7, labels = weather_data$Day)

Tham số xaxt = "n" ẩn trục x mặc định, và hàm axis() cho phép chúng ta tạo một trục x tùy chỉnh với các nhãn ngày.

Biểu đồ đường với nhiều đường

Bây giờ chúng ta đã thành thạo các kỹ thuật cơ bản, hãy nâng cấp! Hãy tưởng tượng chúng ta muốn so sánh nhiệt độ từ hai tuần khác nhau.

# Tạo dữ liệu cho hai tuần
week1_temps <- c(20, 22, 25, 23, 21, 19, 22)
week2_temps <- c(19, 21, 24, 25, 23, 18, 20)

# Kết hợp thành một data frame
weather_data <- data.frame(
Day = days,
Week1 = week1_temps,
Week2 = week2_temps
)

# Tạo biểu đồ
plot(weather_data$Week1, type = "b", col = "blue", pch = 16,
xlab = "Ngày trong tuần", ylab = "Nhiệt độ (°C)",
main = "So sánh nhiệt độ hai tuần", xaxt = "n", ylim = c(15, 30))
lines(weather_data$Week2, type = "b", col = "red", pch = 17)
axis(1, at = 1:7, labels = weather_data$Day)
legend("topright", legend = c("Tuần 1", "Tuần 2"),
col = c("blue", "red"), pch = c(16, 17), lty = 1)

Mã này giới thiệu một số khái niệm mới:

  • Chúng ta sử dụng plot() cho đường đầu tiên và lines() để thêm đường thứ hai.
  • ylim = c(15, 30) đặt phạm vi trục y để chứa cả hai bộ dữ liệu.
  • Hàm legend() thêm một chú thích để phân biệt giữa hai đường.

Kết luận

Chúc mừng! Bạn vừa tạo ra biểu đồ đường đầu tiên của mình trong R. Chúng ta đã bao gồm các kỹ thuật cơ bản của việc tạo biểu đồ đường đơn giản và nhiều đường, tùy chỉnh màu sắc, thêm điểm và thậm chí tạo chú thích.

Nhớ rằng, thực hành làm nên完美. Hãy thử chơi với các bộ dữ liệu khác nhau, màu sắc và phong cách khác nhau. Trước khi bạn biết điều đó, bạn sẽ tạo ra những trực quan hóa dữ liệu stunning mà làm dữ liệu của bạn sống động!

Dưới đây là bảng tóm tắt các hàm chính chúng ta đã sử dụng:

Hàm Mục đích
plot() Tạo biểu đồ ban đầu
lines() Thêm đường vào biểu đồ hiện có
axis() Tùy chỉnh nhãn trục
legend() Thêm chú thích vào biểu đồ

Chúc các bạn vui vẻ trong việc vẽ biểu đồ, và hy vọng rằng các đường của bạn luôn xu hướng tăng!

Credits: Image by storyset