R - Loại dữ liệu: Hướng dẫn chi tiết cho người mới bắt đầu

Xin chào bạn, người học lập trình R! Tôi rất vui mừng được làm hướng dẫn viên của bạn trong hành trình thú vị vào thế giới các loại dữ liệu của R. Là một người đã dạy lập trình trong nhiều năm, tôi có thể đảm bảo với bạn rằng việc hiểu các loại dữ liệu giống như học bảng chữ cái trước khi viết một tiểu thuyết. Nó rất cơ bản, và tôi hứa sẽ làm cho nó thú vị và dễ dàng nhất có thể. Hãy cùng bắt đầu nào!

R - Data Types

Vectors: Đá奠基 của R

Vectors là cấu trúc dữ liệu đơn giản và cơ bản nhất trong R. Hãy tưởng tượng chúng như một hàng hộp, mỗi hộp chứa một mảnh dữ liệu cùng loại.

Tạo Vectors

# Vector số
numbers <- c(1, 2, 3, 4, 5)

# Vector ký tự
fruits <- c("apple", "banana", "cherry")

# Vector logic
is_raining <- c(TRUE, FALSE, TRUE, FALSE)

Trong các ví dụ này, c() là hàm kết hợp tạo vectors. Nó giống như một枝 cành ma thuật rằng nhóm dữ liệu của chúng ta lại với nhau!

Truy cập các phần tử của Vector

# In phần tử thứ hai của vector fruits
print(fruits[2])  # Output: "banana"

# In phần tử đầu tiên và thứ ba
print(fruits[c(1, 3)])  # Output: "apple" "cherry"

Chúng ta sử dụng dấu vuông [] để truy cập các phần tử cụ thể. Nó giống như với tay vào hàng hộp và kéo ra chính xác những gì chúng ta cần.

Lists: Cấu trúc dữ liệu như dao đa năng

Lists là như siêu vectors có thể chứa các loại dữ liệu khác nhau, thậm chí là các lists khác!

Tạo và Truy cập Lists

my_list <- list(
name = "Alice",
age = 30,
likes = c("pizza", "coding", "cats")
)

# Truy cập các phần tử của list
print(my_list$name)  # Output: "Alice"
print(my_list[[2]])  # Output: 30
print(my_list[["likes"]][2])  # Output: "coding"

Lists sử dụng $ hoặc [[]] để truy cập các phần tử. Nó giống như mở một vali có nhiều ngăn!

Matrices: Sắp xếp dữ liệu 2D

Matrices giống như các bảng tính: chúng có hàng và cột, tất cả đều đầy dữ liệu cùng loại.

Tạo và Điều chỉnh Matrices

# Tạo một ma trận 3x3
my_matrix <- matrix(1:9, nrow = 3, ncol = 3)

# In ma trận
print(my_matrix)

# Truy cập phần tử ở hàng thứ 2, cột thứ 3
print(my_matrix[2, 3])  # Output: 8

Matrices sử dụng ký hiệu [hàng, cột] để truy cập. Nó giống như tìm một ghế trong rạp chiếu phim!

Arrays: Cấu trúc dữ liệu đa chiều

Arrays giống như các ma trận chồng lên nhau,非常适合 đại diện cho dữ liệu đa chiều.

Tạo và Làm việc với Arrays

# Tạo một array 2x3x2
my_array <- array(1:12, dim = c(2, 3, 2))

# In array
print(my_array)

# Truy cập phần tử ở hàng thứ 1, cột thứ 2 của ma trận thứ 2
print(my_array[1, 2, 2])  # Output: 10

Arrays mở rộng ký hiệu ma trận của chúng ta đến nhiều chiều. Nó giống như điều hướng một khối 3D!

Factors: Xử lý dữ liệu phân loại

Factors được sử dụng cho dữ liệu phân loại, như nhóm các mục hoặc đại diện cho các mức độ.

Tạo và Sử dụng Factors

# Tạo một factor
sizes <- factor(c("small", "medium", "large", "medium", "small"))

# In factor
print(sizes)

# Lấy các mức độ của factor
print(levels(sizes))

Factors rất tốt cho dữ liệu rơi vào các danh mục rõ ràng. Hãy tưởng tượng chúng như các nhãn trong một hệ thống lưu trữ!

Data Frames: Cỗ máy của phân tích dữ liệu

Data frames giống như các bảng tính trong R, có khả năng giữ các loại dữ liệu khác nhau trong mỗi cột.

Tạo và Điều chỉnh Data Frames

# Tạo một data frame
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A")
)

# In data frame
print(students)

# Truy cập một cột cụ thể
print(students$age)

# Chọn các hàng dựa trên một điều kiện
print(students[students$age > 23, ])

Data frames kết hợp tốt nhất của vectors và lists. Chúng giống như một tủ đựng tài liệu được tổ chức tốt cho dữ liệu của bạn!

Bảng phương thức

Dưới đây là bảng các phương thức phổ biến cho mỗi loại dữ liệu:

Loại dữ liệu Phương thức tạo Phương thức truy cập Chức năng phổ biến
Vector c() [] length(), sum(), mean()
List list() $, [[]] names(), unlist()
Matrix matrix() [hàng, cột] dim(), t(), rowSums()
Array array() [,,] dim(), aperm()
Factor factor() [] levels(), nlevels()
Data Frame data.frame() $, [] nrow(), ncol(), subset()

Nhớ rằng, thực hành là cách tốt nhất để trở nên hoàn hảo! Đừng ngại thử nghiệm với các loại dữ liệu này trong console R của bạn. Nó giống như chơi với các khối LEGO - bạn càng xây dựng nhiều, bạn sẽ càng hiểu rõ hơn về cách chúng kết hợp với nhau.

Như chúng ta kết thúc hướng dẫn này, tôi hy vọng bạn cảm thấy tự tin hơn về các loại dữ liệu của R. Mỗi loại đều có những điểm mạnh riêng, và việc biết khi nào sử dụng loại nào là kỹ năng sẽ phục vụ bạn tốt trong hành trình phân tích dữ liệu của bạn.

Tiếp tục lập code, giữ sự tò mò, và nhớ - trong thế giới của R, dữ liệu là sân chơi của bạn! Chúc bạn lập trình vui vẻ!

Credits: Image by storyset