Hướng dẫn cơ bản về chuỗi trong R
Xin chào các bạnfuture nhà lập trình R! Hôm nay, chúng ta sẽ bắt đầu một hành trình thú vị vào thế giới của chuỗi trong R. Đừng lo lắng nếu bạn chưa từng viết một dòng mã trước đây - tôi sẽ là người hướng dẫn thân thiện của bạn, và chúng ta sẽ cùng nhau bước từng bước. Cuối cùng của bài hướng dẫn này, bạn sẽ có khả năng manipulates chuỗi như một chuyên gia!
什么是字符串?
Trước khi chúng ta bắt đầu, hãy bắt đầu từ những điều cơ bản. Trong lập trình, một chuỗi đơn giản là một序列 các ký tự. Nó có thể là một từ, một câu hoặc thậm chí cả một đoạn văn. Trong R, chúng ta tạo chuỗi bằng cách bao quanh văn bản trong dấu ngoặc đơn ('') hoặc dấu ngoặc kép ("").
Hãy tạo chuỗi đầu tiên của chúng ta:
my_first_string <- "Hello, World!"
print(my_first_string)
Khi bạn chạy đoạn mã này, bạn sẽ thấy:
[1] "Hello, World!"
Chúc mừng! Bạn vừa tạo và in chuỗi đầu tiên của mình trong R. Ký hiệu <-
là cách chúng ta gán giá trị cho các biến trong R. Hãy nghĩ của nó như việc đặt chuỗi "Hello, World!" vào một hộp có nhãn my_first_string
.
Quy tắc khi tạo chuỗi
Bây giờ chúng ta đã thử nghiệm một chút, hãy khám phá một số quy tắc khi tạo chuỗi trong R.
1. Dấu ngoặc đơn và dấu ngoặc kép
Trong R, bạn có thể sử dụng cả dấu ngoặc đơn hoặc dấu ngoặc kép để tạo chuỗi:
string1 <- 'I am a string'
string2 <- "I am also a string"
print(string1)
print(string2)
Cả hai đều hoạt động tốt. Tuy nhiên, có một mẹo hay: nếu bạn muốn bao gồm dấu ngoặc trong chuỗi, bạn có thể sử dụng loại dấu ngoặc khác để bao quanh nó:
quote_string <- "She said, 'R is awesome!'"
print(quote_string)
2. Ký tự escape
Đôi khi, bạn có thể muốn bao gồm các ký tự đặc biệt trong chuỗi. Để làm điều này, chúng ta sử dụng các ký tự escape, bắt đầu bằng một dấu gạch ngang ngược ().
Dưới đây là một số ký tự escape phổ biến:
Ký tự escape | Ý nghĩa |
---|---|
\n | Dòng mới |
\t | Tab |
\" | Dấu ngoặc kép |
\' | Dấu ngoặc đơn |
\\ | Dấu gạch ngang ngược |
Hãy xem chúng trong hành động:
escaped_string <- "This is a line.\nThis is a new line.\tThis is tabbed."
cat(escaped_string)
Kết quả:
This is a line.
This is a new line. This is tabbed.
Chức năng cat()
rất tốt để in các chuỗi có ký tự escape, vì nó giải thích chúng một cách chính xác.
3. Chuỗi thô
Nếu bạn làm việc với nhiều dấu gạch ngang ngược (như các đường dẫn tệp trong Windows), bạn có thể sử dụng chuỗi thô. Đây là những chuỗi được tiền缀 bằng r
và treats các dấu gạch ngang ngược như các ký tựLiter:
normal_string <- "C:\\Users\\YourName\\Documents"
raw_string <- r"(C:\Users\YourName\Documents)"
print(normal_string)
print(raw_string)
Bạn sẽ thấy rằng chuỗi bình thường giải thích các dấu gạch ngang ngược như các ký tự escape, trong khi chuỗi thô giữ chúng nguyên.
Manipulation chuỗi
Bây giờ chúng ta đã biết cách tạo chuỗi, hãy học cách chơi với chúng!
1. Concatenation
Concatenation chỉ là một từ khác cho việc nối các chuỗi lại với nhau. Trong R, chúng ta sử dụng hàm paste()
hoặc paste0()
cho điều này:
first_name <- "John"
last_name <- "Doe"
full_name <- paste(first_name, last_name)
print(full_name)
# `paste0()` tương tự nhưng không thêm khoảng trắng giữa các phần tử
full_name_no_space <- paste0(first_name, last_name)
print(full_name_no_space)
Kết quả:
[1] "John Doe"
[1] "JohnDoe"
2. Trích xuất substrings
Thường xuyên, bạn sẽ muốn trích xuất một phần của chuỗi. Chúng ta có thể làm điều này bằng cách sử dụng dấu ngoặc vuông []
:
my_string <- "R is fantastic!"
print(my_string[1:5]) # Lấy 5 ký tự đầu tiên
Kết quả:
[1] "R is "
3. Độ dài chuỗi
Để biết độ dài của một chuỗi, sử dụng hàm nchar()
:
my_string <- "How long am I?"
print(nchar(my_string))
Kết quả:
[1] 15
4. Thay đổi chữ cái
R cung cấp các hàm để thay đổi chữ cái của chuỗi:
mixed_case <- "ThIs Is MiXeD cAsE"
print(toupper(mixed_case)) # Tất cả chữ cái viết hoa
print(tolower(mixed_case)) # Tất cả chữ cái viết thường
Kết quả:
[1] "THIS IS MIXED CASE"
[1] "this is mixed case"
5. Tìm kiếm và thay thế
Hàm gsub()
rất tốt để tìm kiếm và thay thế các phần của chuỗi:
sentence <- "The quick brown fox jumps over the lazy dog"
new_sentence <- gsub("fox", "cat", sentence)
print(new_sentence)
Kết quả:
[1] "The quick brown cat jumps over the lazy dog"
Kết luận
Wow, chúng ta đã bao quát rất nhiều nội dung hôm nay! Từ việc tạo chuỗi đầu tiên đến manipulates chúng như một chuyên gia, bạn đã bước những bước đầu tiên vào thế giới kỳ diệu của lập trình R. Nhớ rằng, thực hành làm nên hoàn hảo, vì vậy đừng ngần ngại thử nghiệm với các khái niệm này.
Dưới đây là một thử thách nhỏ cho bạn: Hãy thử tạo một chuỗi với tên của bạn, trích xuất các chữ cái đầu tiên của bạn và sau đó in chúng bằng chữ cái viết hoa. Nếu bạn có thể làm được điều đó, bạn đã trên đường trở thành một.master chuỗi R!
Tiếp tục mã hóa, tiếp tục học hỏi, và quan trọng nhất, hãy vui vẻ! Hành trình của ngàn dặm bắt đầu từ một bước, và bạn vừa bước bước đầu tiên trong lập trình R. Đến gặp lại lần sau, chúc bạn mã hóa vui vẻ!
Credits: Image by storyset