以下是您提供的文本翻译成繁體中文的版本:
# R - 資料框架:初學者指南
你好啊,未來的 R 程式設計師!今天,我們將踏上一段令人興奮的旅程,進入 R 語言中的資料框架世界。別擔心如果你從未寫過程式碼——我將成為你的友好導遊,我們會一步步來。到了這個教學的結尾,你將會像專家一樣操作資料框架!
## 資料框架是什麼?
在我們深入之前,讓我們先了解資料框架是什麼。想像你有一個有行和列的電子表格——這基本上就是 R 語言中的資料框架。它是一個兩維表,其中每一列可以包含不同類型的數據(如數字、文字或日期),每一行代表一個個別記錄。
現在,讓我們捋起袖子,親自動手寫一些實際的 R 語言代碼吧!
## 創建資料框架
創建一個資料框架就像設置你自己的個人數據庫一樣。讓我們從一個簡單的例子開始:
```R
# 創建一個資料框架
students <- data.frame(
name = c("Alice", "Bob", "Charlie"),
age = c(22, 25, 23),
grade = c("A", "B", "A-")
)
# 我們來看看我們的資料框架長什麼樣
print(students)
當你運行這段代碼時,你會看到:
name age grade
1 Alice 22 A
2 Bob 25 B
3 Charlie 23 A-
我們在這裡做了什麼?我們創建了一個名為 students
的資料框架,有三個列:name(名稱)、age(年齡)和 grade(成績)。每一列是一個向量,而且所有向量必須具有相同的長度(在這個例子中,為 3)。
查看資料框架的結構
現在,我們有了資料框架,讓我們來檢查它的結構。這就像偷窺汽車底盤一樣:
# 查看資料框架的結構
str(students)
這將輸出:
'data.frame': 3 obs. of 3 variables:
$ name : chr "Alice" "Bob" "Charlie"
$ age : num 22 25 23
$ grade: chr "A" "B" "A-"
這告訴我們 students
是一個具有 3 個觀察值(行)和 3 個變量(列)的資料框架。它還顯示了每個列的數據類型:chr
為字符(文字)和 num
為數字。
資料框架數據摘要
想要快速預覽你的數據?summary()
函數是你的好朋友:
# 檢視資料框架的摘要
summary(students)
你會看到類似以下內容:
name age grade
Length:3 Min. :22.00 Length:3
Class :character 1st Qu.:22.50 Class :character
Mode :character Median :23.00 Mode :character
Mean :23.33
3rd Qu.:24.00
Max. :25.00
這給我們提供了數據的統計摘要。對於像 'age' 這樣的數字列,它提供了最小值、最大值、平均值和四分位數。對於字符列,它告訴我們長度和類型。
從資料框架中提取數據
現在,讓我們學習如何從我們的資料框架中提取特定的數據。這就像成為一名數據偵探!
# 獲取特定的列
print(students$name)
# 獲取特定的行
print(students[2,])
# 獲取特定的單元格
print(students[1, "grade"])
# 獲取多個列
print(students[, c("name", "age")])
這些命令將輸出:
[1] "Alice" "Bob" "Charlie"
name age grade
2 Bob 25 B
[1] "A"
name age
1 Alice 22
2 Bob 25
3 Charlie 23
$
運算符讓你可以通過名稱訪問列。方括號 []
允許你指定行和列:[行, 列]
。如果你留下行或列空白,它將選擇所有行或列。
擴展資料框架
隨著你的數據增長,你可能需要向你的資料框架中添加更多信息。讓我們看看怎麼做:
# 添加一個新列
students$height <- c(165, 180, 175)
# 添加一個新行
new_student <- data.frame(name = "David", age = 24, grade = "B+", height = 178)
students <- rbind(students, new_student)
# 我們來看看我們更新後的資料框架
print(students)
這會給我們:
name age grade height
1 Alice 22 A 165
2 Bob 25 B 180
3 Charlie 23 A- 175
4 David 24 B+ 178
我們使用 $
運算符添加了一個新列 'height',並使用 rbind()
函數(代表 "row bind")添加了一個新行。
有用的資料框架方法
這裡有一個表格,列出了一些處理資料框架的方便方法:
方法 | 描述 |
---|---|
head(df) |
顯示資料框架的前 6 行 |
tail(df) |
顯示資料框架的最後 6 行 |
nrow(df) |
獲取行數 |
ncol(df) |
獲取列數 |
names(df) |
獲取列名 |
colnames(df) |
另一種獲取或設定列名的方式 |
rownames(df) |
獲取或設定行名 |
dim(df) |
獲取維度(行和列) |
在 students
資料框架上嘗試這些方法!
這就是你們的,各位!你剛剛踏出了進入 R 語言中資料框架世界的第一步。記住,熟練是由練習而來的,所以不要害怕嘗試這些命令。創建你自己的資料框架,嘗試不同的操作,看看會發生什麼。
在你還未意識到的時候,你可能已經像有經驗的數據科學家一樣操作數據了。誰知道呢?也許有一天你會用這些技巧來分析來自火星殖民地或水下城市的數據。可能性無窮!
持續編程,保持好奇心,最重要的是,玩得開心!下次見之前,祝你們 R 程式設計愉快!
Credits: Image by storyset