R - 散點圖

引言

你好!歡迎來到我們的數據視覺化之旅,我們將使用R語言。今天,我們將深入探討如何使用R來創建散點圖,這是一種在統計和數據分析領域中廣泛使用的強大編程語言。如果你是編程新手或者剛開始接觸R,別擔心——我們會慢慢來,確保你理解每一步。

R - Scatterplots

散點圖是視覺化兩個變量之間關係的絕佳方式。它們讓我們能夠看到是否存在某種模式或相關性。例如,如果你有一個包含人們身高和體重的數據集,散點圖可以幫助你確定是否較高的人傾向於體重較重,或者相反。

讓我們開始吧!

創建散點圖

步驟 1:安裝和加載 R

在我們能夠在R中創建任何圖表之前,我們需要安裝和加載必要的包。ggplot2包是創建美觀且可定制圖表的最多人使用包之一。要安裝它,你可以在R控制台中使用以下命令:

install.packages("ggplot2")

一旦安裝了包,你需要將其加載到你的R環境中。你只需要在每次會話中做一次這個操作:

library(ggplot2)

步驟 2:創建散點圖

現在我們已經一切就緒,讓我們創建我們的第一個散點圖。我們將使用一個內置數據集叫做mtcars,它包含了各種汽車模型的資訊。我們將繪製每加侖里程(mpg)對馬力(hp)的關係。

首先,我們來看一下這個數據集:

head(mtcars)

這將顯示數據集的前幾行,給你一個數據集樣貌的概念。

現在,讓我們創建散點圖:

ggplot(data = mtcars, aes(x = hp, y = mpg)) + geom_point()

這裡的每一部分都做了什麼:

  • ggplot(data = mtcars, aes(x = hp, y = mpg)):這個初始化了圖表,並使用mtcars數據集,將x軸設為馬力,y軸設為每加侖里程。
  • geom_point():這個根據數據集中的x和y值在圖表中添加點。

當你運行這段代碼時,你應該會看到一個散點圖,其中每個點代表一個汽車模型,其位置由其馬力和每加侖里程決定。

步驟 3:定制散點圖

現在我們已經有一個基本的散點圖,讓我們給它增加一些魅力。我們可以改變點的顏色,添加標題,甚至調整點的大小。

ggplot(data = mtcars, aes(x = hp, y = mpg)) +
geom_point(color = "blue", size = 3) +
labs(title = "馬力 vs. 每加侖里程", x = "馬力", y = "每加侖里程")

在這個更新版本中,我們添加了以下內容:

  • color = "blue":這將點的顏色改為藍色。
  • size = 3:這使點變得稍大。
  • labs(title = ..., x = ..., y = ...):這給圖表添加了一個標題以及x和y軸的標籤。

隨意嘗試不同的顏色和大小,看看它們如何影響你的圖表外觀。

散點圖矩陣

現在你知道了如何創建一個單一的散點圖,讓我們來進一步學習一些更複雜的東西:散點圖矩陣。這些是散點圖的網格,讓你可以同時比較多個變量。這就像在一個地方有一個個散點圖的整個展覽!

要創建散點圖矩陣,我們將使用另一個叫做GGally的包。首先,你需要安裝它:

install.packages("GGally")

然後加載它:

library(GGally)

現在,讓我們使用同一個mtcars數據集來創建一個散點圖矩陣:

ggpairs(mtcars)

運行這段代碼將生成一個散點圖矩陣,其中每個圖表顯示兩個變量之間的關係。對角線包含每個變量的直方圖,而上三角和下三角包含比較各對變量的散點圖。

你可以進一步定制散點圖矩陣,例如添加顏色刻度、按類別分面等。查看ggpairs()的文檔以了解更多關於可用選項的信息。

結論

恭喜你!你現在已經學會了如何使用ggplot2包在R中創建散點圖,以及如何使用GGally包創建散點圖矩陣。這些技能對於任何想要探索數據中變量關係的人來說都是必不可少的。記住,熟能生巧,所以請持續嘗試不同的數據集和定制,以提高你的視覺化技能。快樂編程!

Credits: Image by storyset