R - Scatterplots
Pengenalan
Hai sana! Selamat datang ke perjalanan kita ke dunia visualisasi data dengan R. Hari ini, kita akan mendalami pembuatan scatterplots menggunakan R, bahasa pemrograman yang kuat dan secara luas digunakan dalam bidang statistik dan analisis data. Jika Anda baru dalam pemrograman atau baru mulai belajar R, jangan khawatir—kita akan perlahan dan memastikan Anda mengerti setiap langkah.
Scatterplots adalah cara bagus untuk visualisasi hubungan antara dua variabel. Mereka memungkinkan kita melihat jika ada pola atau korelasi antara mereka. Misalnya, jika Anda memiliki dataset tinggi dan berat orang, scatterplot dapat membantu Anda identifikasi jika orang yang lebih tinggi cenderung berat lebih atau sebaliknya.
Ayo mulai!
Membuat Scatterplot
Langkah 1: Menginstal dan Memuat R
Sebelum kita dapat membuat plot apa pun di R, kita perlu menginstal dan muat paket yang diperlukan. Paket ggplot2
adalah salah satu yang paling populer untuk membuat plot yang indah dan dapat dikustomisasi. Untuk menginstalnya, Anda dapat menggunakan perintah berikut di konsol R Anda:
install.packages("ggplot2")
Setelah Anda menginstal paket, Anda perlu memuatnya ke dalam lingkungan R Anda. Anda hanya perlu melakukan ini sekali per sesi:
library(ggplot2)
Langkah 2: Membuat Scatterplot
Sekarang kita telah mengatur segala sesuatu, mari membuat scatterplot pertama kita. Kita akan menggunakan dataset bawaan yang disebut mtcars
, yang berisi informasi tentang berbagai model mobil. Kita akan menggambar miles per gallon (mpg) melawan daya kuda (hp).
Pertama, mari lihat dataset ini:
head(mtcars)
Ini akan menampilkan beberapa baris pertama dataset, memberikan Anda gambaran tentang apa yang tampaknya seperti itu.
Sekarang, mari membuat scatterplot:
ggplot(data = mtcars, aes(x = hp, y = mpg)) + geom_point()
Berikut adalah apa yang dilakukan setiap bagian:
-
ggplot(data = mtcars, aes(x = hp, y = mpg))
: Ini menginisialisasi plot dengan datasetmtcars
dan menetapkan sumbu x menjadi daya kuda dan sumbu y menjadi miles per gallon. -
geom_point()
: Ini menambahkan titik ke plot berdasarkan nilai x dan y dari dataset.
Ketika Anda menjalankan kode ini, Anda seharusnya melihat scatterplot di mana setiap titik mewakili model mobil, dengan posisi yang didetermine oleh daya kuda dan miles per gallon.
Langkah 3: Menyempurnakan Scatterplot
Sekarang kita memiliki scatterplot dasar, mari menambahkan sedikit keanehan kepadanya. Kita dapat mengubah warna titik, menambahkan judul, dan bahkan menyesuaikan ukuran titik.
ggplot(data = mtcars, aes(x = hp, y = mpg)) +
geom_point(color = "blue", size = 3) +
labs(title = "Daya Kuda vs. Miles Per Gallon", x = "Daya Kuda", y = "Miles Per Gallon")
Dalam versi ini, kita menambahkan hal berikut:
-
color = "blue"
: Ini mengubah warna titik menjadi biru. -
size = 3
: Ini membuat titik sedikit lebih besar. -
labs(title = ..., x = ..., y = ...)
: Ini menambahkan judul ke plot dan label untuk sumbu x dan y.
Bebas untuk mencoba warna dan ukuran yang berbeda untuk melihat bagaimana mereka mempengaruhi penampilan plot Anda.
Matriks Scatterplot
Sekarang Anda tahu bagaimana membuat scatterplot tunggal, mari maju ke sesuatu yang lebih canggih: matriks scatterplot. Ini adalah grid scatterplot yang memungkinkan Anda membandingkan banyak variabel secara bersamaan. Itu seperti memiliki keseluruhan galeri scatterplot individual di satu tempat!
Untuk membuat matriks scatterplot, kita akan menggunakan paket lain yang disebut GGally
. Pertama, Anda perlu menginstalnya:
install.packages("GGally")
Lalu muatnya:
library(GGally)
Sekarang, mari membuat matriks scatterplot menggunakan dataset mtcars
yang sama:
ggpairs(mtcars)
Menjalankan kode ini akan generate matriks scatterplot, di mana setiap plot menunjukkan hubungan antara dua variabel. Diagonal berisi histogram dari setiap variabel, dan sudut atas dan bawah berisi scatterplot yang membandingkan pasangan variabel.
Anda dapat mengcustomisasi matriks scatterplot lebih lanjut dengan menambahkan skala warna, faceting berdasarkan kategori, dan banyak lagi. Lihat dokumentasi ggpairs()
untuk belajar lebih lanjut tentang semua opsi yang tersedia bagi Anda.
Kesimpulan
Selamat! Anda sekarang telah belajar bagaimana membuat scatterplot di R menggunakan paket ggplot2
dan bagaimana membuat matriks scatterplot dengan paket GGally
. Keterampilan ini sangat penting bagi siapa saja yang mencari untuk mengeksplorasi hubungan antara variabel dalam data mereka. Ingat, latihan membuat sempurna, jadi terus mencoba dataset dan kustomisasi yang berbeda untuk meningkatkan keterampilan visualisasi Anda. Selamat pemrograman!
Credits: Image by storyset