R - Scatterplots

Pengenalan

Hai sana! Selamat datang ke perjalanan kami ke dunia visualisasi data dengan R. Hari ini, kita akan mendalami pembuatan scatterplots menggunakan R, bahasa pemrograman yang kuat dan secara luas digunakan dalam bidang statistik dan analisis data. Jika Anda baru dalam pemrograman atau baru mulai belajar R, jangan khawatir - kita akan perlahan dan memastikan Anda mengerti setiap langkah.

R - Scatterplots

Scatterplots adalah cara bagus untuk visualisasi hubungan antara dua variabel. Mereka memungkinkan kita melihat apakah ada pola atau korelasi antara mereka. Misalnya, jika Anda memiliki dataset tinggi dan berat orang, scatterplot dapat membantu Anda mengidentifikasi apakah orang yang tinggi cenderung berat lebih atau sebaliknya.

Ayo mulai!

Membuat Scatterplot

Langkah 1: Menginstal dan Memuat R

Sebelum kita dapat membuat plot apa pun di R, kita perlu menginstal dan memuat paket yang diperlukan. Paket ggplot2 adalah salah satu yang paling populer untuk membuat plot yang indah dan dapat dikustomisasi. Untuk menginstalnya, Anda dapat menggunakan perintah berikut di konsol R Anda:

install.packages("ggplot2")

Setelah Anda menginstal paket, Anda perlu memuatnya ke dalam lingkungan R Anda. Anda hanya perlu melakukan ini sekali per sesi:

library(ggplot2)

Langkah 2: Membuat Scatterplot

Sekarang kita sudah siap, mari buat scatterplot pertama kita. Kita akan menggunakan dataset bawaan yang disebut mtcars, yang berisi informasi tentang berbagai model mobil. Kita akan menggambar miles per gallon (mpg) melawan daya kuda (hp).

Pertama, mari lihat dataset ini:

head(mtcars)

Ini akan menampilkan beberapa baris pertama dataset, memberikan Anda ide tentang penampilannya.

Sekarang, mari buat scatterplot:

ggplot(data = mtcars, aes(x = hp, y = mpg)) + geom_point()

Ini adalah apa yang dilakukan setiap bagian:

  • ggplot(data = mtcars, aes(x = hp, y = mpg)): Ini menginisialisasi plot dengan dataset mtcars dan mengatur sumbu x menjadi daya kuda dan sumbu y menjadi miles per gallon.
  • geom_point(): Ini menambahkan titik ke plot berdasarkan nilai x dan y dari dataset.

Ketika Anda menjalankan kode ini, Anda seharusnya melihat scatterplot di mana setiap titik mewakili model mobil, dengan posisinya ditentukan oleh daya kuda dan miles per gallon.

Langkah 3: Menyempurnakan Scatterplot

Sekarang kita memiliki scatterplot dasar, mari tambahkan sedikit keindahan kepadanya. Kita dapat mengubah warna titik, menambahkan judul, dan bahkan mengatur ukuran titik.

ggplot(data = mtcars, aes(x = hp, y = mpg)) +
geom_point(color = "blue", size = 3) +
labs(title = "Daya Kuda vs. Miles Per Gallon", x = "Daya Kuda", y = "Miles Per Gallon")

Dalam versi ini, kita menambahkan hal berikut:

  • color = "blue": Ini mengubah warna titik menjadi biru.
  • size = 3: Ini membuat titik sedikit lebih besar.
  • labs(title = ..., x = ..., y = ...): Ini menambahkan judul ke plot dan label untuk sumbu x dan y.

Bebas untuk mencoba warna dan ukuran yang berbeda untuk melihat bagaimana mereka mempengaruhi penampilan plot Anda.

Matriks Scatterplot

Sekarang Anda tahu bagaimana membuat scatterplot tunggal, mari maju ke sesuatu yang lebih tingkat lanjut: matriks scatterplot. Ini adalah grid scatterplot yang memungkinkan Anda membandingkan banyak variabel secara bersamaan. Itu seperti memiliki keseluruhan galeri scatterplot individual di satu tempat!

Untuk membuat matriks scatterplot, kita akan menggunakan paket lain yang disebut GGally. Pertama, Anda perlu menginstalnya:

install.packages("GGally")

Lalu muatnya:

library(GGally)

Sekarang, mari buat matriks scatterplot menggunakan dataset mtcars yang sama:

ggpairs(mtcars)

Menjalankan kode ini akan generate matriks scatterplot, di mana setiap plot menunjukkan hubungan antara dua variabel. Diagonal mengandung histogram dari setiap variabel, dan sudut atas dan bawah mengandung scatterplot yang membandingkan pasangan variabel.

Anda dapat mengcustomisasi matriks scatterplot lebih jauh dengan menambahkan skala warna, faceting berdasarkan kategori, dan lainnya. Periksa dokumentasi ggpairs() untuk belajar lebih banyak tentang semua opsi yang tersedia untuk Anda.

Kesimpulan

Selamat! Anda sekarang sudah belajar bagaimana membuat scatterplot di R menggunakan paket ggplot2 dan bagaimana membuat matriks scatterplot dengan paket GGally. Keterampilan ini sangat penting bagi siapa pun yang mencari untuk menjelajahi hubungan antara variabel dalam data mereka. Ingat, latihan membuat sempurna, jadi terus mencoba dataset dan kustomisasi yang berbeda untuk meningkatkan keterampilan visualisasi Anda. Selamat coding!

Credits: Image by storyset