R - Boxplot: Panduan untuk Pemula dalam Visualisasi Distribusi Data

Halo sana, para ahli data yang sedang belajar! Hari ini, kita akan melangsungkan perjalanan menarik ke dunia boxplot menggunakan R. Jangan khawatir jika Anda belum pernah mengkode sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini satu per satu. Pada akhir panduan ini, Anda akan dapat membuat boxplot yang indah seperti seorang profesional!

R - Boxplots

Apa Itu Boxplot?

Sebelum kita masuk ke kode, mari kita pahami apa itu boxplot. Bayangkan Anda mencoba untuk meng-ringkaskan tinggi semua murid di kelas Anda. Boxplot adalah seperti sebuah kotak kecil yang menunjukkan penyebaran data Anda dalam pandangan sekejap. Ini adalah cara yang bagus untuk melihat median, kuartil, dan outliers dalam data Anda.

Membuat Boxplot Pertama Anda

Menyiapkan Lingkungan R Anda

Pertama-tama, pastikan kita sudah siap dengan R. Jika Anda belum menginstal R, kunjungi situs resmi R dan ikuti instruksi instalasi untuk sistem operasi Anda.

Setelah Anda menginstal R, buka konsol R atau RStudio jika Anda menggunakan itu. Kita siap untuk membuat beberapa boxplot!

Sintaks Boxplot Dasar

Sintaks dasar untuk membuat boxplot di R mengejutkan mudah. Ini adalah seperti ini:

boxplot(data)

Mari kita coba ini dengan beberapa data nyata. Kita akan menggunakan dataset bawaan mtcars, yang berisi informasi tentang berbagai model mobil.

# Membuat boxplot dasar untuk mileage mobil
boxplot(mtcars$mpg)

Ketika Anda menjalankan kode ini, Anda akan melihat boxplot muncul. Mari kitauraikan apa yang Anda lihat:

  • Garis hitam tebal di tengah kotak adalah median.
  • Bagian bawah kotak mewakili kuartil pertama (25% data berada di bawah titik ini).
  • Bagian atas kotak mewakili kuartil ketiga (75% data berada di bawah titik ini).
  • Whiskers (garis yang memanjang dari kotak) menunjukkan rentang data.
  • Setiap titik di luar whiskers dianggap sebagai outliers.

Menambah Warna dan Label

Sekarang, mari kita membuat boxplot kita sedikit lebih informatif dan menarik secara visual:

# Membuat boxplot lebih detil
boxplot(mtcars$mpg,
main="Distribusi Mileage Mobil",
ylab="Miles Per Gallon",
col="lightblue",
border="darkblue")

Dalam contoh ini:

  • main menambahkan judul ke plot kita.
  • ylab memberi label ke sumbu y.
  • col mengisi kotak dengan warna biru muda.
  • border membuat garis pinggir kotak biru gelap.

Membandingkan Beberapa Grup

Salah satu kekuatan boxplot adalah kemampuan untuk membandingkan grup yang berbeda side by side. Mari kita bandingkan mileage mobil dengan jumlah silinder yang berbeda:

# Membandingkan mileage untuk jumlah silinder yang berbeda
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"))

Di sini, kita menggunakan notasi formula mpg ~ cyl, yang memberitahu R untuk membuat boxplot mpg untuk setiap nilai unik dalam cyl. Kita juga menambahkan warna yang berbeda untuk setiap grup.

Boxplot dengan Notch

Sekarang kita telah menguasai dasar-dasar, mari kita tambahkan sedikit keangusan ke boxplot kita dengan notches.

Apa Itu Notch?

Notch adalah lubang kecil di sisi kotak. Itu bukan hanya untuk penampilan - itu sebenarnya membantu kita membandingkan median antar grup. Jika notch dari dua kotak tidak bersentuhan, itu adalah bukti kuat bahwa median mereka berbeda.

Membuat Boxplot Bert notch

Mari kita modifikasi contoh sebelumnya untuk mencakup notches:

# Membuat boxplot bert notch
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)

Parameter baru di sini adalah notch=TRUE. Penambahan ini memberikan notches informasi.

Menginterpretasi Boxplot Bert notch

Perhatikan notches dengan seksama. Jika notch dari dua kotak tidak bersentuhan, kita dapat yakin bahwa median sebenarnya berbeda. Ini adalah cara visual cepat untuk melihat perbedaan signifikan antar grup!

Menyesuaikan Boxplot Anda

Sekarang Anda telah menguasai dasar-dasar, mari kita lihat beberapa cara untuk membuat boxplot Anda lebih informatif dan menarik secara visual.

Menambahkan Titik Data Individu

kadang-kadang, itu membantu untuk melihat titik data aktual di sepanjang boxplot. Kita dapat melakukan ini dengan fungsi jitter:

# Boxplot dengan titik individu
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)

# Menambahkan titik berjitter
stripchart(mpg ~ cyl, data=mtcars,
method="jitter",
vertical=TRUE,
add=TRUE,
pch=20,
col="darkgray")

Kode ini terlebih dahulu membuat boxplot, kemudian menimpa titik data. Parameter pch=20 membuat titik menjadi lingkaran kecil, dan col="darkgray" memberikan warna abu-abu gelap.

Mengubah Penampilan Outlier

Secara default, outliers dalam boxplot ditampilkan sebagai titik sederhana. Kita dapat mengubah penampilannya:

# Penampilan outlier yang disesuaikan
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE,
outpch=8,  # Titik outlier berbentuk bintang
outcol="red")  # Outlier merah

Di sini, outpch=8 mengubah titik outlier menjadi bintang, dan outcol="red" memberikan warna merah.

Kesimpulan

Selamat! Anda baru saja belajar membuat dan menyesuaikan boxplot di R. Dari plot dasar hingga perbandingan bert notch dan menambahkan titik data individu, Anda sekarang memiliki alat kuat dalam kitab visualisasi data Anda.

Ingat, kunci untuk menguasai boxplot (dan R secara umum) adalah latihan. Cobalah membuat boxplot dengan berbagai dataset, eksperimen dengan warna dan gaya, dan terutama, nikmati prosesnya!

Berikut adalah tabel referensi cepat dari parameter boxplot yang kita diskusikan:

Parameter Deskripsi Contoh
main Judul utama plot main="My Boxplot"
xlab Label sumbu x xlab="Groups"
ylab Label sumbu y ylab="Values"
col Warna isian kotak col="lightblue"
border Warna pinggir kotak border="darkblue"
notch Tambah notch ke kotak notch=TRUE
outpch Bentuk titik outlier outpch=8
outcol Warna titik outlier outcol="red"

Selamat menggambar, dan semoga data Anda selalu terbungkus indah!

Credits: Image by storyset