Pandangan Awal Mengenai Boxplot: Panduan untuk Pemula dalam Visualisasi Distribusi Data

Hai teman-teman yang bersemangat dalam dunia data! Hari ini, kita akan memulai perjalanan menarik ke dalam dunia boxplot menggunakan R. Jangan khawatir jika Anda belum pernah mengkode sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini secara bertahap. Pada akhir panduan ini, Anda akan mampu membuat boxplot yang indah seperti seorang ahli!

R - Boxplots

Apa Itu Boxplot?

Sebelum kita masuk ke dalam kode, mari kitaahui apa itu boxplot. Bayangkan Anda mencoba untuk menyummaris tinggi semua siswa di kelas Anda. Boxplot adalah seperti sebuah kotak kecil yang menunjukkan penyebaran data Anda dalam pandangan sekejap. Ini adalah cara bagus untuk melihat median, kuartil, dan outliers di data Anda.

Membuat Boxplot Pertama Anda

Menyiapkan Lingkungan R Anda

Pertama-tama, pastikan kita siapkan R untuk digunakan. Jika Anda belum menginstal R, kunjungi situs web resmi R dan ikuti petunjuk instalasi untuk sistem operasi Anda.

Setelah Anda menginstal R, buka konsol R atau RStudio jika Anda menggunakan itu. Kita siap untuk membuat beberapa boxplot!

Sintaksis Dasar Boxplot

Sintaksis dasar untuk membuat boxplot di R mengejutkan mudah. Ini adalah apa yang tampak seperti:

boxplot(data)

Mari kita coba ini dengan beberapa data nyata. Kita akan menggunakan dataset bawaan mtcars, yang berisi informasi tentang berbagai model mobil.

# Membuat boxplot dasar untuk mileage mobil
boxplot(mtcars$mpg)

Ketika Anda menjalankan kode ini, Anda akan melihat boxplot muncul. Mari kitauraikan apa yang Anda lihat:

  • Garis hitam tebal di tengah kotak adalah median.
  • Bagian bawah kotak mewakili kuartil pertama (25% data jatuh dibawah titik ini).
  • Bagian atas kotak mewakili kuartil ketiga (75% data jatuh dibawah titik ini).
  • Whiskers (garis yang diperpanjang dari kotak) menunjukkan rentang data.
  • Setiap titik di luar whiskers dianggap sebagai outliers.

Menambah Warna dan Label

Sekarang, mari kita membuat boxplot kita sedikit lebih informatif dan menarik secara visual:

# Membuat boxplot lebih detil
boxplot(mtcars$mpg,
main="Distribusi Mileage Mobil",
ylab="Miles Per Gallon",
col="lightblue",
border="darkblue")

Dalam contoh ini:

  • main menambahkan judul ke dalam plot.
  • ylab memberi label ke sumbu y.
  • col mengisi kotak dengan warna biru muda.
  • border membuat garis tepi kotak biru gelap.

Membandingkan Beberapa Grup

Salah satu kekuatan boxplot adalah kemampuannya untuk membandingkan kelompok yang berbeda berdampingan. Mari kita bandingkan mileage mobil dengan jumlah silinder yang berbeda:

# Membandingkan mileage untuk jumlah silinder yang berbeda
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"))

Di sini, kita menggunakan notasi formula mpg ~ cyl, yang memberitahu R untuk membuat boxplot mpg untuk setiap nilai unik di cyl. Kita juga menambahkan warna yang berbeda untuk setiap kelompok.

Boxplot dengan Notch

Sekarang kita telah menguasai dasar-dasar, mari kita tambahkan sedikit kesopanan ke boxplot kita dengan notches.

Apa Itu Notch?

Notch adalah lubang kecil di sisi kotak. Itu tidak hanya untuk penampilan - itu benar-benar membantu kita membandingkan median antar kelompok. Jika notches dua kotak tidak berselisih, ini adalah bukti kuat bahwa median mereka berbeda.

Membuat Boxplot dengan Notch

Mari kita modifikasi contoh sebelumnya untuk menambah notches:

# Membuat boxplot dengan notch
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)

Parameter baru di sini adalah notch=TRUE. Penambahan sederhana ini memberikan kita notches yang informatif.

Menginterpretasi Boxplot dengan Notch

Perhatikan notches dengan seksama. Jika notches dua kotak tidak berselisih, kita dapat yakin bahwa median (nilai tengah) kelompok ini berbeda. Ini adalah cara visual cepat untuk melihat perbedaan signifikan antar kelompok!

Menyesuaikan Boxplot Anda

Sekarang Anda telah menguasai dasar-dasar, mari kita lihat beberapa cara untuk membuat boxplot Anda lebih informatif dan menarik secara visual.

Menambahkan Titik Data Individu

kadang-kadang itu membantu untuk melihat titik data aktual di samping boxplot. Kita dapat melakukan ini dengan fungsi jitter:

# Boxplot dengan titik data individu
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)

# Menambahkan titik data yang dijitter
stripchart(mpg ~ cyl, data=mtcars,
method="jitter",
vertical=TRUE,
add=TRUE,
pch=20,
col="darkgray")

Kode ini pertama membuat boxplot, kemudian menimpa titik data. Parameter pch=20 membuat titik berupa lingkaran kecil, dan col="darkgray" memberikan warna abu-abu gelap.

Mengubah Penampilan Outliers

Secara default, outliers di boxplot ditampilkan sebagai titik sederhana. Kita dapat mengubah penampilannya:

# Penampilan outliers yang disesuaikan
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE,
outpch=8,  # Titik outliers berbentuk bintang
outcol="red")  # Outliers merah

Di sini, outpch=8 mengubah titik outliers menjadi bintang, dan outcol="red" memberikan warna merah.

Kesimpulan

Selamat! Anda baru saja belajar membuat dan menyesuaikan boxplot di R. Dari plot dasar hingga perbandingan notched dan bahkan menambahkan titik data individu, Anda sekarang memiliki alat kuat dalam kotak visualisasi data Anda.

Ingat, kunci untuk menguasai boxplot (dan R secara umum) adalah latihan. Cobalah membuat boxplot dengan dataset yang berbeda, eksperimen dengan warna dan gaya, dan terutama, bersenang-senang dengan itu!

Berikut adalah tabel referensi cepat dari parameter boxplot yang kita bahas:

Parameter Deskripsi Contoh
main Judul utama plot main="My Boxplot"
xlab Label untuk sumbu x xlab="Groups"
ylab Label untuk sumbu y ylab="Values"
col Warna isi kotak col="lightblue"
border Warna tepi kotak border="darkblue"
notch Tambahkan notches ke kotak notch=TRUE
outpch Bentuk titik outliers outpch=8
outcol Warna titik outliers outcol="red"

Selamat mencoba, dan semoga data Anda selalu tampak indah di dalam kotak!

Credits: Image by storyset